新闻资讯
大数据工程师的修炼指南!大数据工程师技能图谱出来了
下面是StuQ 发布的大数据工程师技能图谱(https://github.com/TeamStuQ/skill-map/blob/master/data/map-BigDataEngineer.md),仅供参考
大数据通用处理平台
-
Spark
-
Flink
-
Hadoop
分布式存储
-
HDFS
资源调度
-
Yarn
-
Mesos
机器学习工具
-
Mahout
-
Spark Mlib
-
TensorFlow (Google 系)
-
Amazon Machine Learning
-
DMTK (微软分布式机器学习工具)
数据分析/数据仓库(SQL类)
-
Pig
-
Hive
-
kylin
-
Spark SQL,
-
Spark DataFrame
-
Impala
-
Phoenix
-
ELK
-
ElasticSearch
-
Logstash
-
Kibana
消息队列
-
Kafka(纯日志类,大吞吐量)
-
RocketMQ
-
ZeroMQ
-
ActiveMQ
-
RabbitMQ
流式计算
-
Storm/JStorm
-
Spark Streaming
-
Flink
日志收集
-
Scribe
-
Flume
编程语言
-
Java
-
Python
-
R
-
Ruby
-
Scala
数据分析挖掘
-
MATLAB
-
SPSS
-
SAS
数据可视化
-
R
-
D3.js
-
ECharts
-
Excle
-
Python
机器学习
机器学习基础
-
聚类
-
时间序列
-
推荐系统
-
回归分析
-
文本挖掘
-
决策树
-
支持向量机
-
贝叶斯分类
-
神经网络
机器学习工具
-
Mahout
-
Spark Mlib
-
TensorFlow (Google 系)
-
Amazon Machine Learning
-
DMTK (微软分布式机器学习工具)
算法
一致性
-
paxos
-
raft
-
gossip
数据结构
-
栈,队列,链表
-
散列表
-
二叉树,红黑树,B树
-
图
常用算法
-
排序
-
插入排序
-
桶排序
-
堆排序
-
快速排序
-
最大子数组
-
最长公共子序列
-
最小生成树
-
最短路径
-
矩阵的存储和运算
云计算
-
云服务
-
SaaS
-
PaaS
-
IaaS
-
Openstack
-
Docker