標籤:
大資料通用處理平台
- Spark
- Flink
- Hadoop
分布式儲存
HDFS
資源調度
Yarn
Mesos
機器學習工具
Mahout
- Spark Mlib
- TensorFlow (Google 系)
- Amazon Machine Learning
- DMTK (微軟分布式機器學習工具)
資料分析/資料倉儲(SQL類)
- Pig
- Hive
- kylin
- Spark SQL,
- Spark DataFrame
- Impala
- Phoenix
- ELK
8.1 Elasticsearch
8.2Logstash
8.3Kibana
訊息佇列
- Kafka(純日誌類,大輸送量)
- RocketMQ
- ZeroMQ
- ActiveMQ
- RabbitMQ
流式計算
- Storm/JStorm
- Spark Streaming
- Flink
日誌收集
Scribe
Flume
程式設計語言
- Java
- Python
- R
- Ruby
- Scala
資料分析挖掘
MATLAB
SPSS
SAS
資料視覺效果
- R
- D3.js
- ECharts
- Excle
- Python
機器學習
機器學習基礎
- 聚類
- 時間序列
- 推薦系統
- 迴歸分析
- 文本挖掘
- 決策樹
- 支援向量機
- 貝葉斯分類
- 神經網路
機器學習工具
- Mahout
- Spark Mlib
- TensorFlow (Google 系)
- Amazon Machine Learning
- DMTK (微軟分布式機器學習工具)
演算法
一致性
- paxos
- raft
- gossip
資料結構
- 棧,隊列,鏈表
- 散列表
- 二叉樹,紅/黑樹狀結構,B樹
- 圖
常用演算法
1.排序
插入排序
桶排序
堆排序
2.快速排序
3,最大子數組
4.最長公用子序列
5.最小產生樹
最短路徑
6.矩陣的儲存和運算
雲端運算
雲端服務
- SaaS
- PaaS
- IaaS
- Openstack
- Docker
End.
轉自:http://www.36dsj.com/archives/4520
來源:http://www.ha97.com/5734.html
大資料架構師技能圖譜