Skip to content

Latest commit

 

History

History
619 lines (589 loc) · 51.3 KB

README.md

File metadata and controls

619 lines (589 loc) · 51.3 KB

大数据技术之路

本人从13年开始接触大数据,也算在大数据领域中摸爬滚打了很多年,本项目是我对大数据行业相关技术做些梳理。

1、Hadoop

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。

2、Spark

Spark是基于内存计算的大数据并行计算框架,可用于构建大型的、低延迟的数据分析应用程序

3、Flink

Apache Flink是由Apache软件基金会开发的开源流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎。
Flink以数据并行和流水线方式执行任意流数据程序,Flink的流水线运行时系统可以执行批处理和流处理程序。

4、大数据生态圈一些其它技术框架

5、大数据相关技能前奏

6、大数据一些相关项目

7、数据相关知识点

8、大数据学习相关资料

8.1、大数据学习网站
8.2、大数据学习书籍
8.3、大数据论文
8.4、学习网址收藏

9、必会知识点