Skip to content

Latest commit

 

History

History
6 lines (6 loc) · 523 Bytes

basic.md

File metadata and controls

6 lines (6 loc) · 523 Bytes

Spark 初识

  • 什么是Spark
    • spark是一个实现快速通用的集群计算平台。
    • 它是由加州大学伯克利分校AMP实验室 开发的通用内存并行计算框架,用来构建大型的、低延迟的数据分析应用程序。
    • 它扩展了广泛使用的MapReduce计算模型。高效的支撑更多计算模式,包括交互式查询和流处理。
    • spark的一个主要特点是能够在内存中进行计算,及时依赖磁盘进行复杂的运算,Spark依然比MapReduce更加高效。