当前位置:主页 > 聚焦 >

spark四大组件是什么?

时间:2020-12-16 08:28:10

  spark四大组件分别为:1、SparkStreaming,针对实时数据进行流式计算的组件;2、SparkSQL,用来操作结构化数据的组件;3、GraphX,Spark面向图计算提供的框架与算法库;4、MLlib,一个机器学习算法库。

  相关:《编程视频课程》

  spark四大组件

  1、SparkStreaming:

  众多应用领域对实时数据的流式计算有着强烈的需求,例如网络环境中的网页服务器日志或是由用户提交的状态更新组成的消息队列等,这些都是实时数据流。Spark Streaming是Spark平台上针对实时数据进行流式计算的组件,提供了丰富的处理数据流的API。由于这些API与Spark Core中的基本操作相对应,因此开发者在熟知Spark核心概念与编程方法之后,编写Spark Streaming应用程序会更加得心应手。从底层设计来看,Spark Streaming支持与Spark Core同级别的容错性、吞吐量以及可伸缩性。

  2、SparkSQL:

  Spark SQL是Spark用来操作结构化数据的组件。通过Spark SQL,用户可以使用SQL或者Apache Hive版本的SQL方言(HQL)来查询数据。Spark SQL支持多种数据源类型,例如Hive表、Parquet以及JSON等。Spark SQL不仅为Spark提供了一个SQL接口,还支持开发者将SQL语句融入到Spark应用程序开发过程中,无论是使用Python、Java还是Scala,用户可以在单个的应用中同时进行SQL查询和复杂的数据分析。由于能够与Spark所提供的丰富的计算环境紧密结合,Spark SQL得以从其他开源数据仓库工具中脱颖而出。Spark SQL在Spark l.0中被首次引入。在Spark SQL之前,美国加州大学伯克利分校曾经尝试修改Apache Hive以使其运行在Spark上,进而提出了组件Shark。然而随着Spark SQL的提出与发展,其与Spark引擎和API结合得更加紧密,使得Shark已经被Spark SQL所取代。

  3、GraphX:

  GraphX是Spark面向图计算提供的框架与算法库。GraphX中提出了弹性分布式属性图的概念,并在此基础上实现了图视图与表视图的有机结合与统一;同时针对图数据处理提供了丰富的操作,例如取子图操作subgraph、顶点属性操作mapVertices、边属性操作mapEdges等。GraphX还实现了与Pregel的结合,可以直接使用一些常用图算法,如PageRank、三角形计数等。

  4、MLlib:

  MLlib是Spark提供的一个机器学习算法库,其中包含了多种经典、常见的机器学习算法,主要有分类、回归、聚类、协同过滤等。MLlib不仅提供了模型评估、数据导入等额外的功能,还提供了一些更底层的机器学习原语,包括一个通用的梯度下降优化基础算法。所有这些方法都被设计为可以在集群上轻松伸缩的架构。

  想要查阅更多相关文章,请访问!

热点推荐
1 ETF资金流出:BTC和ETH近一周净流出超20亿

消息,据Lookonchain数据,7月1日更新显示,ETF近1天净流出2708枚BTC,价值约1.6亿美元近7天净流出...

2 Venice AI完成6500万美元A轮融资,成为独角

消息,Venice AI宣布完成6500万美元的A轮融资,成为独角兽。该公司以隐私优先的人工智能平台迅...

3 Meta Platforms正在构建云业务,出售多余人

消息,Meta Platforms正在构建云业务,旨在出售其多余的人工智能算力资源。...

4 Anthropic:与亚马逊、微软和谷歌共同起草

消息,Anthropic宣布正在与亚马逊、微软和谷歌共同起草一个共识框架,以评估AI监控的严重性。...

5 Hester Peirce:Bitcoin Clarity Act预计夏天通过

消息,美国证券交易委员会委员Hester Peirce表示,Bitcoin Clarity Act预计将于今年夏天获得通过,目...

6 Paradex TVL从2.23亿美元暴跌至2300万美元

消息,衍生品协议Paradex的总锁仓价值在代币推出后的数个月里,从1月下旬的峰值2.23亿美元暴...

7 XBIT DEX:深圳站世界杯预测活动圆满结束

消息,XBIT DEX表示,深圳的预言家活动已圆满结束,镜头记录下了比赛的精彩瞬间、现场的热度...

8 伊朗议长说同时备战才好谈判

消息,当地时间6月30日,伊朗首席谈判代表、议长卡利巴夫在接受采访时表示,伊朗决心维护...

9 Michael Saylor:数字信贷助力Strategy在熊市增

消息,Michael Saylor表示,资本、信贷和货币结合可获得数万亿美元机会,数字信贷使Strategy今年...

10 Ouinex:交易平台解决加密市场结构性缺陷

消息,Ouinex表示,其交易平台旨在解决现代加密市场的结构性缺陷。当前的加密交易环境高度...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。