题名:
高性能Spark   [ 专著] gao xing neng Spark / (美)霍顿·卡劳,雷切尔·沃伦著 , 夏锐[等]译
ISBN:
978-7-5198-6353-1 价格: CNY98.00
语种:
chi
载体形态:
11,356页 图 24cm
出版发行:
出版地: 北京 出版社: 中国电力出版社 出版日期: 2022.1
内容提要:
通过本书,你可以了解到:Spark SQL的新接口如何为SQL的RDD数据结构提升性能。Spark Core与Spark SQL中数据join的不同选择方式。充分利用标准RDD转换的技术。如何解决Spark中键值范式的性能问题。不借助Scala或其他JVM语言来编写高性能的Spark代码。采用改进建议后,如何来测试其功能及性能情况。使用Spark MLlib和Spark ML机器学习库。Spark的流处理组件、外部的社区扩展包。 本书提到的相关技术可以节约数据系统架构的成本以及开发人员的时间,适用软件工程师、数据工程师,以及面对大规模数据应用的系统管理员。此外你还可以加深对Spark的理解,然后学会如何驾驭它。 
主题词:
数据处理软件   英文
中图分类法:
TP274 版次: 5
主要责任者:
卡劳 ka lao 著
主要责任者:
沃伦 wo lun 著
次要责任者:
夏锐 xia rui 译
次要责任者:
陈志鹏 chen zhi peng 译
责任者附注:
Holden Karau,是一位加拿大人,在IBM的Spark技术中心担任软件开发工程师。Rachel Warren,是Alpine Data的软件工程师和数据科学家。