|
题名:
|
Apache Spark大数据分析 [ 专著] Apache Sparkda shu ju fen xi / (瑞典)罗伯特·伊利杰森(Robert Ilijason)著 , 袁国忠译 |
|
ISBN:
|
978-7-115-61456-8 价格: CNY79.80 |
|
语种:
|
chi |
|
载体形态:
|
236页 图 23cm |
|
出版发行:
|
出版地: 北京 出版社: 人民邮电出版社 出版日期: 2023.06 |
|
内容提要:
|
AzureDatabricks是一款基于云的大数据分析和机器学习平台,用于实现基于ApacheSpark的数据处理,为快速增长的海量数据的处理和决策需求分析提供了良好的支撑。本书首先介绍了大规模数据分析相关的概念,然后介绍了受管的Spark及其与Databricks的关系,以及Databricks的版本差异和使用方法(涵盖工作区、集群、笔记本、Databricks文件系统、数据导入/导出等内容)。此外,书中还介绍了使用SQL和Python分别实现数据分析的过程,数据提取、变换、加载、存储、优化技巧等高阶数据处理方法,以及外部连接工具、生产环境集成等内容,最后探讨了运行机器学习算法、合并数据更新以及通过API运行Databricks、Delta流处理等高阶主题。 |
|
主题词:
|
数据处理软件 机器学习 |
|
中图分类法:
|
TP274 版次: 5 |
|
主要责任者:
|
伊利杰森 yi li jie sen 著 |
|
次要责任者:
|
袁国忠 yuan guo zhong 译 |