题名:
基于PySpark的高级数据分析   [ 专著] ji yu PySpark de gao ji shu ju fen xi / Akash Tandon[等]著 , 张紫熙译
ISBN:
978-7-5198-9186-2 价格: CNY78.00
语种:
chi
载体形态:
243页 图 24cm
出版发行:
出版地: 北京 出版社: 中国电力出版社 出版日期: 2024
内容提要:
本书介绍了Spark生态系统,然后深入研究将常用技术(包括分类、聚类、协同过滤和异常检测)应用于以下的领域:基因组学、安全工作和金融。此更新版本还涵盖图像处理和Spark NLP库。如果你对机器学习和统计学有基本的了解,并且能够使用Python进行编程,那么本书将帮助你开始进行大规模的数据分析。本书的主要内容有:熟悉Spark的编程模型和生态系统。学习数据科学的一般方法。检查分析大型公共数据集执行步骤的完整性。发现哪些机器学习工具对特定问题有帮助。探索可适应多种用途的代码。 
主题词:
数据处理软件  
中图分类法:
TP274 版次: 5
主要责任者:
坦登 tan deng 著
次要责任者:
张紫熙 zhang zi xi 译