|
题名:
|
Python和PySpark数据分析 [ 专著] python he pyspark shu ju fen xi / (加)乔纳森·里乌著 , 殷海英译 |
|
ISBN:
|
978-7-302-64536-8 价格: CNY118.00 |
|
语种:
|
chi |
|
载体形态:
|
402页 图 24cm |
|
出版发行:
|
出版地: 北京 出版社: 清华大学出版社 出版日期: 2023 |
|
内容提要:
|
Spark数据处理引擎是一个惊人的分析工厂:输入原始数据,输出洞察。PySpark用基于Python的API封装了Spark的核心引擎。它有助于简化Spark陡峭的学习曲线,并使这个强大的工具可供任何在Python数据生态系统中工作的人使用。《Python和PySpark数据分析》帮助你使用PySpark解决数据科学的日常挑战。你将学习如何跨多台机器扩展处理能力,同时从任何来源(无论是Hadoop集群、云数据存储还是本地数据文件)获取数据。一旦掌握了基础知识,就可以通过构建机器学习管道,并配合Python、pandas和PySpark代码,探索PySpark的全面多功能特性。 |
|
主题词:
|
软件工具 程序设计 |
|
主题词:
|
数据处理 |
|
中图分类法:
|
TP311.56 版次: 5 |
|
中图分类法:
|
TP274 版次: 5 |
|
主要责任者:
|
里乌 li wu 著 |
|
次要责任者:
|
殷海英 yin hai ying 译 |