题名:
|
数据清洗与ETL技术 [ 专著] shu ju qing xi yu ETL ji shu / 冯广主编 , |
ISBN:
|
978-7-302-60081-7 价格: CNY48.00 |
语种:
|
chi |
载体形态:
|
12,215页 图 26cm |
出版发行:
|
出版地: 北京 出版社: 清华大学出版社 出版日期: 2022 |
内容提要:
|
本书分为6章,采用理论知识与项目教学的方式组织内容。第1章为绪论,由大数据切入,介绍大数据的基本概况,进而引入ETL,且对这3个过程做了整体说明,接着引入本书的个入门案例,利用ETL技术对论文中的年份进行处理。第2章引入ETL的个过程(数据抽取),详细介绍数据抽取的方式,紧接着对各种形式下的数据源抽取进行分类介绍,后在Windows和Linux环境下搭建MySQL,且对此进行数据抽取操作。第3章为数据转换,介绍数据转换的基本知识点,并对数据转换工具进行详细说明,后将Kettle安装及其部署作为本章的一个案例,并利用Kettle工具对某一文件的错误行进行统计并生成日志。第4章为数据加载,介绍数据加载的基本理论知识,然后搭建数据仓库,后对几种环境下的数据进行加载分析。第5章为ETL在大数据下的实现,讲解ETL在Spark、Hive、Sqoop这3种环境下的实现,并搭建Hadoop伪分布式集群,后利用Sqoop实现ETL过程。第6章为案例分析,讲解ETL在高校大数据建设、反洗钱系统、商业智能(BI)和电信领域内的应用及其实现。 |
主题词:
|
数据处理 |
中图分类法:
|
TP274 版次: 5 |
主要责任者:
|
冯广 feng guang 主编 |