题名:
|
Apache Airflow数据编排实战 apache airflow shu ju bian pai shi zhan / (荷)巴斯·哈伦斯拉克,朱利安·德·瑞特著 , 殷海英译 |
ISBN:
|
978-7-302-61815-7 价格: CNY128.00 |
语种:
|
chi |
载体形态:
|
XIII,410页 图 24cm |
出版发行:
|
出版地: 北京 出版社: 清华大学出版社 出版日期: 2022 |
内容提要:
|
数据管道通过整合、清理、分析、可视化等方式来管理初始收集的数据流。Apache Airflow提供了一个统一的平台,可以使用它设计、实施、监控和维护数据的流动。Airflow具有易于使用的UI、即插即用的选项以及灵活的Python脚本,这些都使Airflow能够非常轻松地完成任何数据管理任务。在《Apache Airflow 数据编排实战》中,介绍了如何构建和维护有效的数据管道。与你一同探索最常见的使用模式,包括聚合多个数据源、连接到数据湖以及云端部署。可以将本书作为Airflow的实用指南,本书涵盖了为Airflow提供动力的有向无环图(DAG)的各方面知识,以及如何根据工作需求对其进行自定义的技术。 |
主题词:
|
数据管理 |
中图分类法:
|
TP274 版次: 5 |
主要责任者:
|
哈伦斯拉克 ha lun si la ke 著 |
主要责任者:
|
瑞特 rui te 著 |
次要责任者:
|
殷海英 yin hai ying 译 |
责任者附注:
|
Bas Harenslak和Julian de Ruiter是数据工程师,他们在为大公司开发数据管道方面拥有丰富的经验。同时,Bas也是一位Airflow的提交者。 |