|
题名:
|
大模型轻量化 [ 专著] da mo xing qing liang hua / 梁志远著 , |
|
ISBN:
|
978-7-302-68600-2 价格: CNY129.00 |
|
语种:
|
chi |
|
载体形态:
|
384页 图 24cm |
|
出版发行:
|
出版地: 北京 出版社: 清华大学出版社 出版日期: 2025 |
|
内容提要:
|
模型轻量化能降低计算与存储需求,提升大模型运行效率等,涵盖参数轻量化、训练与推理加速,运用量化等技术。本书系统探究其理论与实现,阐述背景、核心技术、端侧优化策略、算子优化,以cuDNN等为例。借实际案例验证技术有效性,给出综合优化方案,助力提升模型部署效率与计算性能。 |
|
主题词:
|
人工智能 |
|
中图分类法:
|
TP18 版次: 5 |
|
其它题名:
|
模型压缩与训练加速 |
|
主要责任者:
|
梁志远 liang zhi yuan 著 |
|
责任者附注:
|
梁志远,毕业于北京航空航天大学。长期从事人工智能、大语言模型的开发,专注于深度学习、自然语言处理、数据分析与智能决策等领域。 |