题名:
大模型轻量化   [ 专著] da mo xing qing liang hua / 梁志远著 ,
ISBN:
978-7-302-68600-2 价格: CNY129.00
语种:
chi
载体形态:
384页 图 24cm
出版发行:
出版地: 北京 出版社: 清华大学出版社 出版日期: 2025
内容提要:
模型轻量化能降低计算与存储需求,提升大模型运行效率等,涵盖参数轻量化、训练与推理加速,运用量化等技术。本书系统探究其理论与实现,阐述背景、核心技术、端侧优化策略、算子优化,以cuDNN等为例。借实际案例验证技术有效性,给出综合优化方案,助力提升模型部署效率与计算性能。 
主题词:
人工智能  
中图分类法:
TP18 版次: 5
其它题名:
模型压缩与训练加速
主要责任者:
梁志远 liang zhi yuan 著
责任者附注:
梁志远,毕业于北京航空航天大学。长期从事人工智能、大语言模型的开发,专注于深度学习、自然语言处理、数据分析与智能决策等领域。