
AI工程 内容简介
本书是学习与实践AI工程的权威指南,覆盖AI应用开发全流程 ,由业内知名AI专家、畅销书作者Chip Huyen撰写。 全书系统阐述了“AI工程”的核心方法——如何基于现成的基础模型(LLM、LMM)构建高效、实用的AI应用。书中提供了完整的AI工程框架,涵盖模型选择与评估、提示工程、RAG与智能体、微调策略、数据集工程、推理优化及AI工程架构等关键环节,帮助开发者在复杂的AI生态中做出科学的技术决策。作者结合丰富的业界经验,通过大量真实案例与可操作的方法,展示了如何让AI应用更快、更可靠、更具扩展性。
AI工程 作者简介
奇普·萱(Chip Huyen)
计算机科学家、作家,深耕于AI、数据与叙事艺术的跨界地带。毕业于斯坦福大学,并曾在该校教授“Machine Learning Systems Design”(CS 329S)课程。创立了一家AI基础设施初创公司(后被成功收购)。此前曾就职于Snorkel AI和NVIDIA。
著有《机器学习系统设计》(Designing Machine Learning Systems,O’Reilly),已被翻译成十余种语言,长居Amazon人工智能图书畅销榜榜首,在全球开发者中拥有广泛的影响力。新作《AI工程》已经成为当前AI领域最有影响的图书之一,AI工程师必读。
AI工程 目录
目录译者序
前言
第1章使用基础模型构建AI应用入门
1.1AI工程的兴起
1.1.1从语言模型到大型语言模型
1.1.2从大型语言模型到基础模型
1.1.3从基础模型到AI工程
1.2基础模型的应用场景
1.2.1编程
1.2.2图像和视频制作
1.2.3写作
1.2.4教育
1.2.5对话机器人
1.2.6信息聚合
1.2.7数据组织
1.2.8工作流自动化
1.3规划AI应用
1.3.1用例评估
1.3.2设定目标
1.3.3里程碑规划
1.3.4维护
1.4AI工程技术栈
1.4.1AI技术栈的三个层次
1.4.2AI工程与ML工程
1.4.3AI工程与全栈工程
1.5小结
第2章理解基础模型
2.1训练数据
2.1.1多语言模型
2.1.2特定领域模型
2.2建模
2.2.1模型架构
2.2.2模型规模
2.3后训练
2.3.1监督微调
2.3.2偏好微调
2.4采样
2.4.1采样基础知识
2.4.2采样策略
2.4.3测试时计算
2.4.4结构化输出
2.4.5AI的概率特性
2.5小结
第3章评估方法论
3.1评估基础模型的挑战
3.2理解语言建模指标
3.2.1熵
3.2.2交叉熵
3.2.3BPC与BPB
3.2.4困惑度
3.2.5困惑度的解释与应用场景
3.3精确评估
3.3.1功能正确性
3.3.2与参考数据的相似度测量
3.3.3嵌入简介
3.4AI当裁判
3.4.1为什么用AI当裁判
3.4.2如何用AI当裁判
3.4.3以AI为裁判的局限性
3.4.4哪些模型可以作为裁判
3.5使用比较评估对模型进行排名
3.5.1比较评估面临的挑战
3.5.3比较评估的未来
3.6小结
第4章评估AI系统
4.1评估标准
4.1.1领域特定能力
4.1.2生成能力
4.1.3指令遵循能力
4.1.4成本和延迟
4.2模型选择
4.2.1模型选择工作流
4.2.2模型的自建与购买
4.2.3利用公开基准测试
4.3设计你的评估流程
4.3.1第一步:评估系统中的所有组件
4.3.2步骤2:创建评估指南
4.3.3步骤3:定义评估方法和数据
4.4小结
第5章提示工程
5.1提示词简介
5.1.1上下文学习:零样本和少样本
5.1.2系统提示词和用户提示词
5.1.3上下文长度与上下文效率
5.2提示工程最佳实践
5.2.1撰写清晰明确的指令
5.2.2提供充足的上下文
5.2.3将复杂任务拆分为更简单的子任务
5.2.4给模型更多思考时间
5.2.5对提示词进行迭代优化
5.2.6评估提示工程工具
5.2.7提示词的组织与版本管理
5.3防御性提示工程
5.3.1专有提示词与反向提示工程
5.3.2越狱与提示词注入
5.3.3信息提取
5.3.4针对提示词攻击的防御措施
5.4小结
第6章RAG与智能体
6.1RAG
6.1.1RAG架构
6.1.2检索算法
6.1.3检索优化
6.1.4超越文本的RAG
6.2智能体
6.2.1智能体概述
6.2.2工具
6.2.3规划
6.2.4智能体的故障模式与评估
6.3记忆
6.4小结
第7章微调
7.1微调概述
7.2何时进行微调
7.2.1进行微调的原因
7.2.2不进行微调的原因
7.2.3微调与RAG
7.3内存瓶颈
7.3.1反向传播与可训练参数
7.3.2内存计算
7.3.3数值表示
7.3.4量化
7.4微调技术
7.4.1PEFT
7.4.2模型合并与多任务微调
7.4.3微调策略
7.5小结
第8章数据集工程
8.1数据策展
8.1.1数据质量
8.1.2数据覆盖度
8.1.3数据量
8.1.4数据获取与数据标注
8.2数据增强与数据合成
8.2.1为什么要进行数据合成
8.2.2传统的数据合成方法
8.2.3AI驱动的数据合成方法
8.2.4模型蒸馏
8.3数据处理
8.3.1数据检查
8.3.2数据去重
8.3.3数据清理与过滤
8.3.4数据格式化
8.4小结
第9章推理优化
9.1理解推理优化
9.1.1推理概述
9.1.2推理性能指标
9.1.3AI加速器
9.2推理优化的实现
9.2.1模型优化
9.2.2推理服务优化
9.3小结
第10章AI工程架构与用户反馈
10.1AI工程架构
10.1.1增强上下文
10.1.2设置防护措施
10.1.3添加路由器和网关
10.1.4通过缓存技术降低延迟
10.1.5添加智能体模式
10.1.6监控与可观测性
10.1.7AI流水线编排
10.2用户反馈
10.2.1提取对话反馈
10.2.2反馈设计
10.2.3反馈的局限性
10.3小结
······
[ AI工程下载地址【免费下载】 ]
最后修改:2026 年 03 月 23 日
© 允许规范转载
