


作者:[法] 丹尼斯·罗斯曼(Denis Rothman)著 林润 译
定价:79.8元
印次:1-1
ISBN:9787302706120
出版日期:2026.02.01
印刷日期:2025.12.29
图书责编:王军
图书分类:零售
"《大模型RAG生成式AI开发:使用LlamaIndex、Deep Lake和 Pinecone》深入剖析RAG,详解多模态AI流水线的设计、管理与把控。RAG通过将输出与可追溯的源文档关联,提升了输出的准确性与上下文相关性,为海量信息管理提供了一种动态思路。书中不仅展示RAG框架的搭建方法,介绍关于向量存储、切块、索引及排序等方面的实用知识,还传授优化项目性能、加深对数据理解的技巧,例如,运用自适应RAG与人类反馈来提高检索准确性,平衡RAG与微调的关系,实施动态RAG以增强实时决策能力,以及借助知识图谱可视化复杂数据。 读者可亲自上手,实践LlamaIndex和Deep Lake等框架、Pinecone和Chroma等向量数据库,以及来自Hugging Face和OpenAI的模型。学完本书,读者将掌握智能解决方案的实施技能,在生产、客户服务等各类项目中稳占竞争优势。 ?扩展RAG流水线,高效处理大型数据集。 ?运用先进技术,**幅度减少大模型幻觉,确保回复精准无误。 ?实施索引技术,借助可追溯且透明的输出,提升AI准确性。 ?跨领域定制与扩展RAG生成式AI系统。 ?探索利用Deep Lake和Pinecone实现高效数据检索的方法。 ?基于真实数据,构建并掌控稳健的生成式AI系统。 ?融合文本与图像数据,丰富AI回复信息。"
丹尼斯?罗斯曼(Denis Rothman)毕业于索邦大学和巴黎狄德罗大学。早在学生时代,他就撰写并申请了一项关于最早一批词向量嵌入算法和分词方案的专利。之后,他创立了一家专注于人工智能应用的公司,开发了首批AI聊天机器人之一,并将其作为酩悦香槟(Mo?t et Chandon,LVMH旗下品牌)等企业的语言教学工具。很快,丹尼斯便成为可解释AI领域的专家,他将易于理解、高质量的解释数据和功能,融入航空航天、服装、供应链等行业的大型企业项目方案中。丹尼斯始终坚信,只有教会他人如何实践,才算真正掌握某项知识。
推荐序 在当今的人工智能领域,大模型技术无疑是最具有变革性的力量。然而,随着应用场景的不断拓展和深化,人们逐渐意识到单纯依赖预训练大模型的能力,往往难以满足复杂且多变的实际需求。正是在这样的背景下,检索增强生成(Retrieval Augmented Generation, RAG)技术应运而生,它为大模型与外部知识的高效融合提供了一条切实可行的路径,显著提升了模型生成内容的准确性、相关性和时效性。 我欣喜地看到,《大模型RAG生成式AI开发:使用LlamaIndex、Deep Lake和Pinecone》这本书精准地聚焦于RAG这一前沿技术领域,为广大开发者和AI爱好者带来了一场知识与实践的盛宴。从基础概念到高级应用,从单一模态到多模态扩展,从简易实现到模块化架构,书中内容循序渐进且全面深入,覆盖了RAG技术的方方面面。无论是对RAG的定义、生态系统的剖析,还是各类RAG模式的代码实现,本书都讲解得清晰透彻,并配以丰富的实例,使读者能够轻松上手且快速实践。 特别值得一提的是,书中结合了大量诸如Deep Lake、OpenAI、LlamaIndex和Pinecone等业界领先的工具和平台,通过实际案例展示了如何在不同的场景中搭建高效的RAG流水线,以解决实际问题。例如,在无人机技术、银行客户数据扩展和视频生成等多样化的应用场景中,RAG技术的强大威力得以充分彰显。这不仅有助于读者理解RAG的核心原理,更能够引导他们将所学知识灵活地运用到自身的项目中,从而实现从理论到实践的无缝对接。 此外,书中还探讨了如何通过专家人类反馈来提升RAG性能、构建知识图谱RAG等进...
第1章 RAG入门 1
1.1 RAG的定义 2
1.2 简易、高级和模块化RAG 3
1.3 RAG对比微调 4
1.4 RAG生态 5
1.4.1 检索器(D) 5
1.4.2 生成器(G) 7
1.4.3 评估器(E) 8
1.4.4 训练器(T) 8
1.5 简易、高级和模块化RAG代码 8
1.5.1 第1部分:搭建环境与基本实现 9
1.5.2 第2部分:高级方法与评估 13
1.6 小结 25
1.7 问题 26
1.8 参考文献 26
1.9 扩展阅读 26
第2章 基于Deep Lake和OpenAI的RAG嵌入向量库 27
2.1 从原始数据到嵌入 28
2.2 按流水线组织RAG 29
2.3 RAG生成式AI流水线 30
2.4 搭建RAG流水线 31
2.4.1 配置环境 31
2.4.2 流水线组件1:数据采集与准备 35
2.4.3 流水线组件2:数据嵌入与存储 38
2.4.4 流水线组件3:增强输入生成 43
2.5 小结 50
2.6 问题 51
2.7 参考文献 51
2.8 扩展阅读 51
第3章 使用LlamaIndex、Deep Lake和OpenAI构建基于索引的RAG 53
3.1 使用基于索引RAG的原因 54
3.2 为无人机创建语义搜索引擎和生成式智能体 56
3.2.1 安装环境 57
3.2.2 流水线组... 查看详情
"《大模型 RAG 生成式 AI 开发:使用 LlamaIndex、Deep Lake
和 Pinecone》这本书精准地聚焦于 RAG 这一前沿技术领域,为广大开发者和 AI
爱好者带来了一场知识与实践的盛宴。从基础概念到高级应用,从单一模态到多
模态扩展,从简易实现到模块化架构,书中内容循序渐进且全面深入,覆盖了 RAG
技术的方方面面。无论是对 RAG 的定义、生态系统的剖析,还是各类 RAG 模式
的代码实现,本书都讲解得清晰透彻,并配以丰富的实例,使读者能够轻松上手
且快速实践。
特别值得一提的是,书中结合了大量诸如 Deep Lake、OpenAI、LlamaIndex
和 Pinecone 等业界领先的工具和平台,通过实际案例展示了如何在不同的场景中
搭建高效的 RAG 流水线,以解决实际问题。例如,在无人机技术、银行客户数
据扩展和视频生成等多样化的应用场景中,RAG 技术的强大威力得以充分彰显。
这不仅有助于读者理解 RAG 的核心原理,更能够引导他们将所学知识灵活地运
用到自身的项目中,从而实现从理论到实践的无缝对接。"

