Author:佃抖
No description
Tags
Support Statistics
¥.00 ·
0times
Text Preview (First 20 pages)
Registered users can read the full content for free
Register as a Gaohf Library member to read the complete e-book online for free and enjoy a better reading experience.
Page
1
(This page has no text content)
Page
2
版权信息 书名:大模型应用开发极简入门:基于 GPT-4 和 ChatGPT 作者:[比] 奥利维耶 • 卡埃朗(Olivier Caelen) [法] 玛丽 – 艾丽 斯 • 布莱特(Marie-Alice Blete) 译者:何文斯 ISBN:978-7-115-63640-9 本书由北京图灵文化发展有限公司发行数字版。版权所有,侵权必究。 您购买的图灵电子书仅供您个人使用,未经授权,不得以任何方式复制和 传播本书内容。 我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。 如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号 等维权措施,并可能追究法律责任。
Page
3
版权声明 O'Reilly Media, Inc. 介绍 推荐序一 学习成为善用 AI 的人 推荐序二 开启一段有趣、有启发、有收获的冒险旅程 推荐序三 人人都要学会和 AI 相处 推荐序四 AI 工程师:做新一轮智能革命的首批探索者 推荐序五 进入智能应用的新时代 推荐序六 AGI:不要旁观,要真正参与 推荐序七 不要害怕被 ChatGPT 取代,要做第一批驾驭新技术的人 译者序 没有谁天生就是 AI 工程师 前言 排版约定 使用代码示例 O'Reilly 在线学习平台(O'Reilly Online Learning) 联系我们 致谢 电子书 第 1 章 初识 GPT-4 和 ChatGPT 1.1 LLM 概述 1.1.1 探索语言模型和 NLP 的基础 1.1.2 理解 Transformer 架构及其在 LLM 中的作用 1.1.3 解密 GPT 模型的标记化和预测步骤 1.2 GPT 模型简史:从 GPT-1 到 GPT-4 1.2.1 GPT-1 1.2.2 GPT-2 1.2.3 GPT-3 1.2.4 从 GPT-3 到 InstructGPT 1.2.5 GPT-3.5、Codex 和 ChatGPT 1.2.6 GPT-4 1.3 LLM 用例和示例产品 1
Page
4
1.3.1 Be My Eyes 1.3.2 摩根士丹利 1.3.3 可汗学院 1.3.4 多邻国 1.3.5 Yabble 1.3.6 Waymark 1.3.7 Inworld AI 1.4 警惕 AI 幻觉:限制与考虑 1.5 使用插件和微调优化 GPT 模型 1.6 小结 第 2 章 深入了解 GPT-4 和 ChatGPT 的 API 2.1 基本概念 2.2 OpenAI API 提供的可用模型 2.3 在 OpenAI Playground 中使用 GPT 模型 2.4 开始使用 OpenAI Python 库 2.4.1 OpenAI 访问权限和 API 密钥 2.4.2 Hello World 示例程序 2.5 使用 GPT-4 和 ChatGPT 2.5.1 ChatCompletion 端点的输入选项 2.5.2 ChatCompletion 端点的输出格式 2.5.3 从文本补全到函数 2.6 使用其他文本补全模型 2.6.1 Completion 端点的输入选项 2.6.2 Completion 端点的输出格式 2.7 考虑因素 2.7.1 定价和标记限制 2.7.2 安全和隐私 2.8 其他 OpenAI API 和功能 2.8.1 嵌入 2.8.2 内容审核模型
Page
5
2.8.3 Whisper 和 DALL · E 2.9 小结(含速查清单) 第 3 章 使用 GPT-4 和 ChatGPT 构建应用程序 3.1 应用程序开发概述 3.1.1 管理 API 密钥 3.1.2 数据安全和数据隐私 3.2 软件架构设计原则 3.3 LLM 驱动型应用程序的漏洞 3.3.1 分析输入和输出 3.3.2 无法避免提示词注入 3.4 示例项目 3.4.1 项目 1:构建新闻稿生成器 3.4.2 项目 2:YouTube 视频摘要 3.4.3 项目 3:打造《塞尔达传说:旷野之息》专家 3.4.4 项目 4:语音控制 3.5 小结 第 4 章 GPT-4 和 ChatGPT 的高级技巧 4.1 提示工程 4.1.1 设计有效的提示词 4.1.2 逐步思考 4.1.3 实现少样本学习 4.1.4 改善提示效果 4.2 微调 4.2.1 开始微调 4.2.2 使用 OpenAI API 进行微调 4.2.3 微调的应用 4.2.4 生成和微调电子邮件营销活动的合成数据 4.2.5 微调的成本 4.3 小结 第 5 章 使用 LangChain 框架和插件增强 LLM 的功能
Page
6
5.1 LangChain 框架 5.1.1 动态提示词 5.1.2 智能体及工具 5.1.3 记忆 5.1.4 嵌入 5.2 GPT-4 插件 5.2.1 概述 5.2.2 API 5.2.3 插件清单 5.2.4 OpenAPI 规范 5.2.5 描述 5.3 小结 5.4 总结 术语表 作者简介 封面简介
Page
7
版权声明 Copyright © 2023 Olivier Caelen and Marie-Alice Blete. All rights reserved. Simplified Chinese edition, jointly published by O'Reilly Media, Inc. and Posts & Telecom Press, 2024. Authorized translation of the English edition, 2024 O'Reilly Media, Inc., the owner of all rights to publish and sell the same. All rights reserved including the rights of reproduction in whole or in part in any form. 英文原版由 O'Reilly Media, Inc. 出版,2023。 简体中文版由人民邮电出版社有限公司出版,2024。英文原版的翻译得到 O'Reilly Media, Inc. 的授权。此简体中文版的出版和销售得到出版权和 销售权的所有者——O'Reilly Media, Inc. 的许可。 版权所有,未得书面许可,本书的任何部分和全部不得以任何形式重制。
Page
8
O'Reilly Media, Inc. 介绍 O'Reilly 以“分享创新知识、改变世界”为己任。40 多年来我们一直向 企业、个人提供成功所必需之技能及思想,激励他们创新并做得更好。 O'Reilly 业务的核心是独特的专家及创新者网络,众多专家及创新者通过 我们分享知识。我们的在线学习(Online Learning)平台提供独家的直播 培训、互动学习、认证体验、图书、视频等,使客户更容易获取业务成功 所需的专业知识。几十年来 O'Reilly 图书一直被视为学习开创未来之技 术的权威资料。我们所做的一切是为了帮助各领域的专业人士学习最佳实 践,发现并塑造科技行业未来的新趋势。 我们的客户渴望做出推动世界前进的创新之举,我们希望能助他们一臂之 力。 业界评论 “O'Reilly Radar 博客有口皆碑。” ——Wired “O'Reilly 凭借一系列非凡想法(真希望当初我也想到了)建立了数 百万美元的业务。” ——Business 2.0 “O'Reilly Conference 是聚集关键思想领袖的绝对典范。” ——CRN “一本 O'Reilly 的书就代表一个有用、有前途、需要学习的主 题。”
Page
9
——Irish Times “Tim 是位特立独行的商人,他不光放眼于最长远、最广阔的领域, 并且切实地按照 Yogi Berra 的建议去做了:‘如果你在路上遇到岔 路口,那就走小路。’回顾过去,Tim 似乎每一次都选择了小路,而 且有几次都是一闪即逝的机会,尽管大路也不错。” ——Linux Journal
Page
10
推荐序一 学习成为善用 AI 的人 宝玉,Prompt Engineer 2023 年是 AI 爆发的一年,各种 AI 技术和产品如井喷一样爆发。尤其是 以 ChatGPT 为代表的大语言模型(large language model,LLM),能写 文章、写总结、写代码,还能调用外部智能体(agent),真切地让普通人 感受到了 AI 的强大。同时,AI 的爆发也引发了很多人的焦虑,以至于一 句话广为流传:“替代你的不是 AI,而是善用 AI 的人。”大家都想快速 学习和掌握 AI 技术,不想落伍,但同时又担心 AI 门槛过高,很难掌 握。 我在今年完整地经历了: 惊讶于 AI 的强大–> 焦虑被 AI 或者善用 AI 的人替代–> 学习 AI –> 使用 AI –> 成为善用 AI 的人 在这个过程中,我最大的感触就是,如果从应用层面去学习 AI,其实没有 想象中的那么难;但是如果没有好的图书或者视频类教程,还是会走不少 弯路。 要学习 AI 技术,我个人认为比较好的方法如下。 01. What:系统了解什么是生成式 AI 和大语言模型,大语言模型能做什 么,有什么应用场景,局限是什么。 02. How:该如何写提示词,如何调用 API。 03. Do:把 AI 带入自己的工作和生活,切实去使用 AI。从使用提示词开 始,写文案、写总结、翻译、写代码,等等。然后,有能力和想法的 朋友,还可以尝试调用 API 去开发 AI 应用程序。 这其实也是我推荐这本书的原因。这本书虽然比较“薄”,但是可以帮助 你系统地了解什么是大语言模型,大语言模型都有哪些应用场景,以及如 何写提示词和调用 API。另外,整本书的翻译质量相当不错,绝对不是
Page
11
“机翻”的版本,并且由于书中用到的一些平台或者 API 已经发生了更 改,译者针对这类情况都贴心地加上了译者注。 当然,请不要指望通过这本书就成为一个专家,它更像一个入门指南,告 诉你 What 和 How。如果你想深入学习某些知识点,还需要自己动手去实 践,并配合在线资料进一步学习。 祝你通过这本书,掌握 AI 的知识,早日成为善用 AI 的人。
Page
12
推荐序二 开启一段有趣、有启发、 有收获的冒险旅程 张路宇,Dify 创始人兼 CEO OpenAI 发布 ChatGPT 的那个夜晚,我极其兴奋地与“她”聊到了凌晨三 四点,一个朴素的聊天框满足了过去十多年我对 AI 生产力的幻想!以 GPT-4 为代表的大语言模型(LLM)的迅速发展,对于所有开发者乃至知识 工作者而言都是一个崭新的起点,是“以一敌十”的生产力神器,也拉开 了涌现 AI 原生应用舞台的序幕。 LLM 技术和基于 LLM 的应用(以下简称 LLM 应用)正在以“天”为单位 快速发展。过去这段时间,我和团队接触了数千名对开发 LLM 应用报以热 情的开发者,与大家一同解锁 LLM 技术栈的潜力,其中不乏有创业者快速 收获用户、获得融资并在几个月内获得了声望(Dify 或许也是幸运儿之 一);也有开发者在使用 LLM 提升现有应用及团队工作流。我们可以看到 的数据是:一方面,LangChain 仅在中国的开发者用户占比就高达全部用 户的 40% 以上;但另一方面,我们感受到 LLM 应用开发者占据中国全部 开发者的比重还很低,LLM 应用开发在中国还处于早期。 作为经历过 Web 1.0 时代和 Web 2.0 时代的技术人,我深知“早期”二 字意味着稀缺的机遇。 社区开发者讨论得最多的两个问题是: AI 原生应用究竟应该是什么样的? LLM 应用技术栈应该怎么玩? 图灵公司引进出版了 O'Reilly 的《大模型应用开发极简入门:基于 GPT- 4 和 ChatGPT》,你大概一个下午就可以读完这本小册子,对上述两个问 题建立总体认识,并动手完成自己的第一个基于 GPT-4 的应用。如此短小 精湛的书甚至还包含 LLM 原理的介绍和提示工程的技巧。我甚至认为今后 的技术书都应该“这样”,因为你可以结合与 ChatGPT 互动问答的方式更 高效地学习。
Page
13
不知你是否有过组装计算机的经历?如今 LLM 应用技术栈中的模型(例如 GPT-4)就相当于其中的 CPU,开发框架(例如 LangChain 或 Dify)则相 当于主板,而内存、向量存储、插件就好比主板上的各种 I/O 设施。正如 组装计算机一样,开发者在构建 LLM 应用时也需理解、精心挑选和配置每 个组件。 如果要掌握这个全新的技术栈,最佳的方式便是结合问题,跟着好奇心动 手试试,我敢和你说这绝对是一段有趣、有启发、有收获的冒险旅程!
Page
14
推荐序三 人人都要学会和 AI 相处 本文约 10% 的内容由 AI 生成。 孙志岗,AGI 课堂创始人、ChatALL.ai 作者 业内共识,以 ChatGPT 为代表的新一代基于大模型的 AI 不只代表了技术 突破——Ta 是一个新的智慧物种,完全可以当人看(所以我拒绝用“它” 指代 AI)。 当新一代 AI 来到我们身边时,就像来了一个名校毕业、知识渊博的新同 事。Ta 什么都懂,但对公司的业务一无所知,且口无遮拦,偶尔还会犯 浑、闹笑话。我们必须知道如何和这样的 AI 相处,就像和新同事相处一 样,才能发挥 Ta 的长处、避开 Ta 的短处。 学习与 AI 相处,这本书是个不错的开始。 最近,我遇到一个非常奇怪的现象:我开设的《AI 大模型全栈工程师》课 程,涌入了很多不懂编程的朋友。他们无视标题里的“工程师”三个字, 无视我在报课须知里列出的“会编程”的明确要求,还是报名了。经过与 这些朋友沟通,我了解到他们是因为对 AI 时代的憧憬和焦虑,“有病乱 投医”,买了这门并不十分适合他们的课。 什么样的课程适合不懂编程的朋友呢?其实我还不知道答案。但我知道, 各种教大家怎么操作 AI 工具,所谓 AI 提效的课程、书籍,都“不 对”。这是因为,那些内容就像 SOP 操作手册一样,把 AI 当工具看,非 常机械。AI 是充满创造性的,想要用好 Ta,不能一味机械地操作,而是 要知道 Ta 的原理,了解 Ta 的脾气,才能信手拈来地避开 Ta 的短处、 发挥 Ta 的长处。 这本书虽然是面向软件工程师的,但因为足够基础,所以我建议不懂编程 的朋友从这本书开始了解 AI 的细节。 1 1
Page
15
书中的代码都是用 Python 写的,这是一种最接近自然语言的编程语言。 不需要深究代码细节,把它当成某种英语方言去读就好。没准儿你读完这 本书,对编程也能有些感悟,甚至可以自己写些小程序。 众所周知,AI 幻觉问题很难消除。现在“压制”AI 幻觉最有效的手段, 几乎都要通过编程实现。也许未来和 AI 共处的技能中,有一项就是“懂 编程”呢!只不过未来的“懂编程”,不代表一定要会写代码,而是读得 懂代码、能指导 AI 写代码就行。所以,这本书对每个人的帮助都可能挺 大的。
Page
16
推荐序四 AI 工程师:做新一轮智 能革命的首批探索者 邓范鑫,字节跳动架构师、公众号“深度学习”主理人 在人工智能迎来深度学习爆发期之后,著名人工智能专家吴恩达曾多次强 调:人工智能就是新时代的电力。我一直觉得这个比喻并不恰当,因为那 时我们想要引入一个人工智能模型,仍然需要投入大量的努力。比如,想 构建一个分类器,你需要花费大量的人力来标注数据,还要自己训练和部 署模型。据统计,一些 AI 公司每年在数据标注上的投入甚至占到了营收 的 10%~20%——对比电力的便利性,如此高的使用门槛会使上述类比显得 突兀。然而,大模型出来后,API 化的使用模式使得这个比喻变得十分贴 切。我们不再需要整理数据、人工标注、编写模型代码、训练和部署模 型,只需要一个简单的 API 请求,就能够实现一个 AI 应用。而我们的费 用只和消耗的“电量”有关,开发者只需要关心如何把“电流”引入不同 的元器件中——AI 工程师(AI Engineer)应运而生。 这个全新的职业需要掌握如何控制大模型完成各种类型的任务,AI 工程师 多数由后端工程师或前端工程师转型而来,对 AI 的概念充满好奇却又望 而生畏。我所带领的团队就汇聚了不少这样的人才,所以我一直对大家想 迫切入门大模型应用开发的心情体会深刻。市面上的资料琳琅满目,这本 小册子满足了我的一些期待:它向初学者交代了大模型必要的前置概念, 避免了生疏感;又快速梳理了 ChatGPT 的核心原理和用法;随后带大家快 速上手构建一个 AI 应用。在实践过程中,大家还能体会到记忆、提示工 程、智能体等关键领域的核心概念及其用法。这本书可谓能够让大家在短 时间内成为新时代的首批探索者。 这一轮智能革命的大幕刚刚拉开,只有置身其中,不断探索、学习、实 践,我们才能真正把握自己的未来,主导属于我们自己的 AGI 纪元。我个 人认为这一波智能革命最大的机会在智能体,智能体为这个世界注入了一 个全新的维度——未来所有行业的知识、流程、规则都会融入智能体,各 种类型的工具都将为智能体所用——地球文明的面貌将为之改变,与此同 时,生产力实现指数级的增长。
Page
17
各位朋友,希望这本书成为你掌握大模型应用开发的敲门砖,后面还有更 波澜壮阔的旅程等着你。一起加入智能体创造的浪潮吧!
Page
18
推荐序五 进入智能应用的新时代 梁宇鹏(@ 一乐),蓝莺 IM 创始人兼 CEO ChatGPT 绝对是 2023 年最值得了解的技术,如果你还没有玩过,是时候 动手了。 自从 ChatGPT 发布,大模型 AI 的能力已经屡屡刷新人们的认知,蓝莺 IM 团队也在多个行业大会上分享过对下一代智能聊天应用的看法——未 来,所有的应用,都有可能像 ChatGPT 一样,用户可以通过聊天的方式与 其交互,而不再通过图形界面点击交互。 我在 2023 年的每一次分享,第一句话便是提醒听众,看不懂新技术没有 关系,一定要用起来,对当前 AI 技术的发展有一个真实的“体感”。只 有这样,才有可能逃出旧日思维的牢笼,重新审视这强人工智能的新时 代。 一个越来越明显的现象是,当前生态开始呈现两级分化的状态:一方面, 大模型 AI 技术日新月异,善用 AI 的极客们用 AI 做着各种酷炫之事; 另一方面,还有很多人,或者陷于业务的泥潭之中无法自拔,或者迷失在 信息爆炸的报道中始终摸不到 AI 的门道。 因此,作为一本入门书,这本书依然有很大的价值,特别是对后两类人 群。 现在行业正处于“百模大战”,开源大模型也在迅速发展,但我们知道这 一切都始于 ChatGPT——理解 ChatGPT 将是理解其他大模型 AI 技术的重 要支点。而要理解 ChatGPT,了解其背后的 Transformer 架构和 GPT 技 术一路的演进则变得非常必要。 ChatGPT 的成功,不仅让我们看到了机器可以学会使用自然语言与人交 互,它还能够通过提供 API 的方式,让所有应用以极低的成本来使用 AI 的能力,这也为我们构建下一代智能应用创造了无限可能。 也正是因为这样的开放性,蓝莺 IM 团队得以基于 ChatGPT 构建了一个 ChatAI 的 SDK,为应用开发者提供兼具聊天和 AI 双重能力的应用框架, 这在之前是无法想象的。
Page
19
以上这些开发思路或者实践方向,都可以在这本书中找到对应的章节。通 过阅读这本书,建立一个与大模型技术相关的认知框架,是面对当前信息 爆炸的有效方法。你可能还会担心:现在大模型正在进入新的阶段,多模 态技术出现了突破,GPTs 应用商店和各种智能体平台也在陆续发布,这样 介绍某个版本的平台类产品的书是否会过时? 在我看来,大可不必担心。本质上,所有的技术都在不断迭代,知识更新 才是常态。即使是你第一时间阅读的报道,也不过是别人早就完成的研究 成果,这意味着作者必然早已进入新的阶段。 用威廉 · 吉布森的话来讲就是:未来已来,只是分布不均。 一直都是这样,所以无须焦虑。如果你能够从这本书中看到智能应用的未 来,那么它的使命就已经完成,而我在这方面有足够的信心。 重要的是,阅读这本书应该作为你探索智能应用的起点,而不是终点。
Page
20
推荐序六 AGI:不要旁观,要真正 参与 罗云,腾讯云创始团队成员、腾讯云数据库副总经理兼向量数据库负责人 我相信,如果我们站在 10 年后回望,2023 年注定非同凡响。ChatGPT 的 广泛流行激发了公众对 AI 技术的极大兴趣,人们逐渐尝试将 ChatGPT 及 类似产品应用于日常生活和工作。作为科技行业从业者,我收到了不少业 外朋友的咨询,他们想了解如何更好地融入这波浪潮,并询问有效的学习 方法。我常引用先贤的话回应:“纸上得来终觉浅,绝知此事要躬行。” 我本人推崇亲身实践,带着目标和想法去学习,这往往能达到事半功倍的 效果。比如,我曾与儿子一起完成了一个自研“贪吃蛇”的游戏探索项 目。借助 ChatGPT,我们用了一个下午的时间,就实现了儿子设计的游戏 概念——这是真正的“寓教于乐”。 作为云计算行业十余年的资深从业人士,我深知程序员在调度计算机算力 方面所面临的挑战。ChatGPT 背后的 LLM 技术使普通人能够通过自然语言 完成过去只能由程序员通过编程语言实现的任务,这是一场巨大的变革。 然而,人类通常容易高估技术的短期影响而低估长期影响。只有亲身体验 和实践技术,我们才能更好地保持耐心,并激励更多人投身这个领域,共 同进步。我强烈建议大家在未来 3~5 年积极拥抱并体验 AI 技术。 我们说 LLM 是一场巨大的变革,这不仅是技术领域的变革,也是学习领域 的变革——AI 技术之于普通人已经不再是“难度大,不好学”了。不夸张 地说,你可以在任何时候开启对任何技术的学习。比如你手里这本书,内 容浅显易懂,非常适合想快速入门大模型应用开发的朋友。特别是第 3 章 既有趣又生动,引导读者从具体案例出发,通过实操学习,快速上手大模 型应用开发,从而逐步深入理解这个新兴技术领域。在初步学习之后,大 家可以进一步学习关于 LLM 技术原理的论文、视频、图书等。在阅读这本 书或者后续学习过程中,你有任何疑问都可以随时请教 ChatGPT 等工具 ——无所不知的 AI“私教”会随时为你“服务”,你还担心学习难度太大 吗? 在新一波技术浪潮下,迷茫无济于事,只有持续学习才能适应领域的迅速 变化。技术变革千载难逢,机遇与挑战并存,我辈之人当“立于潮头,搏
The above is a preview of the first 20 pages. Register to read the complete e-book.
Comments 0
Loading comments...
Reply to Comment
Edit Comment