Author:中国电信天翼智库大模型研究团队
本书由中国电信研究院天翼智库官方出版,从核心技术、基础设施、商业应用、产业体系、安全治理5个维度全面讲解了大模型。语言上通俗易懂,内容上深入浅出,呈现上图文并茂,给读者良好阅读体验的同时,让读者对大模型的理解事半功倍。 无论你是AI工程师,还是完全没有IT技术背景的爱好者;无论你是一线的从业人员,还是企业的管理者和决策者,你都能通过本书系统理解和掌握大模型,从而深刻认识大模型的核心价值和应用潜力,把握住大模型带来的变革和商机。
Tags
Support Statistics
¥.00 ·
0times
Text Preview (First 20 pages)
Registered users can read the full content for free
Register as a Gaohf Library member to read the complete e-book online for free and enjoy a better reading experience.
Page
1
(This page has no text content)
Page
2
版权信息 COPYRIGHT 书名:⼀本书读懂⼤模型:技术创新、商业应⽤与产业变⾰ 作者:中国电信天翼智库⼤模型研究团队 出版社:机械⼯业出版社 出版时间:2024年8⽉ ISBN:9787111761655 字数:142千字
Page
3
推荐序 毋庸置疑,⼤模型将成为继互联⽹之后重要的技术⾰命之⼀。⼤模型 是AI产业发展的重要⾥程碑,标志着我们进⼊了智能化的新时代。从 ChatGPT到Sora,⼤模型的技术跃迁不仅体现在单模态到多模态、⽂ ⽣⽂到⽂⽣视频的突破,也被认为是从内容⽣成到理解与模拟物理世 界,迈向“世界模型”的关键⼀步,在泛化能⼒和特化应⽤两⽅⾯都实 现了显著进步,展现出强⼤的智能涌现能⼒。⼤模型的出现开辟出⼈ 类迈向实现通⽤⼈⼯智能的新路径,引领了新⼀轮全球⼈⼯智能创新 热潮,千⾏百业将迎来前所未有的变⾰。 以⼤模型为代表的⽣成式⼈⼯智能加速发展,正在成为打造新质⽣产 ⼒的重要引擎。⼈⼯智能与社会全要素的深度融合,正在推动泛 在“智能”替代泛在“算⼒”,成为新质⽣产⼒的重要驱动⼒。AI作为新 ⽣产⼯具正在融⼊社会⽣产各环节,以数据作为新⽣产要素、以算⼒ 作为新基础能源,通过⼈机协同新模式,推动⽣产要素创新性配置和 全要素⽣产率⼤幅提升。在产业⽅⾯,⼤模型技术能够对⽣产数据进 ⾏⾼效分析,预测设备故障和维护需求,优化⽣产计划和资源配置, 实现⽣产流程⾃动化与智能化,提升⽣产效率。在劳动⼒⽅⾯,通过 ⼤模型技术创造出的AI智能体等智能化“劳动者”,及具有⼀定⾃主性 的智能机器⼈已经成为⽣产中⼈类的得⼒助⼿。同时,⼤模型技术也 潜藏着数据滥⽤、算法歧视、新型技术控制等⻛险,因此加快形成新 质⽣产⼒亟须对其进⾏治理模式创新。 从⼈类发展⻆度来看,以⼤模型为代表的⽣成式⼈⼯智能将⼈类从重 复性体⼒劳动中解放出来,推动⼈类劳动进⼊智⼒型阶段。⼈类劳动 经历过从体⼒到技能再到智⼒的演变:农业时期,体⼒劳动占主导地 位;⼯业⾰命时期,技能型劳动占主导地位,体⼒劳动逐渐被机械化 取代;随着信息技术的发展,⼈⼯智能开始改变⼈类劳动的性质,⼤ 模型应⽤与⼈形机器⼈承担更多的⽣产任务,⼈类则专注于研发、创
Page
4
意和产品创新等智⼒型劳动。未来,⼈类的⽣产活动将迎来⼴阔的创 造和发展空间,智⼒型劳动将占主导地位,开启全新的社会⽣产⼒时 代。 数字信息基础设施在⼤模型发展中扮演着⾄关重要的⻆⾊。⼤模型的 算⼒需求随着技术进步⽽显著增⻓。OpenAI报告显示,AI训练应⽤的 算⼒需求每3到4个⽉就会翻倍,从2012年⾄今,AI算⼒增⻓超过了30 万倍。智算中⼼作为算⼒的集中体现发展尤为迅猛。截⾄2023年年 底,我国在⽤数据中⼼机架总规模超过810万标准机架,算⼒总规模 达到230 EFLOPS,智能算⼒规模达到70 EFLOPS,增速超过70%。 随着规模的扩⼤,⼤模型的训练和运⾏的能源消耗也相应增加,数据 中⼼的绿⾊低碳发展⼤势所趋。此外,训练模型需要⼤量数据和计算 资源,对⽹络基础设施提出较⾼带宽和低时延的要求。打造⾯向智算 的AIDC间⾼速⽆损、确定性⽹络,对⼤模型的实时响应和⾼效运⾏⾄ 关重要。 ⼤模型的快速发展将给通信⾏业带来深远影响。⼀⽅⾯,运营商通过 布局⼤模型产业,实施“AI+”⾏动,可以推进现有业务智能化升级, 拓展新业务,打造新增⻓点。另⼀⽅⾯,以⼤模型为抓⼿,可深⼊推 动企业数字化转型,提⾼运营管理效率。⾸先从智算中⼼来看,⼤模 型技术的加速渗透将给⾏业发展带来深远影响。⽐如,通过⽹络⼤模 型,实现⽹络⾃动感知,提升⽹络效率和运维质量;通过研发⼤模 型,加速软件开发,提⾼研发效率;通过客服⼤模型,实现更准确的 语义理解和情感分析,提供更个性化的客户服务。 中国电信积极践⾏央企使命担当,⽴⾜科技⾃⽴⾃强,依托云⽹融合 优势,持续推动数字信息基础设施向智能化演进升级,坚定做智能算 ⼒的主要服务商、基础通⽤⼤模型的先⾏者、⾏业⼤模型的主导者, 持续深耕智算云、通⽤⼤模型、数据底座、内部⼤模型、⾏业⼤模型 五⼤领域。中国电信不仅规划了“2+3+7+N+M”的智算布局,启⽤单 集群的万卡智算资源池,⾃主研发的星⾠⼤模型还通过了境内深度合
Page
5
成服务算法、⽣成式⼈⼯智能服务“双备案”。中国电信在推出⾯向个 ⼈、家庭、⾏业客户的⾸批“AI+”产品,全⽅位推进业务AI化的同时, 还⾯向交通等⾏业研发数⼗个⾏业⼤模型,深度赋能垂直场景应⽤。 在⼤模型技术⽇新⽉异、⾏业趋势不断变化的背景下,中国电信天翼 智库⼤模型研究团队⻓期跟踪⼤模型技术的最新进展,把握⾏业脉动 并预测未来发展⽅向,展开了深⼊、系统的⼤模型技术产业趋势、影 响和策略研究,取得了⼤量原创性成果。他们以这些成果为主体,完 成了本书的写作。我相信本书的出版,有助于读者更加准确地把握⼤ 模型技术产业发展趋势和深远影响,更加深刻地理解如何将⼤模型技 术作为推动产业创新的关键动⼒,更加主动地去适应⼤模型带来的重 ⼤变化,在波澜壮阔的智能化时代成就更好的⾃⼰! 邵⼴禄 2024年5⽉于北京
Page
6
前⾔ 为何写作本书 在⼈类智慧的璀璨星河中,⼈⼯智能(AI)技术犹如⼀颗冉冉升起的 新星,照亮了科技的未知领域。以ChatGPT为代表的⼤模型,为通⽤ ⼈⼯智能的进步开辟了新路径,被誉为⼈⼯智能王冠上的明珠,它以 独特的光辉引领着新⼀轮的技术⾰新浪潮。美国微软公司创始⼈⽐尔· 盖茨表示,ChatGPT诞⽣的意义不亚于互联⽹的出现。 我们已迈⼊⼀个新的时代——⼤模型时代。要更好地拥抱这个时代, 我们⾸先要深刻地认识这个时代。 ⼤模型是⼀个新的物种,还将继续快速进化。⼤模型的训练策略、参 数规模、训练数据和算⼒不断演进升级。如GPT-1的参数规模是1.17 亿,GPT-4的参数规模已经超过1万亿;Gemini 1.5 Pro模型能够稳定 地⽀持⾼达100万个Token的上下⽂。在技术推动下,⼤模型在内容理 解、内容⽣成、逻辑推理、记忆等⽅⾯的智能⽔平突⻜猛进地提⾼。 如Sora可以根据⽂本提示创建最⻓60s的视频,可以深度理解与模拟 真实物理世界;GPT-4在多项能⼒测试中达到了⼈类专家的⽔平,在 处理复杂问题和提供创新解决⽅案⽅⾯展现出巨⼤的潜⼒。 在技术和政策驱动下,⼤模型产业快速发展壮⼤。国家⼤⼒⽀持通⽤ ⼈⼯智能和⼤模型的发展,各地纷纷出台相关政策,加快⼤模型产业 发展。⼤模型企业、云⼚商、互联⽹企业、电信运营商纷纷布局⼤模 型赛道,截⾄2024年3⽉28⽇,在国家互联⽹信息办公室备案的⼤模 型达到117个。⼤模型产业体系更加完整健壮,⾯向GPU、智算中⼼、 数据集、基础⼤模型、⼤模型平台和⼤模型应⽤等主要环节的企业快 速兴起,MaaS(模型即服务)模式成为主流,AI产业规模快速扩⼤。
Page
7
⼤模型带来的颠覆式影响才刚刚开始。⼤模型的颠覆式影响主要来⾃ 它对⼈类智⼒的替代甚⾄超越。⼀⽅⾯,它会给社会治理、产业发展 和⼈类⽣活带来⾰命性的变化。⽬前,⼤模型已经在⾦融、传媒、教 育、软件等知识密集度⾼的⾏业得到应⽤,能够⼤幅提⾼⼯作效率, 降低成本。未来,随着AI Agent的发展和普及,以⼤模型作为⼤脑的 智能机器⼈、智能汽⻋将在很多⽅⾯减少⼈类⼲预。另⼀⽅⾯,它会 给我们带来很⼤的不确定性甚⾄恐慌,给隐私保护、知识产权保护、 伦理等带来严峻挑战。 越来越多的⼈、企业和政府部⻔正在了解或应⽤⼤模型。在当前阶 段,⼀本内容全⾯、观点客观、分析深⼊的⼤模型书籍对于推动⼈类 认知、技术创新和产业升级具有极其重要的价值。笔者期望通过这本 书,激发更⼴泛的讨论和思考,以促进⼤模型技术朝着更有益于⼈类 社会的⽅向发展。正如斯图尔特·罗素在《⼈⼯智能:现代⽅法(第4 版)》⼀书中所阐述的,AI是⼀个覆盖⼴泛领域、持续进化的学科, 它要求我们从多⻆度进⾏探索和理解。基于这样的理念,本书⼒图成 为连接过去与未来、理论与实践、专家与公众的桥梁,为读者提供⼀ 种全新的理解和思考⽅式。 本书主要内容 本书共分为8章,全⾯介绍了⼤模型技术的发展历程、核⼼技术、⾏ 业应⽤、产业体系、治理问题以及未来展望。 第1章从AI的起源和发展讲起,探讨了AI的本质和演变过程。我们从⼈ 类早期智慧的模仿开始,逐步深⼊到AI 1.0的规则驱动和数据驱动,再 到AI 2.0的决策式AI和⽣成式AI,直⾄AI 3.0⼤模型引领的认知智能崛 起,以及AI 4.0通⽤⼈⼯智能和硅基⽣命的探讨。 第2章深⼊解析了⼤模型的核⼼技术,包括Transformer架构、模型微 调、基于⼈类反馈的强化学习等,这些技术是⼤模型能够实现智能学 习、性能优化、⽣成符合⼈类偏好结果的关键。
Page
8
第3章讨论了⼤模型的基础设施建设,包括算⼒和数据基础设施。算 ⼒基础设施如智算集群、智算中⼼、⼤模型⼀体机以及量⼦数据中 ⼼,为⼤模型提供了强⼤的计算⽀持。数据基础设施则涵盖了数据采 集、标注、合成以及向量数据库构建,为⼤模型提供了丰富的知识来 源。 第4~6章分别从基座模型、⾏业应⽤、产业体系等⻆度,详细阐述了 ⼤模型技术在不同领域的应⽤实践和商业模式。 第7章聚焦于⼤模型的治理问题,探讨了⻛险管理、治理体系和发展 趋势。 第8章对⼤模型时代的社会图景进⾏了展望,包括智能经济、社会治 理、科技创新等⽅⾯。我们预⻅到AI将成为新质⽣产⼒的核⼼引擎, ⼤幅提升社会治理能⼒,带来科研新范式,以及加快升级AI治理体 系。 此外,虽然⽬前⼤模型技术及产业正迎来发展热潮,但未来仍然⾯临 诸多问题,如对算⼒的巨⼤需求、数据隐私与安全性的严峻考验、模 型输出的可靠性问题、技术可控性的难题,以及多模态能⼒的提升 等。 本书旨在通过精⼼组织的内容,从技术、商业和产业层⾯为读者提供 深⼊的分析框架和洞察视⻆,并提出切实可⾏的应对策略,以帮助读 者全⾯理解⼤模型技术带来的挑战与机遇。在技术创新层⾯,从基础 架构和算法原理出发,逐步深⼊到实际应⽤场景。在商业应⽤⽅⾯, 通过⾏业案例分析和洞察,揭示⼤模型技术的商业潜⼒和对垂直⾏业 的深远影响。在产业变⾰层⾯,探讨⼤模型技术如何推动产业转型、 促进⾼质量发展,并预测其对未来社会、经济发展的影响。 本书特⾊
Page
9
本书的亮点在于跨学科的视⻆,结合了技术、商业、产业、政策、治 理多个⽅⾯,为读者提供了⼀个多维度的⼤模型技术全景。与同类书 籍相⽐,本书的特⾊体现在以下3点。 ⼀是实战与理论结合,提供丰富的案例研究和深度分析,帮助读者将 理论知识应⽤于实践。 ⼆是前瞻性视⻆,不仅总结现状,更提供对未来技术⾛向和市场趋势 的预测。 三是易读性,采⽤通俗易懂的语⾔,使⾮专业读者也能够理解和掌握 复杂的技术概念。 本书读者对象 本书适合以下⼏类读者阅读。 ・企业家和商业决策制定者:本书可以帮助他们获得对⼤模型技术商 业化应⽤的洞⻅,帮助企业把握市场机遇,制定发展战略。 ・政策制定者和监管机构⼈员:本书可以帮助他们了解⼤模型技术的 社会影响和治理问题,为制定相关政策和法规提供参考。 ・⼴⼤AI技术爱好者:本书可以帮助他们获得对AI技术尤其是⼤模型 技术的全⾯认识,满⾜个⼈的学习和兴趣需求。 ・AI技术从业者和研究⼈员:本书可以帮助他们深⼊了解⼤模型技术 的原理、应⽤和发展趋势,提升专业能⼒和研究深度。 勘误 在本书写作和出版过程中难免会有疏漏之处,读者可以通过电⼦邮件 cuilp@chinatelecom.cn或公众号“天翼智库”进⾏反馈,笔者将及时
Page
10
更新勘误信息。 致谢 在本书写作过程中,得到了中国电信集团、中国电信研究院各级领导 的关⼼与⽀持,许多同⾏、专家、学者以及出版社编辑也对本书的出 版做出了贡献,在此,向他们表示最诚挚的感谢。 最后,期待得到⼴⼤读者的宝贵意⻅和建议,让我们⼀起深⼊学习与 了解⼤模型技术,共同推动⼤模型技术的发展与应⽤,携⼿迎接美好 的智能社会的到来。
Page
11
第1章 全⾯认识AI:AI能否超越⼈类智慧 我们即将启程,开启⼀段关于⼈⼯智能(AI)与⼈类智慧相互关联和 差异性的探索之旅。本章将追溯智慧的起源,从⼈类对⾃然界的初步 模仿,到AI在现代科技中的⾃主创造与创新。在历史的洪流中,智慧 的⽕花愈发璀璨。我们将深⼊分析AI的演进历程,从基础的规则驱动 的逻辑处理,到⽬前以数据为核⼼的智能化处理,再到具备⾼级决策 与⽣成能⼒的复杂系统。本章将重点讨论AI在模拟⼈类认知过程中的 显著进展,并探讨其在⾃我意识等认知科学领域的挑战与潜⼒。同 时,本章还将展望AI的未来,探讨其是否有潜⼒达到或超越⼈类的认 知界限,甚⾄发展成为具有硅基⽣命特征的全新实体。在这段旅程 中,让我们共同揭开智慧的神秘⾯纱,洞悉AI的⽆限潜能与未来⽅ 向。
Page
12
1.1 智慧的本质:创造 1.1.1 ⼈类早期智慧源⾃模仿 在⼈类早期历史中,智慧源于对⾃然界的深度观察和模仿。这⼀时期 没有确切的历史记录。但据考古学家推测,⼤约在250万年前,古⼈类 已经开始使⽤最原始的⽯器。例如,在东⾮地区发现的奥杜威遗址 中,出⼟的⽯器展示了早期⼈类如何模仿⾃然,并开始学习利⽤⾃然 资源。这种模仿虽然简单,但标志着智慧之旅的起点,展现了⼈类理 解并应⽤⾃然规律的初步尝试。 在⽯器时代,⼈类创造的曙光开始逐渐显现。新⽯器时代的到来标志 着⼈类从简单模仿向创造性发展的重要转变。⼤约在公元前1万年,随 着末次冰期的结束,⼈类开始定居并形成了初步的社会结构和农业活 动。在这个时期,⼈类不仅制作更精细的⽯器,还开始制作陶器。例 如,在中国的仰韶⽂化中,彩陶不仅体现了技术上的进步,还是艺术 与审美发展的⻅证。这些创造性活动展现了⼈类智慧的本质:不满⾜ 于现状,⽽是不断探索和创新。 ⻘铜时代与铁器时代标志着⼈类技术与思维的⻜跃。⻘铜时代始于公 元前3000年左右,这⼀时期⼈类⾸次使⽤⾦属制作⼯具和武器。这⼀ 重⼤创新显著提升了⼯具的效能和持久性。⻘铜的使⽤最初在中东地 区普及,例如,古巴⽐伦的铭⽂和⼯艺品展示了⻘铜技术的⾼度发 展。紧随其后的铁器时代始于公元前1200年左右,铁器的出现让⼯具 和武器更加坚固。在这⼀时期,⼈类不仅仅模仿⾃然,更是创造了超 越⾃然的⼯具和武器,成为智慧旅程中的⼀座重要⾥程碑。 在⼯业⾰命时代,⼈类对创新和改进的追求达到了⼀个新⾼度。在这 ⼀时期,英国成为技术⾰新的中⼼,涌现出了约翰·凯的⻜梭、詹姆斯 ·哈格⾥夫斯的珍妮机,以及理查德·阿克赖特的⽔⼒纺纱机等⼀系列
Page
13
⾰命性发明。这些发明不仅代表了技术上的巨⼤⻜跃,更是⼈类对更 ⾼效、更便捷⽣产⽅式的深切渴望和不懈探索的具体体现。创新和改 进的持续追求成为推动社会进步的核⼼动⼒,不仅引领了⼯业⽣产的 新纪元,也为后续的技术进步和产业转型奠定了坚实的基础,展现了 ⼈类适应和引领变化的能⼒,成为推动历史⻋轮向前的永恒动⼒。 1.1.2 智慧的升级:改变与创造 在信息时代,⼈类的智慧与创造开始⽆限扩展。尤其是20世纪,这⼀ 时代的标志性事件和发明,如1947年⻉尔实验室发明的晶体管,为现 代电⼦设备的发展奠定了基础。此后,计算机和互联⽹的发展彻底改 变了全球的信息流动⽅式。阿兰·图灵在计算机科学领域的贡献以及蒂 姆·伯纳斯-李在1989年发明的万维⽹,不仅改变了⼈类的沟通⽅式, 更极⼤地促进了知识的传播和共享。信息时代的创新和进步再次证明 了⼈类智慧的本质:永远不满⾜于现有成就,⽽是不断追求新的知识 和技术。 在科技时代,⼈类迎来了智慧与创造的新篇章。21世纪的科技发展展 示了⼈类智慧之旅的新⾼峰。例如,⼈类基因组计划在2003年完成, 这象征着⽣物科学领域的⼀次重⼤突破,并为未来的医学研究和治疗 开辟了新的路径。同时,⼈⼯智能也取得了显著成就,例如⾕歌的 AlphaGo于2016年击败世界围棋冠军,标志着机器学习和⼈⼯智能技 术进⼊⼀个新的⾥程碑。在能源领域,太阳能和⻛能等可再⽣能源技 术的⼤规模应⽤,不仅解决了现有的能源危机,也为未来的可持续发 展铺平了道路。这些科技进步充分展示了⼈类智慧的本质——创造 ⼒。 如图1-1所示,回顾⼈类从古⾄今的智慧之旅,我们可以清晰地看到历 史的每⼀个阶段。从初期的模仿⾃然,到创造适应环境的⼯具,再到 今天对信息和技术的深⼊探索,每⼀阶段的创新和发展都体现了对环 境和条件的深刻理解与转化。这⼀历程不仅验证了“⼈类智慧从模仿到
Page
14
创造”的观点,也展示了智慧通过不断探索和超越,推动⼈类⽂明进步 的过程。智慧的本质在于不断探索未知,超越已知,并创造新的可能 性。 图1-1 ⼈类智慧之旅 在深⼊探讨智慧的本质时,我们必须认识到,智慧既是基于神经器官 的⼀种⾼级综合能⼒,也是⼀种融合认知、反省和情感的⼈格特质。 这种双重性质使智慧成为⼈类最为独特和复杂的特征之⼀。 通过深⼊探讨智慧的本质,我们可以更好地理解⼈类如何通过创新和 探索来推动⽂明的进步。正如⼈类智慧发展历程所示,从模仿⾃然到 创造新技术,每⼀步都是对世界的深刻理解和适应的结果。现在,我 们⾯临新的挑战:如何将智慧的精髓融⼊机器中,使其能够更⾼效、 更智能地思考和解决问题?
Page
15
1.2 AI的4个发展阶段 如果将AI技术的发展与智能化⽔平进⾏映射,我们可以将其划分为4个 发展阶段。AI 1.0阶段对应于20世纪70年代的计算智能。在这⼀时期, AI主要依赖预设的规则来执⾏任务,其功能表现出限制性和缺乏灵活 性。该阶段体现了早期计算机科学的成就,同时也暴露了⾼度依赖⼈ 类编程的问题。AI 2.0阶段对应于20世纪的感知智能,决策式和⽣成 式AI兴起。AI开始通过机器学习算法,让机器具备了基本的感知能⼒, 例如语⾳和图像识别。这⼀进步扩⼤了AI在⾃动驾驶、医疗诊断等多 个场景中的应⽤。AI 3.0阶段以⼤模型为标志,引领了认知智能的崛 起。21世纪20年代,AI开始能够处理和理解⼤量数据,实现知识表达 和逻辑推理,从⽽在某些领域达到甚⾄超越⼈类的认知⽔平。例如, GPT-4等⼤模型展示了强⼤的语⾔理解和⽣成能⼒,能够⾃主学习并 解决复杂问题。AI 4.0阶段预示着通⽤⼈⼯智能(AGI)的到来,标志 着⾃主智能阶段即将到来。在这⼀阶段,AI将能够在没有⼈类⼲预的 情况下,⾃主地进⾏决策、学习和适应环境变化,具备⾃我驱动和⾃ 我进化的能⼒,实现⾃主智能。 ⽬前,AI已进⼊以⼤模型为标志的3.0阶段,经历了第三次技术升级, 迈⼊了“认知智能”新阶段。据此展望未来,随着“认知智能”的深⼊发 展,AI即将迎来第四次⾰命性的技术升级——⾃主智能,详情如图1-2 所示。 ・计算智能:涉及机器的超强存储能⼒和超快计算能⼒。机器基于海 量数据进⾏深度学习,以历史经验指导当前环境进⾏决策与⾏动。例 如,AlphaGo采⽤增强学习技术战胜世界围棋冠军,电商平台根据⽤ 户购买习惯进⾏个性化商品推荐。 ・感知智能:涉及机器视觉、听觉、触觉等感知能⼒。机器可以将⾮ 结构化数据结构化,并以⼈类的沟通⽅式与⽤户互动,例如,⽆⼈驾
Page
16
驶汽⻋和著名的波⼠顿动⼒机器⼈就实现了感知智能,通过各种传感 器感知周围环境,并据此处理信息,有效指导⾏动。 ・认知智能:指机器具有⼈类的理解能⼒、归纳能⼒和推理能⼒,能 够运⽤知识。在理解、推荐、预测、交互等认知需求中,机器通过多 模态学习从各种数据中提取信息,增强理解能⼒。机器通过知识融 合、知识表示与推理、认知规划和决策,实现复杂认知任务处理,并 找到问题的最优解。情感计算、⽣成式AI等核⼼技术也在提升机器对 多维数据的理解能⼒。 图1-2 AI发展阶段 ・⾃主智能:被视为“更⾼级别的超级⼈⼯智能”,能⾃我学习、⾃我 适应并独⽴完成任务。实现⾃主智能需要AI系统具有较⾼的⾃我优化 和⾃我学习能⼒,甚⾄可以在⽆⼈⼲预的情况下⾃我改进。⽬前,⾃ 主智能还处于研究和探索阶段,尚未在实际中应⽤。
Page
17
从⽬前的发展阶段来看,随着AI技术的发展、认知智能产业格局的演 变以及市场需求的变化,智能预测、辅助决策和智能推荐等认知应⽤ 在医疗、⾦融、制造和教育等⾏业得到了更深⼊的应⽤。认知智能在 各⾏业中的⼴泛应⽤,已成为⾏业智能化转型升级的重要引擎和动 ⼒。 从未来10年看,认知智能并⾮AI应⽤的最终阶段。AI将从以下3个⽅⾯ 向更具“意识”的⽅向发展,逐步演化为⾃主智能。 ・多模态⼤模型将发挥出更加强⼤的认知能⼒,深⼊整合⾏业应⽤。 ・可解释的认知智能将增强技术的可信赖度。 ・类脑智能将推动认知智能向意识智能⽅向发展。 ⾃主智能的发展路径开始于学习单⼀任务,逐渐实现举⼀反三,最终 达到与环境进⾏动态交互的主动学习,实现⾃我进化。当前,我们可 以通过迁移学习、元学习和⾃主学习等技术寻找实现⾃主智能的可⾏ 路径。⽬前,仅依靠计算或统计模型尚难以在极其复杂的场景中实现 完全的智能。 ⾃主智能展示了向更复杂和更先进的智能系统的发展,我们⾃然也会 猜想它可能以何种⽅式实现。2023年11⽉,据业内⼈⼠透露,OpenAI 正在训练名为“Q*”(读作“Q-star”)的下⼀代⼈⼯智能。据称,这可 能是第⼀次采⽤“从零开始”的⽅式进⾏训练的AI,它能够修改⾃身代 码,以完成更复杂的学习任务。虽然Q*⽬前仅能解决⼩学级别的数学 问题,但考虑到虚拟环境中AI的迭代速度,有可能在不远的将来发展 出在各个领域均超过⼈类⽔平的智能。 OpenAI预测,能在各⽅⾯超越⼈类⽔平的超级⼈⼯智能可能在10年内 出现。⼀旦实现,这种超级⼈⼯智能将被⽤于解决多种复杂的科学问 题,例如寻找外星⼈和地球外宜居星系、⼈⼯核聚变控制、纳⽶或超 导材料筛选、抗癌药物的研发等。这些问题通常需要⼈类研究员花费
Page
18
数⼗年时间寻找新的解决⽅案,⽽某些前沿领域的研究量已经超过⼈ ⼒极限。在虚拟世界中,超级⼈⼯智能拥有⼏乎⽆限的时间和精⼒, 在部分容易虚拟化的任务中这可能使其成为⼈类研究员的替代者。然 ⽽,如何监督这些在智能⽔平上超越⼈类的AI,确保它们不会危害⼈ 类,将是⼀个值得深思的问题。
Page
19
1.3 AI 1.0:规则驱动到数据驱动 1.3.1 规则驱动:如何帮助机器思考 1950年,图灵发表了论⽂“计算机器与智 能”(Computing Machinery and Intelligence),提出并探讨了“机 器能否思考”这⼀关键问题。 论⽂中,图灵详细介绍了⼀种称为“模仿游戏”(Imitation Game)的 测试⽅法,即后来我们熟知的“图灵测试”。根据《艾伦·图灵传》的 介绍,图灵设想了这样⼀个游戏:在⼀个房间⾥有⼀男⼀⼥,房间外 的⼈向⾥⾯的⼈提问,两⼈只能通过书⾯形式回答。随后,房间外的 ⼈需要猜测哪位回答者是⼥性。在这个测试中,男性可以尝试欺骗猜 测者,让对⽅认为⾃⼰是⼥性,⽽⼥性则需努⼒让猜测者相信⾃⼰是 ⼥性。将这⼀男⼀⼥换成⼈与计算机,如果猜测者⽆法仅凭回答判断 出哪个是⼈哪个是计算机,则可认为计算机具有⼈类智能。 1952年,图灵在⼀场BBC⼴播中提出了⼀个新的、更具体的思想:让 计算机来冒充⼈。如果能够让不⾜70%的⼈判断正确,即超过30%的 ⼈误认为与⾃⼰对话的是⼈⽽⾮计算机,那么可以认为计算机具有⼈ 类智慧。 4年后,在美国汉诺斯⼩镇宁静的达特茅斯学院,约翰·⻨卡锡、⻢⽂ ·闵斯基、克劳德·⾹农等学者聚⾸⼀堂,共同探讨机器模拟智能的⼀ 系列问题。他们讨论了很久,虽未达成⼀致意⻅,但给讨论的内容命 名为“⼈⼯智能”。从此,“⼈⼯智能”(Artificial Intelligence, AI)这 ⼀术语开始进⼊公众视野。⼈⼯智能的元年被定为1956年。 20世纪50年代,AI技术的初步尝试确实遇到了瓶颈,主要表现在缺乏 灵活性和泛化能⼒上。这⼀时期的AI系统,例如约翰·⻨卡锡于1956
Page
20
年开发的逻辑理论家(LT)程序,标志着AI领域的早期探索。这些系 统被设计成能在特定任务或问题解决场景中发挥作⽤,被赋予了特定 的规则。以LT程序为例,它旨在证明数学定理,能模拟数学家的推理 过程,解决⼀些数学问题。 然⽽,这些早期的AI系统存在⼀个根本性限制:它们完全依赖于预设 的规则。这意味着,如果⾯对的问题或环境不在预设规则范围内,这 些系统就会显得⽆能为⼒。它们缺乏⾃适应能⼒,⽆法处理未知情况 或解决新颖的问题。该问题在当时的AI研究中⾮常普遍,导致AI技术 的应⽤范围极为有限。⼀个典型的例⼦是,早期AI系统在下棋等特定 领域取得了突出成就,这是因为下棋是⼀个规则明确且环境封闭的场 景,AI系统能通过预设的策略和计算来预测并反击对⼿的动作。然 ⽽,当这些系统应⽤于更复杂、动态和不确定的现实世界问题时,它 们的表现就⼤不相同。现实世界的不确定性和复杂性要求AI系统具备 更⾼级的理解、学习和适应能⼒。 这个时期的AI研究揭示了⼀个重要认识:仅依赖预设规则的AI系统, 其应⽤范围和效能将受到严重限制。这种认识促使研究者开始探索新 的⽅法和技术,随后机器学习技术的兴起开始突破这些规则的局限。 20世纪60⾄70年代,AI领域迎来了机器学习技术的兴起。这⼀转变的 标志性事件包括1967年最近邻算法(Nearest Neighbor Algorithm) 的提出以及1979年斯坦福⼤学的“斯坦福推⻋”项⽬。最近邻算法的提 出是机器学习发展历史上的⼀个重要时刻。这个算法的基本思想⼗分 直观:通过测量不同特征点之间的距离进⾏分类或回归。其最简单的 描述形式为,⼀个新的数据点类别会被分配为距离最近的那个训练数 据点的类别。这个算法在概念上⾮常简单,但开启了⼀种全新的思维 ⽅式——利⽤数据本身,⽽不仅仅是⼈为设定的规则进⾏决策和预 测。 “斯坦福推⻋”项⽬⼜被称为“斯坦福卡⻋”项⽬,是1979年由斯坦福⼤ 学的研究⼈员开发的。该项⽬旨在创建⼀个能够⾃主导航和避开障碍
The above is a preview of the first 20 pages. Register to read the complete e-book.
Comments 0
Loading comments...
Reply to Comment
Edit Comment