2023ChatGPT人工智能新纪元.docx
《2023ChatGPT人工智能新纪元.docx》由会员分享,可在线阅读,更多相关《2023ChatGPT人工智能新纪元.docx(122页珍藏版)》请在课桌文档上搜索。
1、ChatGPT人工智能新纪元内容简介ChatGPT爆火,标志着人工智能从量变到质变的飞跃,一场新的人工智能革命已经到来。本书共6章,介绍了ChatGPT的诞生和发展,以及ChatGPT背后的技术路线;分析了ChatGPT及大模型训练对全球商业格局的冲击与影响,涉及OPenAI、微软、谷歌、百度、腾讯、阿里巴巴等广受关注的互联网科技公司;选取了具有代表性的行业,解读ChatGPT狂潮引发的产业颠覆与模式创新。同时,本书对未来的强人工智能与人类社会的关系进行了深度研讨。从2022年末到了2023年初,ChatGPT火遍了全球互联网。2022年11月30日,OPenAl发布Al对话模型ChatGPT
2、。由于ChatGPT的能力过于惊艳,上线仅5天就吸引了100万名用户。推出两个月后,ChatGPT的月活跃用户就已经达到1亿人次,成为历史上用户数量增长最快的消费级应用。要知道,海外版抖音一TikTok在全球发布后,经过大约9个月的时间才达到月活1亿人次,Instagram达到这一量级则用了两年半的时间。ChatGPT之所以能够实现用户数量的爆发式增长,归根结底是ChatGPT超凡出众的产品能力成熟乃至惊人的理解和创作能力:除写代码、写剧本、词曲创作外,ChatGpT还可以与人类对答如流,并且充分体现出辩证分析能力。ChatGPT甚至能质疑不正确的前提和假设、主动承认错误及能力有限、主动拒绝不
3、合理的问题,这是前所未有的。更重要的是,ChatGPT的成功,证明了大模型技术路线的正确性。这意味着,人工智能(ArtiACialIntelligence,Al)终于从之前的大数据统计分类阶段,走向类人逻辑沟通阶段,并且人工智能在其强大的学习能力之下,进化速度将超出我们的预料。基于大模型技术路线,ChatGPT就像一个通用的任务助理,能够与不同行业结合,衍生出很多应用场景。可以说,ChatGPT为通用Al打开了一扇大门,真正让人工智能落了地。ChatGPT“一夜蹿红”,迅速在全球范围内掀起一股冲击波,引爆了中国、美国的人工智能产业,人工智能公司全面入局,并引发资本市场震荡。中国互联网科技公司纷
4、纷踏上了寻找“中国版ChatGPr之路,如百度的类ChatGPT应用、自然语言处理大模型项目“文心一言”,阿里巴巴处于内测阶段的阿里版聊天机器人等。除在科技行业与商业领域引起震动外,ChatGPT也在冲击着人类社会,ChatGPT能否取代人类”“ChatGPT伦理问题”等话题随之而热。其实,任何一项新技术,尤其是革命性技术的出现,都会引发争论。客观来看,人工智能时代来临是必然的趋势,只是ChatGPT让我们设想中的人工智能时代离我们更近了。ChatGPT的出现标志着人工智能从量变到质变的飞跃,一场新的人工智能革命到来本书正是基于此,介绍了ChatGPT的诞生和发展,以及ChatGPT背后的技术
5、路线;分析了ChatGPT及大模型训练对全球商业格局的冲击与影响,涉及OPenAI、微软、谷歌、百度、腾讯、阿里巴巴等广受关注的互联网科技公司;选取了具有代表性的行业,解读ChatGPT狂潮引发的产业颠覆与模式创新;对未来的强人工智能与人类社会的关系进行了深度研讨。本书力求用通俗易懂、富于趣味的语言进行表述,内容深入浅出、循序渐进,以帮助读者全方位了解ChatGPT,并在纷繁的信息中梳理人工智能的演变线索与发展思路。作为科技创新时代的标签,人工智能所引领的科技变革更是在雕刻着这个时代,我们需要有所准备。第1章ChatGPT,爆了1.l横空出世的ChatGPT从2022年末到2023年初,由OP
6、enAI公司打造的ChatGPT火遍了全球互联网,一跃成为人工智能(Al)领域的现象级应用。由于ChatGPT的能力过于惊艳,发布仅仅5天,注册用户数量就超过了100万,当年的脸书用了10个月才达到这个“里程碑”。根据瑞银的报告,2023年1月末,ChatGPT推出仅两个月,月活用户已经突破了1亿人次,成为史上用户量增长速度最快的消费级应用程序。那么,这个横空出世的ChatGPT究竟是什么?怎么突然就火了呢?1.1 1六边形AI战士ChatGPT是由OPenAI公司发布的最新一代的AI语言模型,是自然语言处理(NatUralLanguageProcessing,NLP)中一项引人瞩目的成果。这
7、款AI语言模型,与过去那些智能语音助手的回答模式有很大的不同ChatGPT呈现了出人意料的“聪明与当前市面上的一些人工智能客服相比较,ChatGPT跨越“人工娱乐”,真正触及了人工智能,具有了我们期待的模样。很多人形容它是一个真正的“六边形Al战士”不仅能聊天、搜索、翻译,撰写诗词、论文和代码也不在话下,还能开发小游戏、作答美国高考题,甚至能做科研、当医生等。国外媒体评论称,ChatGPT会成为科技行业的下一个颠覆者。GPT的英文全称为GeneratiVePre-trainedTransformer(生成式预训练转换器),是一种基于互联网可用数据训练的文本生成深度学习模型。ChatGPT“脱胎
8、”于OPenAI在2020年发布的GPT-3,任何外行都可以使用GPT-3,在几分钟内提供示例,并获得所需的文本输出。GPT3刚问世时也引起了轰动。它展示出了包括答题、翻译、写作,甚至是数学计算和编写代码等多种能力。由GPT-3所写的文章几乎达到了以假乱真的程度。在OPenAl的测试中,人类评估人员也很难将GPT-3生成的新闻与人类所写的新闻区分开。GPT-3被认为是当时最强大的语言模型,但现在,ChatGPT模型似乎更强大。ChatGPT能进行天马行空的长对话,可以回答问题,还能根据人们的要求撰写各种书面材料,如商业计划书、广告宣传材料、诗歌、笑话、计算机代码和电影剧本等。简单来说,Chat
9、GPT具备了类人的逻辑、思考与沟通的能力,并且它的沟通能力在一些领域表现得相当惊人,能与人进行堪比专家级的对话。ChatGPT还能进行文学创作。比如,给ChatGPT一个话题,它就可以写出小说框架。当用户让ChatGPT以“AI改变世界”为主题写一个小说框架时,ChatGPT清晰地给出了故事背景、主人公、故事情节和结局。如果一次没有写完,ChatGPT还能在“提醒”之下,继续写作,补充完整。ChatGPT已经具备了一定的记忆能力,能够进行连续对话。有用户在体验ChatGPT之后评价称,ChatGPT的语言组织能力、文本水平、逻辑能力,可以说已经令人感到惊艳了。甚至已经有用户打算把日报、周报、总
10、结这些文字工作,都交给ChatGPT来辅助完成。普通的文本创作只是最基本的。ChatGPT还能给程序员编写的代码找Bug。一些程序员在试用后表示,ChatGPT针对他们的技术问题提供了非常详细的解决方案,比一些搜索软件的回答还要靠谱。美国代码托管平台RePlit首席执行官AmjadMaSad在推特发文称,ChatGPT是一个优秀的“调试伙伴”,它不仅解释了错误,而且能够修复错误,并解释修复方法”。在商业逻辑方面,ChatGPT不仅非常了解自己的优劣势,可以为自己进行竞品分析、撰写营销报告,就连世界经济形势也“了如指掌”,能答出自己的见解。ChatGPT还敢于质疑不正确的前提和假设,主动承认错误
11、以及一些无法回答的问题,主动拒绝不合理的问题,提升了对用户意图的理解,提高了答题的准确性。1.1.2 ChatGPT并不完美虽然ChatGpT模型与GpT-3模型相比,性能提高了一个层次,但ChatGPT依然有不完美的地方。实际上,ChatGPT和GPT-3类似人类的输出和惊人的通用性只是优秀技术的结果,而不是真正的“聪明”。不管是过去的GPT-3还是现在的ChatGPT,都会犯一些可笑的错误,尤其是文化常识问题、数学计算题等。而且,ChatGPT的回答往往是大段的,过于冗长,看似逻辑自治,但有时却是一本正经地“忽悠L这也是此类方法难以避免的弊端,因为它在本质上只是通过概率最大化不断生成数据而
12、已,而不是通过逻辑推理来生成回复。虽然这种创编在有些领域可能非常有用,很多游戏开发者、科幻小说家、美术工作者就经常用Al来启发自己的思路,但这对于需要准确回答具体问题的应用场景来说却是硬伤。如果非专业人士无法分辨ChatGPT的答案的准确性,极有可能会被严重误导。可以想象,一台内容创作成本接近于零,正确率约80%,对非专业人士的迷惑程度接近1()0%的巨型机器,用人类写作者百万倍的产出速度接管所有的百科全书编撰工作,回答所有的知乎问题,这对人们认知的危害将是巨大的。为此,ChatGPT也遭到了一些机构的封禁。比如,StackOverflow(一个与程序相关的IT技术问答网站)暂时封禁ChatG
13、PT的原因很简单,因为它生成的答案正确率太低,发布由ChatGPT创建的答案对网站和查询正确答案的用户来说是有害的。顶级人工智能会议也开始禁止使用ChatGPT和Al工具撰写学术论文。国际机器学习会议ICML认为,ChatGPT这类语言模型虽然代表了一种发展趋势,但随之而来的是一些意想不到的后果以及难以解决的问题。ICML表示,ChatGPT接受公共数据的训练,这些数据通常是在未经同意的情况下收集的,出了问题难以找到负责的对象。ChatGPT除提供的结果不够准确外,还无法引用信息来源;它几乎不知道2021年以后发生的事情。虽然它提供的结果通常足够流畅,在高中甚至大学课堂上可以过关,但无法像人类
14、专家的表述那样,做到字斟句酌。人们似乎对智能的标准很低。如果某样东西看起来很聪明,我们就很容易自欺欺人地认为它是聪明的。ChatGPT和GPT-3在这方面是一个巨大的飞跃,但它们仍然是人类制造出来的工具。由于当前的ChatGPT只是基于2021年及之前的数据进行训练的,加之使用的范围不大,存在一些知识盲区,或者是会出现一些对话的笑话,这也在情理之中。但是随着大规模的用户对话训练,以及大规模的数据更新,ChatGPT将会以超出我们想象的速度进化。1.1.3 2023年的决定性技术六边形也好,不完美也罢,作为人工智能领域的现象级应用,ChatGPT已经登上了历史舞台,开始进入甚至影响人们的生活。从
15、硅谷科技巨头,到一二级资本市场,对其感兴趣的人都在讨论ChatGPT及Al技术的未来发展及所带来的影响。其实,ChatGPT上线之初,主要还是在AI行业和科技行业引起反响。2023年春节后,其热度持续升温;2023年2月,关于ChatGPT的重要消息明显增多。人们发现ChatGPT可以轻松撰写文案、代码,涉猎历史、文化、科技等诸多领域,甚至通过了谷歌年薪为18.3万美元的编码三级工程师岗位面试。互联网上铺天盖地都是关于ChatGPT的信息。瑞银集团发布的报告显示:2023年1月,ChatGPT平均每天有约1300万名独立访客,这一数量是2022年12月的两倍。截至2023年1月末,ChatGP
16、T月活用户已突破1亿人次。ChatGPT创造了新的用户增长速度纪录相比之下,也曾被称为火爆的InStagram,达到1亿的用户数用时两年半。2023年2月2日,微软宣布旗下所有产品全线整合ChatGPT。2月8日,由ChatGPT支持的新版Bing(必应)搜索引擎上线;3月,百度已提交注册ChatflOW等多个商标;英国自然杂志不再支持AI工具列为作者的论文;数字媒体公司BUZZfeed计划使用OPenAI的Al技术来协助创作个性化内容;美国宾夕法尼亚大学称ChatGPT能够通过该校工商管理硕士专业课程的期末考试;OPenAl宣布开发了一款名为“AITextClaSSi缶尸的鉴别工具,目的是帮
17、助用户分辨文字是否由ChatGPTAl等生成。从资本市场来看,ChatGPT的火爆推动了AI相关公司股价上涨。春节后的中国A股开市第一周,ChatGPT.AIGC等概念表现活跃,相关个股连续上涨。Wind数据显示:2月3日,ChatGPT指数上涨5.56%,周涨幅达30.18%。领涨的概念股包括赛为智能、海天瑞声、云从科技、初灵信息和汉王科技等,周涨幅高达60%70%如汉王科技,尽管此前预告其2022年的净利润预计为-1.4亿元至-9800万元,但借着ChatGPT的概念,依旧不妨碍其出现连续涨停。一些上市公司积极回复投资者在相关领域的布局,如捷成股份表示,公司参股子公司世优科技的虚拟数字人(
18、以下简称“数字人”)已经接入ChatGPT,通过数字人的人设背景等相关数据集,并基于OPenAl训练数字人专有大脑形成个性化模型。百度宣布在3月召开围绕“文心一言”的新闻发布会,阿里巴巴达摩院称正在研发类ChatGPT的产品。据测算,基于1亿名用户,以每月20美元计算,ChatGPT年收入将超过200亿美元。经估算,ChatGPT在全球有超过10亿名的潜在用户,市场规模将超过2000亿美元。ChatGPT的收费模式如能成功,对于投资者而言,将是巨大的利润前景。如今,与ChatGPT概念相关的公司众多。据CBInSightS统计,ChatGPT概念领域目前约有250家初创公司,其中51%的融资进
19、度在A轮或天使轮。2022年,ChatGPT和生成式Al(AlGC)领域“吸金”超过26亿美元,共诞生6家独角兽企业,估值最高的就是290亿美元的OPenAI。2023年2月10日,比尔盖茨在接受采访时表示,像ChatGPT这样的人工智能的兴起,与互联网的诞生或个人计算机的发展一样重要。不同于元宇宙出现时带来的概念炒作狂潮,ChatGPT才出现两个月,已经引发了关于人类社会生产和生活的真正变革的话题潮,关键就在于这是一次人工智能技术真正走向智能化的突破与应用。1.2 ChatGPT是如何炼成的ChatGPT看起来既强大又聪明,会创作,还会写代码。它在多个方面的能力都远远超过了人们的预期。那么,
20、ChatGPT的能力到底从何而来?1.2.2 出色的NLP模型强悍的功能背后,技术并不神秘。本质上,ChatGPT是一个出色的NLP新模型。说到NLP,大多数人先想到的是AIeXa和Siri这样的语音助手,因为NLP的基础功能就是让机器理解人类的输入,但这只是技术的冰山一角。NLP是人工智能(AD和机器学习(ML)的子集,专注于让计算机处理和理解人类语言。虽然语音是语言处理的一部分,但NLP最重要的进步在于它对书面文本的分析能力。ChatGPT是一种基于TranSfc)rmer模型的预训练语言模型。它通过庞大的文本语料库进行训练,学习自然语言的知识和语法规则。在被人们询问时,它通过对询问的分析
21、和理解,生成回答。TranSfOrmer模型提供了一种并行计算的方法,使得ChatGPT能够快速生成回答。TranSformeI模型又是什么呢?这就需要从NLP的技术发展历程来看,在TranSformer模型出现以前,NLP领域的主流模型是循环神经网络(RNN),再加入注意力机制(AttentiOn)。循环神经网络模型的优点是,能更好地处理有先后顺序的数据,如语言;而注意力机制就是让Al拥有理解上下文的能力。但是,“RNN+Attention”模型会让整个模型的处理速度变得非常慢,因为RNN是一个词接一个词进行处理的,并且,在处理较长序列,如长文章、书籍时,存在模型不稳定或者模型过早停止有效训
22、练的问题。2017年,谷歌大脑团队在神经信息处理系统大会上发表了一篇名为JAttentioniSAllYouNeed(自我注意力是你所需要的全部)的论文,该论文首次提出了基于自我注意力机制(Self-attention)的变换器(Transformer)模型,并首次将其用于NLP。相较于此前的RNN模型,2017年提出的TranSfOrmer模型能够同时进行数据计算和模型训练,训练时长更短,并且训练得出的模型可用语法解释,也就是模型具有可解释性。这个最初的TranSformer模型,一共有6500万个可调参数。谷歌大脑团队使用了多种公开的语言数据集来训练这个最初的TranSfOrmer模型。这
23、些语言数据集包括2014年英语一德语机器翻译研讨班(WMT)数据集(有450万组英德对应句组),2014年英语一法语机器翻译研讨班数据集(有3600万组英法对应句组),以及宾夕法尼亚大学树库语言数据集中的部分句组(分别取了库中来自华尔街日报的4万个句子,以及另外的1700万个句子)。而且,谷歌大脑团队在文中提供了模型的架构,任何人都可以用其搭建类似架构的模型,并结合自己手上的数据进行训练。经过训练后,这个最初的TmnSformer模型在翻译准确度、英语句子成分分析等各项评分上都达到了业内第一,成为当时最先进的大语言模型。ChatGPT使用了TranSformer模型的技术和思想,并在其基础上进
24、行扩展和改进,以更好地适用于语言生成任务。正是基于TranSfOrmer模型,ChatGPT才有了今天的成功。1.2.3 庞大的数据训练当然,单有语言模型没有数据,是“巧妇难为无米之炊”。因此,基于TranSformer模型,ChatGPT的开发者们开展了大量的数据训练。在ChatGPT出现以前,OPenAl已经推出了GPT-1、GPT-2、GPT-3。虽然前几代声量不大,但模型都是极大的。GPT-I具有1.17亿个参数,OPenAl使用了经典的大型书籍文本数据集进行模型预训练。该数据集包含超过7000本从未出版的书稿,涵盖冒险、奇幻等类别。在预训练之后,OPenAl针对问答、文本相似性评估、
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2023 ChatGPT 人工智能 新纪元
![提示](https://www.desk33.com/images/bang_tan.gif)
链接地址:https://www.desk33.com/p-954997.html