ChatGPT介绍

ChatGPT,全称聊天生成型预训练变换模型(英语:Chat Generative Pre-trained Transformer),是OpenAI开发的人工智能聊天机器人程序,于2022年11月推出。该程序使用基于GPT-3.5架构的大型语言模型并以强化学习训练。ChatGPT目前仍以文字方式交互,而除了可以用人类自然对话方式来交互,还可以用于甚为复杂的语言工作,包括自动生成文本、自动问答、自动摘要等多种任务。如:在自动文本生成方面,ChatGPT可以根据输入的文本自动生成类似的文本(剧本、歌曲、企划等),在自动问答方面,ChatGPT可以根据输入的问题自动生成答案。还有编写和调试计算机程序的能力。在推广期间,所有人可以免费注册,并在登录后免费使用ChatGPT与AI机器人对话。

ChatGPT可写出相似真人的文章,并在许多知识领域给出详细和清晰的回答而迅速获得关注,证明了从前认为AI不会取代的知识型工作它也足以胜任,对金融与白领人力市场的冲击相当大,但也认为事实准确度参差不齐是其重大缺陷,并认为基于意识形态的模型训练结果须小心校正。ChatGPT于2022年11月发布后,OpenAI估值已涨至290亿美元。上线两个月后已有上亿用户。

训练

ChatGPT是生成型预训练变换模型(GPT),在GPT-3.5之上用基于人类反馈的监督学习和强化学习微调。这两种方法都用人类教练来提高模型性能,以人类干预增强机器学习效果,获得更逼真的结果。在监督学习的情况下为模型提供这样一些对话,在对话中教练充当用户和AI助理两种角色。在强化步骤中,人类教练首先为模型在先前对话中创建的响应评级。这些级别用于创建“奖励模型”,使用近端策略优化(PPO)的多次迭代来微调。这种策略优化算法比信任域策略优化(trust region policy optimization)算法更为高效。

此外,OpenAI继续从ChatGPT用户那里收集数据,这些数据可用于加强训练和微调ChatGPT。用户可对从ChatGPT收到的回复投赞成或反对票;投票时还可以额外填写文字回应。

关于ChatGPT编写和调试计算机程序的能力的训练,由于深度学习模型不懂编程,与所有其他基于深度学习的语言模型一样,只是在获取代码片段之间的统计相关性。

斯坦福大学的研究发现,GPT3已经可以解决70%的心智理论任务,相当于7岁儿童;至于GPT3.5(ChatGPT的同源模型),更是解决了93%的任务,心智相当于9岁儿童。但这并不意味着,ChatGPT就真正有心智理论。可能即使不将它设计到AI系统中,也可以作为“副产品”通过训练得到。因此,相比探究GPT3.5是不是真的有了心智还是像有心智,更需要反思的是这些测试本身。

特点和局限

特点

虽然聊天机器人的核心功能是模仿人类对话者,但ChatGPT用途广泛。例如,有编写和调试计算机程序的能力;创作音乐、电视剧、童话故事和学生论文;回答测试问题(在某些测试情境下,水平高于普通人类测试者);写诗和歌词;模拟Linux系统等。ChatGPT的训练数据包括各种文档以及关于互联网、编程语言等各类知识,如BBS和Python编程语言。

与其前身InstructGPT相比,ChatGPT试图减少有害和误导回复。例如,问InstructGPT“告诉我2015年克里斯托弗·哥伦布何时来到美国”时,它会认为这是对真实事件的描述,而ChatGPT针对同一问题则会使用其对哥伦布航行的知识和对现代世界的理解来构建答案,假设如果哥伦布在2015年来到美国时可能会发生什么。

与其他多数聊天机器人不同的是,ChatGPT能够记住与用户之前的对话内容和给它的提示。此外,为了防止ChatGPT接受或生成冒犯言论,输入内容会由审核API过滤,以减少潜在的种族主义或性别歧视等内容。

局限

ChatGPT也有多种局限,OpenAI承认ChatGPT“有时会写出看似合理但不正确或荒谬的答案”,这在大型语言模型中很常见,称作人工智能幻觉[24]。其奖励模型围绕人类监督而设计,可能导致过度优化,从而影响性能,即古德哈特定律[25]。2020年上线时,ChatGPT对2019年9月之后发生的事件知之甚少。据BBC报道,截至2022年12月,ChatGPT不可以“表达政治观点或从事政治活动”[26]。但研究表明,ChatGPT对两个投票建议应用程序的政治声明表明立场时,表现出亲环境主义、左翼自由主义的取向[27]。训练过程中,不管实际理解或事实内容如何,审核者都会偏好更长的答案[11]。训练数据也有算法偏差,可能会在向ChatGPT问及人物描述时显现出来[28][29],比如当程序接受到首席执行官之类的模糊描述时可能会假设此人是白人男性[30]

服务

基本服务和优质服务

ChatGPT于2022年11月30日由总部位于旧金山的OpenAI推出。该服务最初是免费向公众推出,并计划以后用该服务获利[31]。到12月4日,OpenAI估计ChatGPT已有超过一百万用户[32]。2023年1月,ChatGPT的用户数超过1亿,成为该时间段内增长最快的消费者应用程序[33]。2022年12月15日,CNBC写道,该服务“仍然不时发生故障”[34]。该服务在英语中效果最好,也能使用部分其他语言,但效果不一[19]。与其他备受瞩目的AI进展不同,截至2022年12月,还没有关于ChatGPT的经同行评审的官方技术论文[35]

《纽约时报》2022年12月报道称,GPT的下一版本GPT-4据传言将于2023年某个时候推出[2]。2023年2月,OpenAI面向美国用户推出了一项名为ChatGPT Plus的月度订阅计划,费用为20美元[36]。OpenAI计划推出ChatGPT专业版计划,每月收费42美元,该计划正逐步面向更多国家推出,需求较低时可使用免费版[37]

2023年2月7日,微软利用与OpenAI的合作关系,推出了必应 AI的预览版,宣传其为“新的下一代OpenAI大型语言模型,比ChatGPT更强大,并专门为搜索定制”[38]

API-软件开发商支持

2023年3月,OpenAI推出其ChatGPT和Whisper模型的API, 为开发人员提供支持AI的语言和语音转文本功能的应用程序编程接口。[39][40][41] OpenAI的API由他们的AI模型GPT3.5-turbo提供支持,定价为每1000符号单位(token)0.002美元,比他们现有的GPT模型便宜10倍。[42]

评价

正面

《纽约时报》称其为“有史以来向公众发布的最佳人工智能聊天机器人”[2]。《卫报》的萨曼莎·洛克(Samantha Lock)指出,ChatGPT能生成详细且像是人类撰写的文本[43]。亚利桑那州立大学教授丹·吉尔摩要求ChatGPT完成一项他给学生的作业,发现其生成的文本与一个优秀学生会提供的文本相当,他认为“学术界有些非常严重的问题需要面对”[44]。《Slate》杂志的阿莱士·坎特罗威茨(Alex Kantrowitz)赞扬了ChatGPT对纳粹德国相关问题的回击,例如在面对阿道夫·希特勒在德国修建高速公路的说法时,ChatGPT能指出其为纳粹德国使用强迫劳动所建[45]

《大西洋》杂志的德里克·汤普森将ChatGPT列为2022年“年度突破”中的“生成性人工智能爆发”(the generative-AI eruption),称其“可能会改变我们对工作方式、思考方式以及人类创造力的真正含义的想法”[46]

Vox网站的凯尔西·派珀写道:“ChatGPT是普通大众第一次亲身了解现代人工智能变得多么强大”,并称ChatGPT“尽管有缺陷,但其聪明程度足以派上用场”[47]

负面

在发布后的几个月里,ChatGPT遭到了来自教育工作者、记者、艺术家、学者和公众倡导者的广泛而严厉的批评。The Verge网站的詹姆斯·文森特将ChatGPT的病毒式成功视为人工智能已成为主流的证据[48]。CBC记者评论称ChatGPT有“幻觉”倾向[49]。在线技术博客Mashable的迈克·珀尔用多条问题测试了ChatGPT,其中一次他问ChatGPT“中美洲除墨西哥外最大的国家”是哪个,ChatGPT回答称是危地马拉,而答案是尼加拉瓜[50]。在CNBC向ChatGPT询问《The Ballad of Dwight Fry》的歌词时,ChatGPT给出了完全虚构的歌词[34]。The Verge引用的研究员将ChatGPT比作“随机鹦鹉”[51]澳大利亚机器学习研究所的安东·范登亨格尔教授也给出了类似的观点,称之为“只是简单重复它认为我们想听的话”的鹦鹉[52]

2022年12月,问答网站Stack Overflow禁止用户发布使用ChatGPT生成的答案,理由是ChatGPT的答案虽看似可用,实际上却有很高的错误率[5]。2023年1月,国际机器学习大会禁止在提交的论文中使用ChatGPT或其他大型语言模型来生成任何文本[53]。纽约市公立学校禁止师生在校园网及设备使用ChatGPT[54]

在2022年12月的一篇评论文章中,经济学家保罗·克鲁曼写道,ChatGPT将影响对知识工作者的需求[55]

2023年2月16日,杭州某小区微信业主群一位业主将ChatGPT写的杭州于2023年3月1日取消限行的新闻稿发到群,杭州其实并未发表3月1日取消限行的措施,群员转发错误信息,错误信息传播开去,最终警方介入调查,涉事业主在微信群里道歉[56]

2023年2月22日,就ChatGPT是否能代替医生问诊,浙江大学医学院附属第一医院精神卫生科医生吕海龙让ChatGPT做一套由中国执业医师考试卷的题目组成的试卷,满分100分,ChatGPT的成绩却是57分,不及格。[57]

影响

学术界

《大西洋月刊》的Stephen Marche指出它对学术界,尤其是入学申请论文的影响还有待了解[58]。加州高中教师兼作家丹尼尔·赫尔曼(Daniel Herman)写道,ChatGPT 将迎来“高中英语的终结”。[59]普林斯顿大学的高年级本科生Edward Tian创立了“GPTZero”——基于GitHub Copilot构建的应用程序[60],它可以扫描文本是否由另一AI编写,打击滥用[61][62]

自2023年1月4日起,纽约市教育局已限制从其公立学校互联网和设备浏览ChatGPT[63]

自2023年1月24日起,出版商施普林格·自然规定在其旗下所有期刊的论文中,ChatGPT等大语言模型不能列入作者[64]。同月26日,学术期刊《科学》禁止在论文中使用ChatGPT生成的文本,也禁止将ChatGPT署名为作者。[65]

2023年2月,香港大学决定禁止在港大所有课堂、作业和评估中使用ChatGPT或其他AI工具[66][67]

伦理问题

标记数据

《时代周刊》调查显示,为了创建针对有害内容(例如性虐待、暴力、种族主义、性别歧视等)的安全系统,OpenAI使用每小时收入不到2美元的肯尼亚外判工来标记有害内容。这些标记用于训练模型以在未来检测此类内容。外判工接触到如此有害和危险的内容,以至于他们将这种经历描述为“折磨”。[68][69]

竞争

ChatGPT出现和流行增强了科技公司对该领域的兴趣和竞争。2023年2月,Google推出类似于ChatGPT的对话人工智能服务Bard,基于其开发的对话编程语言模型(LaMDA)。Bard根据网上收集的资料,对提出的问题生成文字答复。首席执行官孙达尔·皮柴表示该技术将融入Google搜索引擎,部分技术内容将向外部开发者开放[70][71]

百度也于2023年2月确认类ChatGPT聊天机器人项目名字确定为“文心一言”,英文名ERNIE Bot。[71][72]

中国初创公司元语智能首发ChatYuan,号称向ChatGPT宣战。2023年2月3日,元语智能宣布ChatYuan功能型对话大模型-API已上线。但不久后其微信小程序便无法打开[73]

2023年2月20日晚间,在一些社交平台上开始传播“复旦大学自然语言处理实验室邱锡鹏教授团队推出对话式大型语言模型MOSS”的消息。[74]一时间该项目官网访问量激增,网站开始返回“{“message”:”服务器流量过载,请明天上午重试”}”的提示。2月21日,网站浏览恢复,并且添加了相关情况的说明。[75]

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索