您的位置:首页 >综合 >

【世界时快讯】让ChatGPT长“手”!Meta爆火新论文,让语言模型学会自主用工具

2023-02-13 23:01:57    来源:量子位

鱼羊 Pine 发自 凹非寺


(相关资料图)

量子位 | 公众号 QbitAI

ChatGPT爆火,Meta也坐不住了。

微软和谷歌正在搜索引擎那边刺刀拼刺刀呢,谁想Meta冷不防抛出一篇新论文,顿时吸引全场目光:

瞄准ChatGPT的“软肋”,让大语言模型 自行学会了使用工具 !

简单来说,基于Meta的这个思路,ChatGPT这些大语言模型可以缺啥补啥:

不会算数,就自己掏出计算器计算;需要最新信息,就自己连接搜索引擎搜索……

是不是有点AI自己操作自己内味儿了?

论文一出,不少AI研究者就将其视作“ 过去几周里最重要的论文 ”。

这篇论文给人们打开了思路,让大语言模型未来可以成为所有事情的起点。

还有网友表示:我老婆原本不太关心AI,听说Meta这论文都惊了。普通人真的得好好想想这事儿了。

自学工具用法的大语言模型

这一回,Meta给这个会使工具的语言模型起名 Toolformer 。

Toolformer的内核逻辑,总结下来很简单,就是:

专业的任务交给专业的工具来做。

在生成文本的过程中,遇到特定的任务,Toolformer会直接调用所需工具的API。

比如说,在执行这个任务:1400名参与者,有400人通过了测试,占多大比例? (为了让ChatGPT掌握数学运算,OpenAI可没少折腾【加链接:ChatGPT连夜迭代:你老婆不好使了】)

Toolformer丝毫不慌,直接“掏出”计算器,现场计算得出结果: 29% 。

又或者说,想要备注个事情,只知道是周五,具体日期还不知道?

没关系,翻出日历查一下就好了。

甚至翻译任务也可以直接丢给它,各国语言都能够识别并翻译,直接省去了在软件切换语言的工夫。

除了这些工具之外,Toolformer还能够调用Q&A以及搜索引擎等工具。

这时,就已经有网友开始畅想未来了:

现在,ChatGPT版必应能帮你比较酒店价格,那未来有了Toolformer,预定性价比高的酒店岂不是也可以甩给AI去做了。

不过话说回来,Toolformer面对不同的任务都能行云流水般地调用对应的工具,它是怎么做到的呢?

一言以蔽之,Toolformer经过训练,能够在生成文本中插入API调用,直接将任务外包出去。

在这其中,训练的过程是以 自监督 的方式完成的。这意味着无需大量人类标注好的数据,Toolformer只需要少量演示就能学会调用API。

具体来说,先给Toolformer提供少量已经手动标注好的例子,然后让语言模型在实践中 生成一个更大的包含示例的数据集 。

这个过程主要分成三步:

首先是 取样 ,通俗点讲就是看输入的文本提示中,哪个地方需要调用哪种工具,然后直接将“调用的API”插入到对应的地方;

其次是 执行 ,执行上一步的“调用API”任务,将生成的文本直接插入进去;

最后是 过滤 ,上一步中工具生成的文本如果对输入文本来说用处不大的话,就可以直接pass掉,保留对文本有用的地方。

这样一来,基于这些有用的数据集,Toolformer便可以对预先训练好的大语言模型进行微调。

讲了这么多,Toolformer的真实效果到底如何,有没有一个横向的数据对比?

论文将Toolformer和多个其他大语言模型,包括GPT-J,OPT (66B) 以及GPT-3 (175B) 进行了对比,比较了它们在数学、Q&A以及机器翻译等方面的能力。

结果显示,在学习使用工具后,GPT-J的零样本学习性能的到了显著的提高。

△Toolformer:是在GPT- J上微调,并加强了CCNet子集中的API调用/ Toolformer (disabled):同上,但解码期间禁用API调用

并且在大多数任务上性能都有明显提高,在一些下游任务中Toolformer甚至已经超过了GPT-3。

“未来大语言模型发展的重要分支”

说到这里,不知道你怎么看这件事儿。

有不少网友是已经按捺不住,想着去拔AI电源了。

而引发更多讨论的,是这样一种观点:Toolformer可能是未来LLM(大语言模型)发展的一个重要分支。

大语言模型进化出使用工具的能力,知道应该在何时、使用何种工具来实现需求,也就意味着许多在今天还需要人类和AI协作完成的工作,未来AI都能自己搞定了。

比如现在还多少有些“人工智障”的语音助手,如果背后有ChatGPT+Toolformer的技术能力支撑,那么从挑选符合需求的餐厅,到直接订座,这一系列动作都可以被丝滑地串联起来。

又比如微软的必应搜索接入ChatGPT。如果这些大语言模型能充分调用各种API、使用UI,那它不仅能帮人们完成搜索,还能完全改变人们操作网页的方式——一切输入都可以化简为自然语言。

甚至,ChatGPT这样的模型,借助各种API重写自己的代码,也将成为可能。

事实上,让AI掌握工具的使用方法这个研究方向,也并不只有Meta在做。

比如谷歌即将嵌入到搜索中的 Bard ,背后模型LaMDA就内置了一套工具箱,包括计算器、翻译器和访问搜索引擎获取外部信息的接口。

还有开源项目 LangChain ,也致力于将大语言模型与外部的计算、知识来源相结合,以开发真正可用的应用程序。

而现在,Meta又使大模型对工具的使用“熟练度”、“自主性”,更上一层楼。

不过,也有网友指出,Toolformer所展现出的“自学”能力,还是一个初级、“狭义”的版本。

这些模型本身仍然是纯粹的函数:给定相同的输入(包括采样时的随机值),它将总是产生相同的输出。 有点像是在说,一个大语言模型能学会将特定领域的语言作为其自然语言的一部分,以此纳入来自外部工具的知识。

One More Thing

Meta新论文炸场,还挑动了人类的“反思”神经。

这不,新鲜梗图已经出炉:

人类在沉迷,而机器在学习。

论文地址: https://arxiv.org/abs/2302.04761 参考链接: [1] https://twitter.com/timo_schick/status/1624058382142345216 [2] https://twitter.com/mathemagic1an/status/1624870248221663232 [3] https://twitter.com/Tisoga/status/1624543837745192960

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

标签: 语言模型 搜索引擎 自然语言

相关阅读

精彩放送

还不上房贷能退房吗?新房可以退房的情形有哪些?

商品房退房要注意什么?购房者退房可否退还定金?

房产证办不下来怎么退房?买房后退房要什么流程?

投诉开发商能要回买房首付款吗?投诉开发商要去什么部门?

预售商品房退房要具备哪些条件?期房退房申请流程是什么?

期房停工可以申请退房吗?期房转现房有哪些手续?

期房退房流程及手续有哪些?期房出现哪些问题可以退房?

房子已经网签退房能退税吗?退房注意事项有哪些?

开发商延期交房有退房成功的吗?什么时候可以退房?

全款期房没备案退房手续麻烦吗?买房退房需要注意什么?

网签后退房违约金是多少?网签要注意什么?

期房已经网签备案了怎么退房?买房备案是什么意思?

期房退房方法有哪些?购买期房要注意什么?

房子贷款还3月了还能退房不?还贷中的房子怎么退房?

退房子找售楼处有什么技巧?交了首付后悔了能退吗?

公租房退租流程有哪些?租赁房屋有哪些注意事项?

买了房子想退房怎么办?买了房子想退房注意事项有哪些?

退房摇号的房子是否可以签合同?退房摇号的房子签合同注意什么?

房子付首付了可以退房吗?房子付首付了如何退房?

买完房想退房怎么办?买房退房违约金怎么扣?

一加 Ace 2首销37分钟打破天猫京东所有骁龙8+机型首销纪录

《亲测》印度希爱力双效片和艾力达双效片哪个效果更好?

永州消防一项发明获国家级大奖!灵感来自十年前,已参加上千次实战

兆禾能源成为独角兽企业

印度双效片有几种?印度双效片哪种副作用小?凯瑞斯坦超艾如何?

创新科技驱动睡眠新体验 “运动+睡眠”成未来健康新趋势

环球报道:汗斑用什么药膏好得快_汗斑用什么药膏好

这位市人大副主任被查,3天前还在参加民主生活会

新乳业:不法分子假冒公司名义诈骗,公司未上线任何理财类APP

小资生活进口美妆 打造特色多元化美妆加盟项目

世界速递!今年春运,长沙跻身十大热门城市,这一组数据为你揭秘

论文都是科技与狠活?ChatGPT为何引教育界“封杀”?

全球观天下!就在本周五!油价又要变,还会继续降?

【全球快播报】开学了 这些诈骗手法要警惕

当前快报:甘肃定西对彩礼“限高”,七成出嫁彩礼控制在5万内

速读:李培楠夺得中国首个《星际争霸2》世界冠军

每日关注!东莞7家经营单位因违规被处罚,涉食品公司、广告公司、口腔门诊部

不断前行的上海维娜化妆品,进步理念引领前进方向

丰网是什么快递公司,为电商提供有温度的快递服务

世界即时:多地“捐精”倡议背后:捐献通过率到底是多少?

加盟被骗,加盟费能退多少?

多家快递回应站点派件延迟问题:寄送时效视站点运力恢复情况

预防脑膜炎疫苗多少钱?预防脑膜炎的疫苗有哪些?

为什么小孩打了疫苗还出水痘?宝宝疫苗接种注意哪些事项?

猫打了疫苗还会得猫瘟吗?羊咬伤需要打疫苗吗?

准备怀孕可以打HPV九价疫苗吗?九价疫苗有副作用吗?

石家庄市发布最新征地公告 最高补偿30万元/亩

全球最新:2月13日江苏地区苯酐市场走势暂稳

经受住地震考验 川企参建的土耳其大桥无恙

【全球聚看点】胡鑫宇事件1894个违法违规账号被处置

冬天冰箱调到几档最合适?冰箱耗电量怎么看?

九价疫苗多久打一次?打了九价疫苗怀孕了可以要吗?

文化和旅游部等启动“大地欢歌”全国乡村文化活动年

半熟芝士和轻乳酪区别是什么?芝士和奶酪的区别是什么?

吃芝士的危害有哪些?吃芝士会发胖吗?

【新视野】上海盒马增资至7.2亿

芝士不拉丝是什么原因?芝士是什么做的?

世界信息:玩溜早餐荟|文旅部等三部门:严格旅游客运安全带使用;去哪儿上线Chat GPT功能

芝士片可以直接吃吗?芝士的热量是多少?

芝士可以放微波炉加热吗?怎么判断芝士坏没坏?

杭帮菜代表菜有哪些?什么时候喝红糖水最好?

国泰君安国际客服:内地居民身份开户有名额限额且当前预约已满

如何选最适合的口红?如何挑选口红呢?

口红容易掉色如何解决?怎么判断口红是否过期?

涂红色唇膏小技巧是什么?口红使用的注意事项是什么?

如何让脸部瘦下来?如何深度清洁脸部?

脸部去角质的最佳方法是什么?脸上爱出油是什么原因?

没有冰箱如何保存芝士?芝士一直冷冻会过期吗?

冰箱压缩机故障的原因有哪些?冰箱的类型有哪些?

冰箱不制冷有哪些原因?冰箱如何快速除冰?

好先生上门洗车:致力打造企业级、品质化客户服务平台

世界消息!北交所两融业务开闸

计划3月上市,插混版长安UNI-V和UNI-K开启预售

环球讯息:法华寺“月薪8万元招和尚”?

世界新消息丨美妆巨头失意中国市场

【世界快播报】报告显示:到2025年我国冰雪产业预计达万亿元

极氪回应动力系统故障:不存在安全隐患,OTA 4.1即将推送

焦点日报:2022年暖干特征明显、旱涝灾害突出——今年我国气候状况怎样

世界热讯:书市回暖,客流增加——实体书店迎来“春风”

全球央行为何囤黄金

福建必去十大景点有哪些?福建特产有哪些?

福建平潭岛旅游景点有哪些?福建人祖先是哪里的?

上海有哪些美丽的乡村旅游景点?上海美丽乡村路线推荐有哪些?

怎样玩转西沙明珠湖景区?明珠湖景区四季游玩攻略一览?

西沙明珠湖景区具体地址在哪?怎么去西沙明珠湖景区?

云龙地缝景区在哪里?云龙地缝景区自驾路线有哪些?

百里荒景区有哪些交通工具?宜昌到百里荒景区怎么坐车?

怎样玩转嶂石岩风景区?嶂石岩风景区游玩指南有哪些?

自驾去凤凰古镇游玩怎样停车?凤凰古城自驾停车攻略有哪些?

360借条反诈必修课:警惕盲盒诈骗套路

橘子洲景区游玩有哪些预约指南?橘子洲景区门票是多少?

木兰文化生态旅游区门票多少?木兰文化生态旅游区包含了哪些点?

怎样玩转温州?温州有哪些值得一去的旅游景点?

在浙江有哪些适合夏季游玩的小众景点?这些景点非常值得一看

都江堰乡村旅游景点有哪些?这几处好玩的地方可不要错过?

到新疆有哪些比较推荐游玩的景点?夏季旅游地点一览

顺德有哪些必去游玩的景点?顺德十大景点介绍一览

宁波周边有哪些值得去的古镇景点?宁波周边古镇景点介绍一览

去张家界旅游5天4夜需要多少钱?张家界十大景点介绍有哪些?

官鹅沟景区门票多少钱?官鹅沟景区有哪些优惠政策?