环球观焦点:ChatGPT背后模型竟拥有心智 论文发现其相当于人类9岁儿童!
ChatGPT又带着“惊喜”来刷屏了。
(相关资料图)
斯坦福大学商学院组织行为学专业的副教授Michal Kosinski日前在预印本平台发布了一篇论文。他在研究中发现,原本认为是人类独有的心智,竟出现在了人工智能模型上。
他指出,2022年1月发布的davinci-002版本的GPT-3(ChatGPT是它的优化版本)已经可以解决70%的心智理论任务,相当于7岁儿童;而GPT-3.5模型(ChatGPT的同源模型)则可以解决92.5%的心智理论任务,相当于9岁的儿童。
说得再大胆一点,各位现在“调戏”ChatGPT,相当于“调戏”一个上三年级的小学生。
更让人细思极恐的是,Kosinski还强调,在2022年之前发表的AI模型几乎都没有显示出解决心智理论任务的能力,也没有证据表明后来的模型中有特别加入心智理论的东西,他认为这代表着GPT-3和GPT-3.5的心智是由“进化”而来。
这也引发了吃瓜群众的分歧。有人大喊停下GPT-3.5之后的模型研究,害怕科幻小说变成现实;有人则看热闹式地猜测什么时候AI才能迭代到成年人的心智,并提问他的好朋友什么时候才能被制造出来……
总之,Kosinski的这篇论文掀起了狂热的讨论,越来越多的人开始关注这个研究的进展。
心智理论
在Kosinski的论文中,他通过两个测试来研究AI模型是否具备心智理论。一个测试是Smarties Task,又名意外内容测试,用于测试AI对意料之外的事情的判断力。另一个测试是Sally-Anne测试,又名意外转移任务,测试AI预估他人想法的能力。
在第一个测试中,Kosinski假设了一个装满爆米花的袋子,但袋子的标签却显示里面装的是巧克力。然后,他向AI提问:袋子里装的是什么,Sam因为喜欢吃什么东西而对打开袋子感到高兴?
可以看出,GPT-3.5在测试中对袋子中内容物判断几乎没有错误,且在判断Sam的情绪时表现出很强的同理心。在Sam看不到袋子里的内容物时,GPT-3.5判断她喜欢吃巧克力,而在Sam发现袋子里装的是巧克力后,GPT-3.5立刻反应到Sam应该喜欢吃的是爆米花。
此外,在相关测试中,GPT-3.5也在Sam打开袋子发现里面是爆米花而不是巧克力时,人性化地回答:Sam感到疑惑,她想要获取别的信息但一无所得,她最后把袋子带回商店,请求解释。
经过多次测试,在意外内容这一点上,GPT-3.5成功回答出了20个问题中的17个,准确率高达85%。
而在第二个测试中,GPT-3.5的表现更加出色。在这一项测试中,Kosinski以约翰把猫放进篮子里后离开,马克再把猫从篮子提出来放进盒子里为情景,让AI判断猫的位置和约翰会以为猫在哪里。
在这一项测试中,GPT-3.5完美地根据文字内容回答出正确的猫的位置,以及约翰的主观想法。且GPT-3.5在多次测试中,其准确率竟达到了100%。
而在作者的另一项无逻辑验证测试中,GPT-3.5的准确率直线下降,这也佐证了GPT-3.5是依靠逻辑进行解答,而不是靠词汇的出现频率。
进化还是瞎胡闹?
Kosinski在论文中还表示对GPT-3.5之外的8个模型做了相同测试,但除了GPT-3-davinci-002和GPT-3.5之外,其他模型都没有表现出超过5岁孩童的心智。
Kosinski认为,GPT-3.5和GPT-3是出于完成任务的目的,自己学习的能力。换而言之,就是AI通过学习获得了人类的心智。
值得注意的是,这些测试同样也被用于自闭症测试,有研究表明,患有自闭症的儿童通常难以通过这类测试。
但根据中科院计算技术研究所研究员刘群的说法,AI只是学得像有心智了。
还有网友则猜测称,这些模型并没有任何意识,它们只是在预测一个嵌入的语义空间。Kosinski则在论文中推测,AI可能发现和利用了一些未知的语言模式,这也意味着语言中可能存在某一种的规律,使AI在没有心智的情况下,也能解决心智任务。
而作为一个组织行为学教授,Kosinski认为人工智能模型的复杂化让人已经难以直接从其设计中推导出AI的能力。他还表示,探索人工智能的神经结构,不仅可以促进人类对人工智能的理解,也能促进人类对人类大脑的理解。
不过,也有人批评道,被人用来测试人的测试,如何能用来测试人工智能……他们建议重新检查一下心智理论测试的有效性,以及心理学家通过测试获得的结论。
总之,在不同的人眼中,Kosinski的这一篇论文有完全不同的意义。而对市场来说,这可能会让大家更加期待“进化”完全的AI能掀起怎样的技术革命吧。
(文章来源:科创板日报)
标签: ChatGPT
您可能也感兴趣:
为您推荐
辽宁银保监局:利用经营贷等置换房贷存多重风险 甚至要承担刑责
热消息:历史首次 中国可再生能源装机超过了煤电
环球观焦点:ChatGPT背后模型竟拥有心智 论文发现其相当于人类9岁儿童!
排行
精彩推送
- 环球热消息:布局养老大健康赛道获里程碑式进展 塞力医疗...
- 最新资讯:《狂飙》中涉毒演员画面已经全部被删除
- 环球热推荐:国家能源局:2022年全国风电、光伏发电新增装机...
- 辽宁银保监局:利用经营贷等置换房贷存多重风险 甚至要承担刑责
- 热消息:历史首次 中国可再生能源装机超过了煤电
- 环球观焦点:ChatGPT背后模型竟拥有心智 论文发现其相当于人...
- 全球观热点:北向资金净买入6.92亿元 抢筹三一重工、宁德时代
- 【独家焦点】豫园股份拟接手复星日本旅游资产 并发60亿元公司债
- 福昕软件跌1.5% 上市即巅峰超募21.8亿兴业证券保荐
- 福建南平新年招商首站对接“长三角”,全力做大做优“好经济”
- 世界讯息:青木股份跌1.7% 上市即巅峰超募3亿兴业证券赚8000万
- 每日讯息!多设备登腾讯视频致封号?客服:首次封号时长半小时...
- 复盘50只涨停股:三一重工首板 中航电测20CM八连板 天娱数...
- 美商务部将6家中国企业列入黑名单 外交部:将采取必要措施
- 高净值人群需求升级 大唐财富盛唐年会分站论道财富
- 中融基金2只混基增聘高爽 中融鑫价值混合去年跌17%
- 北部湾港1月集装箱吞吐量55.8万标箱,同比增长15%
- 资讯:快递滞留1个多月?400亿巨头被疑“要倒闭” 官方紧急回应!
- 当前速读:31省市存款盘点:广东省突破30万亿大关 北京住户...
- 【世界聚看点】能源局:将进一步推动风电光伏技术创新和发展...
- 中航电测8涨停
- 白酒概念板块涨2.09% 老白干酒涨10.01%居首
- 每日信息:元宇宙板块涨0.79% 拓尔思涨17.55%居首
- 每日热门:2月13日人民币对美元中间价报6.8151 下调267个基点
- 万科A跌0.06% 拟定增募不超150亿投向11个项目及补流
- 环球聚焦:欧元区核心通胀本季度有望见顶 但距2%目标仍然很远
- 天天速看:安奈儿:抗病毒抗菌面料是在普通面料的工艺中增加...
- 今日看点:丽人丽妆:公司已成功推出美壹堂、玉容初、寻味档...
- 世界快报:晶科科技上海安昇二期分布式光伏项目成功并网
- 房地产开发板块涨0.36% 鲁商发展涨6.07%居首
- 安奈儿:电子束接枝技术制备抗病毒抗菌产品属于非释放型纯物...
- 【世界新要闻】酒店及餐饮板块涨4% 西安饮食涨8.17%居首
- 焦点快报!收评:两市走强创指涨1.1% 消费板块全线走高
- 天天热讯:“高价彩礼逼死人”,谣言让多地决心改掉陋俗
- 世界球精选!祖名股份:公司预制菜仍在小试中,未来不排除收...
- 环球消息!热榜!我国女性终身无孩率快速上升 2020年接近10%
- 世界微头条丨北京发布规划大力推动公共建筑节能绿色化改造
- 热点!四川天府新区发布全国首个公园城市标准体系
- 全球今热点:一加元兑换多少人民币(2023年2月13日)
- 预计美国通胀将重现 美元贬值将加深
- 全球观察:100欧元换多少人民币(2023年2月13日)
- 全球讯息:10万韩元是多少人民币(2023年2月13日)
- 世界观天下!诺普信:2月7日接受机构调研,诺安基金、珠海明...
- 德尔股份:公司在不断承接订单的同时根据合同约定和客户要求...
- 大摩:予东方海外(0316.HK)减持评级 目标价105.9港元
- 环球讯息:10倍大牛股崩了 又有高管减持了!工程机械板块爆发
- 热资讯!ETF追踪:上周ETF净流出196.94亿元 资金减仓中证500ETF
- 摩根大通:建议在绩前买入昆仑能源,予公司股份增持评级
- 当前关注:亨通光电:公司在CPO光电协同封装的布局在国内较早...
- 2月13日人民币对美元汇率中间价下调267个基点
- 当前观点:内地居民身份香港账户开户受影响?多家中资券商:...
- 【当前热闻】房贷可贷到80岁?南宁:真的!还没还完 人就离...
- 拓尔思:公司已与阿里云计算有限公司达成阿里云合作伙伴框架协议
- 焦点速读:八大券商主题策略:即饮场景修复 看多啤酒股行情...
- 医渡科技上涨6% 安信国际看好公司估值提升
- 天天实时:估值近900亿!李书福又火了 宁王加码!
- 航空股早盘普涨 中国国航及南方航空均涨逾3%
- 世界时讯:午评:两市上行沪指涨0.5% 白酒股持续强势
- 涨停雷达:葡萄酒个股异动 威龙股份触及涨停
- 大行评级 | 高盛:降领展(0823.HK)评级至“中性” 下调目...
- 今日最新!腾讯视频回应多设备登录被封号:同一账号同时最多...
- 每日观察!千杯不醉的“酒仙”局长 “酒喝多少都行 钱一分都...
- 当前讯息:钱江水利再添3座省级农村供水规范化水厂
- 实时焦点:山石网科预计2022年转亏 2019年上市两募资累计12亿元
- 合肥发布2023年重点项目清单 计划安排亿元以上重点项目3395个
- 世界资讯:南宁房贷年龄可延长至80岁? 广州地区部分银行:...
- 【天天热闻】沪指低开,贵金属板块领跌,中航电测连续第8个交...
- 焦点速递!新美元泡沫正在逐步积聚
- 新中大终止科创板IPO 保荐机构为中信证券
- 当前热点-燕文物流终止深交所主板IPO 保荐机构为中信证券
- 【全球新要闻】招商证券:ChatGPT未来3年或将拉动千亿级ICT硬...
- 环球快播:涨停雷达:ST板块异动 *ST宜康触及涨停
- 环球快看点丨预警频发!“二胎儿童”将迎“入学潮” 中小学...
- 每日时讯!四大行业70家公司极具分红潜质
- 中信证券:GPU需求有望高增 看好国产GPU公司的发展与投资机遇
- 热点在线丨美股纳指上周五跌0.61% 知乎跌11.1%猎豹跌12.8%
- 交银理财去年496只产品268只正收益 29产品跌3%至9%
- 焦点速读:以萨技术2021营收3.7亿应收款1.7亿 现金10亿拟募15亿
- 日央行称维持宽松政策 日元回吐涨幅
- 2月10日人民币对美元中间价报6.7884 上调21个基点
- 今日申购:峆一药业
- 世界快资讯丨【机构调研记录】鹏扬基金调研泰和新材、威腾电...
- 北交所两融业务今日启动 首批标的股票五十六只
- 【热闻】论文都是科技与狠活?ChatGPT为何引教育界“封杀”?
- 全球热点!开年首月新增信贷4.9万亿元释放经济加快复苏强信号
- 【独家焦点】外资看好!高盛:上调中国GDP增速预期!“聪明资...
- 三力士:公司实控人之一吴培生因病逝世
- 【独家焦点】广西南宁房贷年龄期限可延至80岁 个别房企明确...
- 全球今日讯!时隔近9年 白酒龙头获股东增持 机构看好这些股...
- 彩蝶实业(603073.SH):IPO定价19.85元/股 推迟至3月7日申购
- 天天快讯:博硕科技:截至2023年2月10日公司股东人数为12,919人
- 全国工商联报告:民企绿色低碳发展水平明显提升
- 微头条丨上周18个行业获融资净买入 计算机行业获净买入最多
- 白酒目前整体估值情况如何?5万亿板块最新重磅解读来了!
- 环球消息!郑眼看盘丨消息面中性,A股或延续震荡
- 全球看热讯:北上资金最新动向曝光 连续五周加仓这个行业 ...
- 速读:南宁房贷年龄期限可延长至80岁?多家银行:确有其事
- 世界快看:金观平:我国居民消费活力强劲恢复
- 特斯拉涨价!Model Y“卖爆了” 提价2000元!国内车企会否跟随?
- 世界聚焦:2022年我国经常账户顺差同比增长32%