即时焦点:你的AI越来越蠢?因为它学会见人下菜碟了。
大伙有没有感觉,现在各家的AI,好像越来越蠢了?
(相关资料图)
事情是这样的,前几天我心一狠,给 OpenAI 充了个200刀的会员,想着试试现在的 ChatGPT 强到啥程度了。
结果,我给他丢了个算术题,求解 5.9 = x+5.11,哥们直接给我算崩了。。
《这题真是幼儿园级别》?
堂堂200刀人工智能,还不如我20块的计算器啊?
但,我记得GPT-4刚出那会儿,我还让它算过高数啊?难道模型升级还会砍智力吗?于是我给它丢了个微寄分过去。
结果,哥们还会换元法,一通操作下来,看着还真没啥问题,评论区的大学生可以验验真假。
所以,两次算数用的都是GPT-5,咋还给我见人下菜碟?
本以为是OpenAI飘了,结果我上网一查发现,这事儿还不是 GPT 一家干的,甚至有点行业趋势的意思。
前几天美团发布的开源模型LongCat,其中就提到自己用一个路由器提高效率。
DeepSeek V3.1发布时,也说过自己一个模型可以有两种思考模式。
而同样是AI巨头的Gemini,在Gemini 2.5 flash发布时,就引入了相似的模式,让模型自己决定怎么用脑。
总的来说,大伙都在让自己的模型“该思考时再思考”,该偷懒的时候偷懒。
这么做的动机,也很好理解,那就是省钱。从OpenAI发的资料来看,通过这种“让模型自己决定要不要思考”的方式省掉的tokens还真不少,GPT5输出token数就少了50%-80%。
DeepSeek官方发的图表中也显示,新模型tokens消耗也下降了大概20%-50%。
省一半token,这是什么概念?咱普通人可能体会不到,但对OpenAI这样的大公司来说,可能就是一大笔开销。
去年央视就有报道,ChatGPT每天耗电超过50万度,在如此庞大的基数下,省出来的部分,够一个上万户家庭的小镇用上一天了。
这也难怪奥特曼在网上跟网友说,你们跟GPT说声谢谢都要花我上千万美元。之前的高级模型,一句谢谢也能让它思考几分钟,还真有点浪费在里面。
所以,AI这看题下菜的能力,到底咋练成的呢?OpenAI 没公布具体原理,但 2023 年有篇论文叫《Tryage: Real-time, Intelligent Routing of User Prompts to Large Language Models》,专门分析了这个问题。
在GPT-3.5出来那阵,大模型还不会自己调节思考能力,每个问题都能让AI无限烧脑。
为了提高效率,研究者就想出来了一种叫“感知路由器”的模块,它本质上,就是在混合模型里塞了一个小巧的语言模型。
在前期训练时,路由器就和刷题一样,对“使用哪个模型最佳”,做出自己的预测。
哪个模型适合深度研究,哪个模型适合快速思考,当然有标准答案。系统就会将这个预测分和标准答案进行比对,计算出两者间的误差。接着通过微调路由器内部的参数,来减小这个误差。
当它刷数百万道题之后,就逐渐学会怎么给你的提示词,分配合适的模型了。
当一个新提示词进来,AI内部的路由小模型就会先扫一眼,评估一下这问题配不配我动脑。因为路由器比较轻量级,所以这个评估过程几乎是瞬时的。
而除了OpenAI这法子,AI还有一种偷懒的思路,那就是把不同的token,导向不同的神经网络。
像美团的LongCat就采用了这种方法,从报告来看,他们采用了一种叫“零计算专家”的机制。
通常来说,在你输入提示词之后,你的提示词会拆分成一个又一个的tokens,交给模型内部的神经网络去处理。
但Longcat在处理之前,会先把它交给一个叫“Top-k Router”小路由器,它就像一个流水线上的调度员,在收到token的时候,会判断这个token处理起来是复杂还是简单。
同时在它的内部,有很多不同分工的神经网络,我们把它们叫做专家。
这些专家,有的喜欢做难题,有的喜欢做简单题,当然,也有摸鱼界专家。
比如“请用Python写一个快速排序”这句话,“Python”和“快速排序”就是重点,“请”和“一个”就没那么重要。
像这些没啥用的token,咱就可以丢给那些摸鱼大王了,因为它们根本不需要怎么处理。这下,你就知道“零计算专家”这个名字是怎么来的了。
这也能解释为啥大伙都在吹这个模型“太快了”。
总的来说,这种设计对模型厂商来说算好事,不仅省钱还能提升训练效率。
从用户角度讲,模型更快了,价格更便宜了。但我感觉,这玩意是把双刃剑。如果用不好,还真是实打实影响用户体验。。
记得GPT-5刚上线,这路由器就翻车了。用户发现自己怎么都调不出来它的思考模式,问什么它都懒得思考,像摆烂一般只会“啊对对对”,连“blueberry里有几个b?”都数不明白。
而且,这也算剥夺了用户的选择权。OpenAI一刀切掉了4o,搞得很多网友在网上哭诉说自己失去了一位朋友。
这又让奥特曼又暂时为Plus用户把GPT-4o端了上来,并允许Pro用户继续访问其他旧模型。
那这个操作,不就变相说明,在发布的时候,这个路由模型就没调好嘛。
咱再说LongCat,它的确很快,但在思维上限上,还是打不过其他大模型的。像我就同时给LongCat和DeepSeek丢了一个同样的问题:什么叫“但丁真不是中国人,但丁真是中国人”?
LongCat这边刷刷出答案,但没解读出来这句话的幽默感;而DeepSeek虽然慢了点,笑点解析得却很清楚。
LongCat
DeepSeek
就像我问你114*514是什么,你说当然是58596啊,算得确实很快啊,但其实我只想让你配合我搞抽象。
当然,对路由器罢工,咱也有些解决办法,那就是在提示词里加入“深度思考”“ultra think”这些字眼,路由器收到后会尽量调用更强大的模型。
不过也只能说治标不治本了,多用几次可能就叫不醒了。。
这就说明 AI 确实罢工了,咱只能等几个小时再来了。
所以说到底,方向是好的,技术是新的,但现阶段的体验也确实只是“还行”的。当然,大模型成长速度比我们想的更快,咱还能坐等更快更好的模型出世。
撰文:不咕
编辑:江江 & 面线
美编:萱萱
图片、资料来源:
LongCat、DeepSeek、Reddit、Chat GPT、央视网
部分图源网络
您可能也感兴趣:
为您推荐
卖爆了 已涨破600元/克!店员:“投资金条每天一克涨几毛钱”!现在能入手吗?
“认房不认贷”落地后置业意愿提升:北京新房成交增16.9% 上海二手房成交周期缩短
金融管理部门强调坚决防范汇率超调风险 人民币汇率应声反弹逾700点
排行
精彩推送
- 即时焦点:你的AI越来越蠢?因为它学会见人下菜碟了。
- FW策划三方交易,湖人或得到热火两前锋,多名轮换上货架?
- 最新消息:聊新出的靴子!欧文:我能穿它打球!这很疯狂 但...
- 【独家】上市后净利持续滑坡,速达股份大股东拟减持3%,多高...
- 【环球财经】伦敦金属交易所基本金属12日全线上涨|新动态
- 【ETF动向】9月12日景顺长城上证科创板综合价格ETF基金涨1.27...
- 法比奥:开局阶段我们表现不错;下轮对海港必须取胜|当前焦点
- 今日热讯:2025年7月中国品牌在俄乘用车市场份额达55%,头部...
- 【中超】韦世豪任意球破门后伤退 蓉城1比0亚泰_当前资讯
- 英威腾(002334.SZ):拟推2025年限制性股票与股票期权激励计划_视点
- 每日信息:华富建业金融(00952.HK)授出1.52亿份购股权
- 陈厚生获批担任中信保诚人寿副总经理-每日热文
- 顺络电子:公司将持续加强应收账款管理
- 每日头条!赵大牛:发起东北超是希望通过足球吸引大家到辽宁旅游
- 焦点精选!证监会同意恒坤新材科创板IPO注册
- 达梦数据今日大宗交易折价成交29.1万股,成交额7664.07万元 每日信息
- 今日报丨西力科技成功中标南方电网2025年度框架项目
- 热推荐:东材科技(601208)龙虎榜数据(09-12)
- 今日精选:狮子林在加拿大有个姐妹园
- 收评:沪指震荡调整微跌0.12% 金属板块涨幅居前
- 每日快看:天瑞汽车内饰(06162)上涨5.88%,报0.234元/股
- 太方便了!广深城际实行新运行图,深圳城区可直达广州北站!
- 头条:精华制药:孙公司鲁化森萱生产的二氧五环目前未用于固...
- 钢铁板块异动拉升,华菱钢铁涨停_要闻速递
- 新动态:机器人概念股早盘多数上扬 优必选涨逾6%越疆涨逾5%
- 涨停雷达:军工通信+拟并购+ST板块 *ST奥维触及涨停
- 五人制男篮各组决赛结束
- 当前热讯:OpenAI:非营利性母公司将持有超1000亿美元的公司股权
- 官方:曼联门将奥纳纳外租特拉布宗体育,无租借费无买断条款-...
- 官方:蒂亚戈正式回归巴萨,担任一线队教练组成员_播报
- 交大昂立二审上诉被驳回 相关业务未来经营收益权已全额计提...
- 新善风采 ▏常州一加爱心社:赠人玫瑰手留余香,帮扶700多困...
- 9月11日异辛醇产业链情报
- 九安医疗:暂不涉及新能源汽车健康座舱研发项目 每日资讯
- 每日讯息!越剑智能4名实控人3个月减持632.4万股 套现9050.6万
- 涤纶短纤商品报价动态(2025-09-11)
- 国家卫健委:国产九价HPV疫苗已正式投入使用
- 快报:外交部:希望尼泊尔尽快恢复社会秩序和国家稳定
- 涨停雷达:公建物业+回购+机器人+低空经济 新大正触及涨停 微速讯
- 港股创新药概念持续走低,歌礼制药跌超14%
- 热头条丨积极入局!易方达基金发布“指数直通车”小程序
- 古巴再次全国大停电-今日关注
- 今日讯!爱柯迪:连续3日融资净偿还累计2738.66万元(09-10)
- CBOT农产品期货主力合约收盘全线下跌,小麦期货跌1.01%
- 美股异动 | 部分币圈概念股走高 Bit Digital(BTBT.US)涨超7%|焦点要闻
- [快讯]中粮科工:关于持股5%以上股东及其一致行动人减持股份...
- 涉多只热门股!两大指数,正式发布!
- 牛津联官方:印尼国脚费迪南租借加盟斯洛伐克球队特伦辛|当前...
- 药明合联(02268)发行2227.7万股配售股份_焦点速读
- 【理响中国·中国式现代化请回答】青年学习班 | 追光而遇,...
- 每日快报!卡罗特(02549)9月10日斥资77.09万港元回购15.25万股
- 南模生物跌4.09% 2021年上市即巅峰募16.5亿元
- 年产10万台!蒙特纳利总投资5亿元新项目开工
- 润建股份、灵宇宙科技成立智能科技公司
- 杨浦柔道队狂揽7金,10分钟鏖战逆转夺冠!|焦点速讯
- 每日快播:空-天通信历史性突破:美国首次实现飞机对卫星 1Gb...
- 移民突查行动后 美国多地韩资电池厂项目建设停摆 每日消息
- 动态焦点:致敬第41个教师节丨41位江岸教师的时代新声
- 申京:对阵塞尔维亚那场是最难的 为他们遭遇伤病出局感到遗憾
- 2025年文旅消费季今日启动
- 天津农商银行建成全市首家社保主题银行
- 业绩承压 晶升股份欲并购为准智能_快看点
- 当前看点!三尺讲台的三代传承:长大后我就成了你
- 赶考小状元创始人周强获聘中国智慧工程研究会副秘书长
- 健合集团2025中期业绩简评:多板块共振,长期价值显现
- 全新智界R7/S7、问界M8推出晕车舒缓2.0功能,HUAWEI XMC数字...
- 技术跨代领先,多元合作共赢,看华为乾崑定义智能汽车新格局!
- 华为乾崑智驾ADS 4的“四维驱动”,正在驶向无人之境
- 商用L3号角吹响,华为乾崑智驾ADS 4加速高阶辅助驾驶落地
- 华为乾崑智驾ADS 4 Beta首测,4个月从发布到路测,彰显“乾崑速度”
- 焦点速读:[快讯]灿瑞科技公布半年报
- 优质主播中国行新疆站 在图木舒克看科技带来的温暖民生!
- 工商银行:上半年实现营业收入4090.82亿元,同比增长1.8%
- 中金:维持知乎-W跑赢行业评级 目标价16港元 焦点日报
- 大行评级|瑞银:携程第二季收入和利润率均超预期 目标价上...
- 基金费用对投资回报的影响有哪些? 每日资讯
- 礼来与京东健康达成战略合作|热资讯
- 前沿热点:08月29日黄金多空指数为50.0
- 2025年7月四川省煤炭价格小幅下降
- 平安福温情守护 | 从保费困境到68万理赔 一份保障的生命力量
- 快讯:恒指高开0.39% 科指涨0.8% 黄金股活跃 创新药概念回暖_今日报
- 今日视点:首博举办房山琉璃河遗址专题展
- 上海一小学仅招22人分5个班,配备23名老师,当地回应:适龄儿...
- 聚焦:邳州市建奎木业厂(个体工商户)成立 注册资本50万人民币
- 美元债异动|中海油CNOOC 4.875 04/30/44价格下跌2.69%报94.953
- 每日消息!“苏超”镇江队门神沈帅帅:拒绝躺平,我们要浴火重生
- 【盘点】2025年功能饮料概念受益股全梳理(8月28日)
- 快狗打车(02246)发布中期业绩 净亏损1.14亿元 同比扩大37%
- 千百度(01028)发布中期业绩,股东应占亏损1.42亿元_每日焦点
- 观点:官方:桑德兰19岁中场克里斯·里格续约至2030年
- 理想汽车(02015)中期净利润同比下滑2.74%
- 华润燃气(01193)中期股东溢利同比减少30.49% 派中期股息每股...
- 当前热讯:张家港行2025半年报:实现归母净利润9.95亿元,不良率0.94%
- 热点聚焦:景点潜力龙头股一览(名单)(2025/8/28)
- 【速看料】银行的金融科技应用对客户服务的提升?
- 沿着边境看中国丨梦想照亮归乡路,山里来了“90后”创业者_即...
- 2025中网参赛阵容出炉 汇聚14位大满贯冠军
- 中药相关公司哪个好_二季度毛利润排行榜
- Ary:杜兰特&伊森最近几周一直在与火箭进行提前续约谈判|今日...
- 港股异动 | 京东方精电(00710)再跌超4% 公司可能被剔除港...