“疯狂”的大模型 谁来买单?警惕最终“一地鸡毛”
如何判断一个新事物是不是彻底火了,除了要去CBD的咖啡店听听人们在聊什么,有时候大佬之间的“口水仗”也是很好的证明。至少大模型是这样。
新晋创业者王小川与百度的隔空互怼,折射出大模型赛道里热闹的景象。据中新经纬不完全统计,截至目前中国已有超过40家公司、机构发布了大模型产品或公布了大模型计划。玩家纷纷涌入,这些大模型含金量究竟如何?是否会上演“一地鸡毛”的终局?
(资料图片)
资本躁动
除了搜狗创始人王小川,选择在大模型赛道再创业的还有已退休的美团联合创始人王慧文、创新工场董事长李开复等名人。面对大模型这一“烧钱”赛道,他们下场后的第一件事也便有了答案。
近日,王小川和前搜狗COO茹立云创办的百川智能表示,已获得5000万美元启动资金,来自王小川与其业内好友的个人支持,面向机构的融资会在近期启动。
据媒体报道,王小川透露,目前的资金足够训练出一个好的千亿模型,“至少到今年年底是够用的”。不过紧接着王小川又说,这还远远不够。他认为,产品从0到1,5000万美元够用,但若要持续做到最好,成本估计应该在3亿至20亿美元之间。
2月,王慧文在离开美团两年后通过社交平台发布了“英雄帖”,个人出资5000万美元设立北京光年之外科技有限公司,称要打造中国的OpenAI。王慧文还表示,下轮融资已经有顶级VC(风险投资)认购2.3亿美金。
不过,创业者和企业也明白,除了大笔资金,大模型研发的关键还在于人才。谁能在人才方面拔得头筹,谁就能在大模型的洪流中抢占先机。
王慧文在“英雄帖”中表示要拿出75%的股份邀请顶级研发人才;李开复则亲自筹组Project Al 2.0,发朋友圈招揽全球范围内的人才。
此外,大模型相关的人才招聘需求也激增。招聘平台数据显示,2023年1-2月份发布的AIGC岗位数量同比增长35%。在热招岗位中,图像识别、算法研究员、深度学习等岗位的年薪均已达百万元。
在BOSS直聘上,北京市奇点智源科技有限公司(下称奇点智源)给AIGC方向的NLP(自然语言处理)算法研究员岗位开出143万元年薪。昆仑万维4月10日的公告显示,该公司就ChatGPT、图像视频生成等AIGC技术与奇点智源进行全面技术合作,但后续能否顺利实现商业化存在较大的不确定性。
一位常年为企业招聘AI人才的猎头告诉中新经纬,他现在帮多家北京、杭州的公司招聘大模型相关工程师,年薪多在50万元至80万元之间,优秀的可以突破100万元,“算比较高的”。
不少上市公司也因为涉足大模型而股价大涨。数据显示,截至4月24日收盘,三六零、昆仑万维、云从科技今年以来股价涨幅达153.52%、287.23%、155.58%。
昆仑万维宣布联合奇点智源共同研发国产大语言模型“天工”3.5后,次日股价最高涨近16%,两个交易日累计最大涨幅超22%。
三六零股价也终于摆脱了长期的低迷状态,今年股价最高时达20.85元/股,现在市值也来到了1185亿元。不过截至24日收盘,该公司股价4月累计下跌4.99%。
云从科技股价今年累计最大涨幅一度达284.98%,股价曾达61.8元/股的历史高点,但近期股价已回调超三成。不过,云从科技对大模型产品依旧寄予厚望。3月31日,云从科技披露了定增募资计划,拟募资36.35亿元用于“行业精灵”大模型研发项目。
不是所有模型都叫大模型
大模型赛道里数量更多的是公司、机构的身影。这里面既有百度、腾讯、阿里这样的大型互联网公司,也有科大讯飞、商汤科技这样的AI公司,还有中科院自动化研究所、上海人工智能实验室这样的科研机构。
不少AI创业公司,也趁这波浪潮单方面宣布进军大模型赛道。
什么样的模型才能称之为“大”?如此多的大模型,含金量究竟如何?
国家人工智能标准化总体组副组长、北京航空航天大学人工智能研究院教授吴文峻对中新经纬表示,一般认为参数规模在百亿以上的是大模型。“有研究表明,百亿规模以上的大模型,就可能会出现所谓的‘涌现’现象,具备一定的自主学习、自我优化和自我进化能力,相较于百亿以下规模的模型在逻辑推理、做数学题等方面有明显提升。”吴文峻说。
中国新一代人工智能发展战略研究院首席经济学家、南开大学经济研究所所长刘刚接受中新经纬采访时表示,大模型的判定标准主要在于它是否能在不同的专业领域使用,以及参数规模的大小。“我认为亿级参数规模是大模型的入门门槛,现在国际上一些大模型参数规模可达到百亿甚至千亿。”
大模型发展的背后除了百亿级的参数规模、海量数据外,还需要庞大的智能算力支撑。而智能算力的水平又与算力芯片、算力规模息息相关。这些都决定了大模型的研发不是容易的事,并非通过召开一场发布会或展示几页PPT就能实现。
尽管目前大模型的应用有很大局限,具备对文本、图片理解生成能力的都是少数,但有些公司已将一些此前推出的产品归为大模型应用。
3月,小米集团总裁卢伟冰在财报电话会议上就表示,“小爱同学就是一个典型的大模型的应用产品”。公开资料显示,小爱同学发布于2017年。
在市场研究机构IDC中国研究总监卢言霞看来,之前大部分AI应用都不是基于大模型的。“大模型是对原有算法模型的技术升级,基于海量数据开发预训练模型,到最终用户环境中使用少量数据即可获得比之前的算法模型更好的结果,相比上一代的算法模型有更高的预测准确度。”卢言霞说,“主要有三个要点,一是预训练模型学习了多少数据,迁移学习的效果如何以及部署的整体成本如何。”
不过,刘刚认为,只要是应用产品基于人工智能,且参数规模、训练量在不断增大,不断迭代演化,尽管参数规模没有达到千亿级别,也依然可以叫做大模型应用产品。
落地的不确定性
在人们预想中,大模型落地应用以后除了在C端变成人们的智慧助手,还将在B端给千行百业带来研发能力与生产效率的指数提升。
但现实是,目前,具备对文本、图像、音频和视频综合理解生成能力,且具备学习和使用“工具”能力的多模态大模型仍在路上,这意味着如何将这些能力落地到具体的应用场景更加遥远。而这个过程,充满了诸多不确定性。
刘刚表示,大模型落地的不确定性首先在市场,其次是技术。“市场的选择对大模型至关重要,要看最后谁的模型大家用起来更容易、成本更低,让市场接受并使用。落地的关键在于能否适应市场,有时候技术先进未必适应市场。”
吴文峻也提到了使用推广方面的问题,他认为,广泛部署大模型要占据一定的计算资源,很多人同时使用也会带来资源消耗,大模型的训练和运维也需要很多云资源。在云上部署后,怎样在提供大规模服务的情况下保持良好的性价比,是推动大模型落地的过程中需要解决的问题。
吴文峻还提到,大模型相关技术本身还存在一些缺陷,比如事实错误、逻辑推理的前后矛盾,这些问题通常被称为“幻觉”。要把大模型运用在一些对输出内容的客观性、准确性要求比较高的场景还存在一定技术障碍。“在保证服务内容正确性、客观性的前提下怎样节能增效、降低运行成本是大模型在应用推广的时候需要重点关注的。”
吴文峻认为,对于这些问题,要通过一定的技术手段加上算力的支撑才能解决,还可以通过人的反馈来强化学习,发现错误后进行修正。“有些还需要增强专业领域的知识,对模型可能存在的问题进行检查,然后定制成为可以在专业领域内用的模型。”
卢言霞表示,大模型落地的不确定性在于,是否真的能产出比之前的AI更好的效果,需要多久才能落地,“当然也在于到底能不能成功落地”。
针对大模型应用场景,吴文峻表示,B端和C端对大模型的需求不同,B端的技术要求会更高。“C端的应用目前主要在聊天对话、客服、文本生成、图片生成等。不过我认为大模型未来盈利的方向在B端,因为B端是面向企业进行定制服务的,部署的空间会更大,当然技术要求也会更高。”
警惕最终“一地鸡毛”
面对科技公司对大模型的追逐战愈演愈烈,业内也有质疑声音:我们需要这么多大模型吗?疯狂上线大模型,是否会导致最终“一地鸡毛”?
卢言霞表示,“从大模型的开发到落地,需要的算力、数据、人才,都是持续且较大规模的投资,另外当前技术也不成熟,确实有可能产生泡沫。”
吴文峻认为,在目前宣布进军大模型的约40家企业、机构中,有一些企业本身在自然语言处理方面就有比较雄厚的积累,也有人工智能的技术储备,他们做大模型没有问题。
“但也有企业是为了蹭热点,争取投资才来做大模型。国外有一部分模型已经开源,如果这些企业是基于开源的模型,自己再重新训练,这样做出来的模型可能在技术能力、指标上达不到真正有用的大模型的要求。”吴文峻提醒,“在目前宣布了做大模型的企业中,最后能做成的或许不超过一半。”
刘刚对此持较为中立的态度,他表示,大模型在各行各业都有很大应用前景,而且不同的行业也会产生不同的大模型,大模型也有语义、语音、文字等各种类型。刘刚说,“大模型即使是同质化,我认为也并非很严重的问题,就是要允许多个模型之间的竞争,最后有一个胜出了,就是找到了最优的道路,也是完成了一个创新的进化筛选过程。”
(文章来源:中新经纬)
标签:
您可能也感兴趣:
今日热点
为您推荐
五一客房预订太火爆 有酒店推出99元睡大厅沙发
“疯狂”的大模型 谁来买单?警惕最终“一地鸡毛”
外交部宣布进一步便利中外人员往来措施:航空公司不再查登机前检测证明
排行
精彩推送
- 暴跌22000亿!万亿赛道遭遇爆雷潮!公募砍仓 什么信号?
- 五一客房预订太火爆 有酒店推出99元睡大厅沙发
- “疯狂”的大模型 谁来买单?警惕最终“一地鸡毛”
- 国家发展改革委:将扎实推进航天领域相关规划实施|天天百事通
- 外交部宣布进一步便利中外人员往来措施:航空公司不再查登机...
- 民士达北交所上市首日涨68.7% 净利升背离经营现金流
- 碳中和板块跌2.12% 海南橡胶涨7.06%居首|新消息
- 国城矿业一季度净利润降59.6% 2022年降10.7% 新资讯
- 一嗨租车:五一预订火爆 热门旅游城市提前订
- 焦点日报:生物医药板块跌2.96% 重药控股涨10.0%居首
- 天天热点!普洱市2023年“五一”假期旅游工作部署会议召开
- 今日播报!两部门:全国计划招聘特岗教师52300名
- A股异动 | 天山股份大跌9% 市值下破700亿元 首季净亏损12.31亿元
- 中国驻日本大使馆提醒在日中国公民防范电信诈骗 世界简讯
- 世界动态:新开普董事长被刑拘股价20CM跌停,祸起五年前马明海...
- A股异动 | 钒钛股份触及跌停录得6连跌 Q1净利同比降3成
- 末世重生魔方空间来种田_末世重生之一受多攻 世界快资讯
- 首个海面漂浮式光伏电站“跑路”了?专家:大概率沉了 天天...
- 中国国家统计局局长:国际社会对完善数据治理等需求愈加迫切
- A股五连阴:创业板指跌近2%创今年新低 逾4200只股票下跌
- “一分钱没花 老臭流氓!”云南一导游被曝辱骂游客 网友怒了!
- “99元睡酒店大厅” 网友吵翻 客服回应:可能会升级到普通大床房
- 广交会凸显我国外贸韧性 焦点
- 4月25日人民币对美元中间价报6.8847 下调12个基点
- 破发股科兴制药去年亏0.9亿 正拟定增2020上市募11亿|快报
- 珠海赛纬:行业产能过剩,产品竞争力低,仍要大举募资扩产|I...
- 大行评级 | 里昂:下调福莱特玻璃目标价至27.7港元 评级“...
- 什么情况?有“锂”就跌 “两桶油”逆势大涨!_当前讯息
- 开设自习车厢、打造流动书吧……高铁上也能感受书香
- 开源证券给予远兴能源买入评级
- 最新快讯!特斯拉中国试点向第三方开放充电网络:首批10座超充...
- ETF追踪:昨日ETF净申购102.19亿元 资金加仓中证1000ETF
- 消失9个月 知名财经专栏作家叶檀自曝患癌:我进入了黑暗隧道...
- 上海:围绕“元宇宙”基础设施、交互终端、数字工具等领域开...
- 天天看点:耀才植耀辉:美股个别发展续观望季绩 恒指冀守稳2...
- 瑞银集团一季度净利润10.29亿美元 同比下降52%|全球时讯
- 【全球报资讯】汉得信息:百度减持对公司和百度的合作没有影响
- 1台币等于多少人民币(2023年4月25日) 全球短讯
- 资讯:一日元等于多少人民币(2023年4月25日)
- 环球速递!650泰铢是多少人民币(2023年4月25日)
- 1澳币等于多少人民币(2023年4月25日)_当前最新
- 秦时明月小说全集温世仁txt下载 秦时明月小说全集
- 世界新资讯:锂电股大面积跳水 计算机行业被融资资金爆买 ...
- 焦点科技:推出AI外贸助手
- 怪兽充电巨亏7亿,“充电刺客”难解亏损困境?|当前关注
- 精彩看点:突发!创业板年内新低!石化双雄又爆发:4年多新高...
- 天天时讯:港股异动丨生物科技股全线下跌,药明生物跌超6%
- 最高每名学生5元/课时!多地遴选校外培训机构参与校内课后服务
- 宁夏三地机场“五一” 客流预计突破10万人次 天天最新
- 天天微资讯!八达岭长城4月30日、5月1日预约人数已达上限
- 河北政法职业学院学子获河北省高职院校“互联网+国际贸易综合...
- 今日裁判:马宁执法泰山vs浙江 邢琦执法梅州vs三镇 全球最资讯
- 2023版熊猫金币30克今天报价(2023年04月25日)
- 热门看点:A股异动丨券商股集体拉升:东北证券涨近6%
- 润和软件:公司未涉及cpo相关技术
- 沪指震荡创业板指跌1.67% 银行板块涨幅居前 能源金属板块大...
- 天天速看:2023年“中国航天日”主场活动开幕
- 电科数字回应股价跌停:股价非理性下跌 公司基本面良好
- 禅城区举行重大项目百日攻坚现场会 215个重点项目建设加速跑...
- A股连续调整 杨德龙:大幅下跌空间不大 对后市保持信心和耐心
- 最新研究:地球能量失衡加剧 环球报道
- 新能源汽车行业将引入积分池制度
- 天天讯息:午评:三大指数集体下探 银行板块领涨
- 当前时讯:当AI遇到艺术教育会擦出哪些火花? 一起来看上理...
- “二阳”又来了?门诊阳性者多是此前没感染过的 今日快讯
- 金地集团为子公司项目担保7.5亿 对外担保余额104.6亿 环球播资讯
- 环球快资讯丨观想科技2022年净利降7成 2021年上市一创投行保荐
- “五一”档电影预售即将破亿 17部新片参与角逐_全球动态
- 杜延安参加长三角绿色食品加工业大会 现场推介亳州市参展企...
- 全球首艘93000立方米超大型液化气船在沪命名 将于明日交付|...
- 小苏打清洗饮水机最简单的办法(小苏打清洗饮水机最简单的办...
- 环球新资讯:中国美术学院一教师作品被指涉嫌抄袭
- 天天热消息:天山电子:4月24日融资买入216.03万元,融资融券...
- 网游概念再度活跃,盛天网络“20cm”涨停,去年净利润大增近80%
- 中国首次火星探测火星全球影像图发布
- 大行评级 | 瑞银:江铜首季业绩略胜预期 评级“中性”
- 环球短讯!港股异动 | 三桶油逆市上扬 国际油价止跌转涨
- 世界观热点:突发!今年最牛A股一度暴跌18%!净利大降908% ...
- 热点在线丨沪指小幅高开 贵金属板块领涨
- 上海一女子逛商场被跳楼者砸伤住进ICU,家属:她刚入职,几天...
- 山西太原市区禁止销售燃用高污染燃料 世界快看
- 创业板指跌超1% 两市超3600股下跌
- 全球报道:2块钱甩卖养生谷项目,恒大汽车欲彻底甩掉地产类业务
- 以爱筑家 石榴集团用品质交付迎业主荣归
- 中方开始从苏丹撤侨?外交部回应!|全球快看
- 人民币对美元汇率中间价下调12个基点_今日报
- 敦煌艺术展亮相苏博-天天通讯
- 纳米成膜加固井壁防砂技术试验成功
- 环球热议:刚刚又跳水!千亿白马突然重挫 更有20CM跌停!一新...
- 预计美元会出现贬值更深
- 东方集团收证监局警示函 4亿至6亿元回购仅实施100万
- 劳动创造幸福 奋斗开创未来系列报道(三)-全球播报
- 产业 | 2023 Hi Fashion移动驿站首站来袭
- 广发期货早知道:在去美元化的趋势下未来贵金属持仓有望继续...
- 涨停雷达:算力个股异动 鸿博股份触及涨停
- 李佳琦、刘畊宏、疯狂小杨哥等5名主播被点名|每日资讯
- 环球今日讯!中印举行第十八轮军长级会谈
- 世界观察:许昌市市场监管局示范区分局 开展食品安全监督抽检
- 软件型企业认定资质的好处
- 天天微速讯:多家上市银行净息差跌破“警戒线” 中小银行密...