清华大学金融科技研究院孵化
金融科技与金融创新全媒体

扫描分享

本文共字,预计阅读时间

“大模型”浪潮来袭,创业项目如果不沾上“AI”“大模型”,都不好意思去融资。

从2023年3月16日百度发布“文心一言”大模型开始算起,目前中国市场已有上百家公司加入到这场“大战”中。据媒体的不完全统计,截至2024年4月底,国内共计推出了305个大模型。而截至5月16日,只有约140个大模型完成生成式人工智能服务备案,占发布总量的45.9%。这说明,还有约165个大模型尚未“过审”。

这一现实说明,想“玩”大模型,除了需要有技术实力做支撑,另一方面,高昂的算力成本和服务器养护成本,也不是一家公司轻易能承担的,而诸如百度、阿里等巨头企业,则具有先天优势。不过,做出ChatGPT的不是谷歌,也不是亚马逊,掀起短视频“龙卷风”的不是阿里,也不是腾讯,这场大模型之战的胜利将花落谁家,现在还言之尚早。

“豆包全家福”有何实力掀起“大模价格战”?

就在百度、阿里等大厂早就发起“大模之战”抢占市场先机时,字节一直没有发声,当外界都在猜测字节是否已落后时,不料其突然发力。就在前不久,字节“豆包”大模型放出“全家福”,共计9个“大招”,同时将使用价格直接砍掉了99.3%,着实让整个科技领域为之震惊,正应验了那句古话:“别拿豆包不当干粮”。

根据字节的官方说法,这9个大模型为一个核心—豆包通用模型 pro,其余8个为“辅助”,那相比于其它大厂,“豆包全家福”有何不同,为何能将价格直接砍到“脚踝”?将这9个大模型拆开来看逐一分析。

豆包通用模型 pro:为字节跳动自研 LLM 模型专业版,支持 128k 长文本,全系列可精调,具备更强的理解、生成、逻辑等综合能力,适配问答、总结、创作、分类等丰富场景;豆包通用模型 lite:相比于豆包通用模型 pro更加轻量,对比专业版提供更低的token成本、更低延迟,为企业提供灵活经济的模型选择;豆包·角色扮演模型:提供个性化的角色创作能力,更强的上下文感知和剧情推动能力,满足灵活的角色扮演需求;豆包·语音合成模型:可以提供自然生动的语音合成能力,善于表达多种情绪,演绎多种场景;豆包·声音复刻模型:仅需5 秒即可实现声音 1:1 克隆,对音色相似度和自然度进行高度还原,支持声音的跨语种迁移;豆包·语音识别模型:更高的准确率及灵敏度,更低的语音识别延迟,支持多语种的正确识别;豆包·文生图模型:更精准的文字理解能力,图文匹配更准确,画面效果更优美,擅长对中国文化元素的创作;豆包·Function call模型:提供更加准确的功能识别和参数抽取能力,适合复杂工具调用的场景;豆包·向量化模型:聚焦向量检索的使用场景,为 LLM 知识库提供核心理解能力,支持多语言。

可以看出,与其他大模型相比,豆包模型更加细分也更聚焦,其推理价格进一步降低,模型性能则进一步提升。对于为何能将价格做到这么低,是否靠亏损补贴时,字节方面则表示,ToB业务亏损换收入的方式不可持续,字节火山引擎从来不走这条路。能做到降低推理价格,有一系列技术手段,未来还能做得更好,比如优化模型结构和工程手段上通过分布式推理来替代单机推理。

截至目前,字节已成功推出11款AI应用,其中豆包作为国内用户最多的独立AI应用,其MAU(月活跃用户)预估已达到2000万级别。但尽管豆包的用户基数庞大,其在AI大模型的使用量上并非全国之最。与之相比,阿里的通义千问和百度的文心一言通过网页端和API服务,目前已拥有上亿级别的用户,且API调用次数远超豆包。不过字节与阿里持有不同的策略,前者是通过高效的移动应用迭代迅速占领新兴市场,以豆包等C端APP为基础,构建一个广泛、用户众多、覆盖各类垂直领域的AI移动APP生态。而后者则是以阿里云为基石,构建了一个包含闭源和开源大模型、具备更加成熟的开发环境和工具的完整生态,主要是面向B端客户,并与钉钉等To B应用紧密结合。不过,随着“豆包全家福”的亮相,字节似乎对当前的C端AI进展表示满意,并计划加强对B端市场的进攻,这标志着其战略方向的新转变。同时,在字节宣布豆包使用费大幅降价后,阿里云等互联网巨头纷纷跟进,目前大模型的使用费降低到几乎可以忽略。

开放与保守 不同巨头上演不同的投资策略

有人会认为大厂们的联合降价,将带来“恶性竞争”,后来者几乎没有机会。这并不一定,因为大厂们除了掀起“价格战”来稳固地位外,对于行业新“领头羊”,也当起了“金主爸爸”。

在国内目前估值达10亿美元的大模型公司中(包括百川智能、智谱AI、月之暗面、MiniMax与零一万物),阿里全部参投,而腾讯参投了其中的90%(包括月之暗面、智谱AI、百川智能与MiniMax),而互联网“双B”公司—百度与字节则均参与。

对此,阿里与腾讯拥有相同的投资逻辑:只要在大模型市场中,有“跑出来”的希望,就不放过任何一个机会。

百度则持有不同的想法:在大模型领域,百度有两不投,不投贵的和不投通用大语言模型(LLM)。百川智能、智谱AI、月之暗面、MiniMax与零一万物,当前估值均已超过10亿美元,不符合百度的投资逻辑。尽管百度并未出现在任何一家大模型独角兽的投资者名单中,也使外界一度认为百度“故步自封”,在大模型领域完全依赖自主研发,将所有资源和期望都注入在“文心一言”上。但事实并非如此,从目前来看,百度并非完全孤立,在其投资的代表企业中,可以看出其产品和百度大模型文心一言存在明显的差异性。例如生数科技主要聚焦在多模态生成式大模型,心湖心辰主要开发如AI写作和AI绘画等基于大模型的应用,而百应科技和无问芯穹则主要面向ToB市场,包括给企业和政务部门搭建AI对话服务和营销系统,以及为垂直领域大模型提供软硬件一体化解决方案,也就是给大模型搭基建。

百度在大模型领域的投资策略显得尤为明智,它旨在弥补自研项目的不足,同时完善自身的技术布局。这一策略很可能是基于百度深厚的技术积累和精准的市场洞察做出的,目的是通过精准投资来推动大模型领域的整体发展,并为其自身的技术研发和应用提供稳定的支持。

而字节在公开资料中,没有投资过任何一家大模型企业,从这一次字节一次性放出9款产品,可以看出其不投资的原因是几乎把所有筹码都压在了内部创业上。

巨头联合降价 究竟在“卷”什么?

自从ChatGPT在全球范围内引起热烈讨论以来,中国市场也迅速掀起了大模型技术的热潮。众多企业和机构纷纷投身其中,投入大量的资源进行大模型技术的研发与应用,形成了新一轮的“百模大战”。这场竞赛不仅推动了技术的快速发展,也为将来大模型需求的大规模到来埋下了“伏笔”。但值得注意的是,当前大模型技术仍处于发展探索期,虽然相关成本有所下降,但整体而言仍然高昂。特别是算力成本,作为大模型技术的重要支撑,其昂贵价格依然是制约技术发展的瓶颈之一。在这种情况下,大厂们急于通过“价格战”来争夺市场份额,可能会让价格成为竞争的主导因素,而忽略了技术本身的长远发展。

因此,这轮“大模型价格战”的影响仍具有双重性:

一方面,它可能会进一步激活市场对大模型技术的需求,推动整体市场规模的扩大;

另一方面,“价格战”也可能使大厂陷入无休止的“价格战”中,无暇长期投入到技术研发中。过度的“价格战”必定会分散注意力,同时损害大厂的创新能力和研发实力,最终导致整个行业的停滞不前。

这轮“大模型价格战”的影响目前来看,取决于各大参与者的策略选择和市场环境的变化。在保持技术创新和研发实力的同时,也要注重市场需求的满足和用户体验的提升,如果一味的只靠“价格战”来占领大模型“高地”,或许本身就已经输了。

[Source]

本文系未央网专栏作者发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。

本文为作者授权未央网发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。

本文版权归原作者所有,如有侵权,请联系删除。首图来自图虫创意。

评论


猜你喜欢

扫描二维码或搜索微信号“iweiyangx”
关注未央网官方微信公众号,获取互联网金融领域前沿资讯。