火山引擎入局大模型之战,却为何不走寻常路方舟算法百川

火山引擎以一种新的姿态加入了大模型赛道的竞争,那就是基于开放的大模型服务平台模式。

可以想见的是,目前已经有如此多的企业聚焦大模型,可以说在供给侧,未来的大模型能力会和水、电、煤一样俯拾皆是。

所以,对于用户来说,不用担心没有大模型可用,反而要担心如何解决选择困难症;而对于大模型企业来说,要担心的则是推广难、获客难。

而火山引擎推出的“火山方舟”大模型服务平台,不仅为诸多大模型提供了渠道、服务链路和平台,也非常适合企业采用轻量级、多尝试、易解耦的策略,广泛的尝试多家大模型提供商不同的大模型服务,让时间和实践成为最后选择的指导,让大模型生态更加自然而健康的生长。

1. 火山引擎&大模型,另一种形态的爆发

既有王兴接盘自己老队友的初创大模型企业这样的业内轶事,也有6月28日V-Tech体验创新科技峰会上,火山引擎推出名为“火山方舟”的大模型服务平台的重磅行业新闻。

不过笔者发现,很多读者在激动之下,很容易犯一个错误——把大模型和大模型服务平台弄混。

大模型和大模型服务平台,完全是两码事。

一个强大的零部件和一套完整的服务,商业价值上有巨大的差距。

比如在数字时代里,虽然我们每个人理论上都拥有一块或几块CPU,乃至我们的每一次触碰和点击,都要用到CPU。但是实际生活中,我们都是通过使用iPhone这样的整机来间接的使用CPU的。

所以某种程度上,一个解决方案的完全体,比核心零部件提供商的商业想象空间更高——全球CPU霸主英特尔的市值是1300亿美金,炙手可热的GPU霸主英伟达的市值是1万亿美金。

但苹果公司的市值却是3万亿美金。

说回这次火山方舟的发布——其实,火山引擎在今年的春季Force原动力大会上就明确表示不会做大模型了,解答了“不做什么”的问题。

而这次火山方舟的发布,解答了“做什么”的问题。

简而言之,就是火山引擎发布的大模型服务平台“火山方舟”,它面向企业提供模型精调、评测、推理等全方位的平台服务(MaaS,即Model-as-a-Service)。

它最大的特点,就是把各家的百花齐放、各具特色的大模型,集合到自家的平台上,基于独特的多模型架构,让应用企业可同步体验、尝试、应用多个大模型,进而选用更适合自身业务需要的模型组合。

仅仅在邀请测试阶段,火山方舟就集成了百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI等多家AI科技公司及科研院所的大模型。

某种程度上,这等于把这七家企业的大模型,一下子提速到了马上可以落地应用的阶段,大模型服务平台的产业价值,也骤然彰显。

2. 头部赛道的差异化打法

虽然在6月28日这天,火山引擎并没有推出自研的大模型,但就凭火山方舟的创新服务模式,火山引擎成为了目前国内大模型赛道的最大变量之一,把自己拉到了中国“模型即服务”的第一阵营。

作为全球AI唯二的创新源地,国内目前的大模型赛道可谓“群模乱舞”,但能够进入第一阵营的只有区区几家而已。

例如阿里巴巴,它在中国云计算市场上仍然处于头部优势地位,而“模型即服务”也属于广义云服务的范畴。

由于长达十几年的云计算研发、运营经验,和AI、BigData、cloud三者融合的必然趋势,阿里巴巴在云计算相关的软硬件上都做了广泛深入的投资,技术底蕴雄厚,例如其大模型基于阿里云、达摩院打造的硬件优势,可将大模型所需算力大幅度压缩。

另外,阿里全自研的底层技术优势,也非常有利于构建AI服务的统一底层,这些都属于战略级而非战术级的优势;阿里的通义千问,也是国内第二家发布的生成式大模型。所以可以说,阿里目前已经可以基于自身大模型,向市场提供实际落地的大模型服务。

百度也不可不提。作为国内AI研发的正规军之一,百度应该是国内最早投入AI研发的互联网企业,多年累积投入千亿以上,生态建设全面。包括有深度学习框架—飞桨,有非常适合产生AI的业务——搜索……以及国内首发的生成式大模型——文心一言及其云服务模型“文心千帆”等。

火山引擎总裁谭待并不否认这些头部企业的优势,他指出,目前国内大模型市场的最顶层,还将是几家超级平台支撑的超级大模型并存的格局,这种存在是不可否认的。

图:火山引擎总裁谭待

那么,火山引擎作为相对的后来人,它的战略设计有何独特之处?

在笔者看来,火山引擎的打法,就是坚定走自己“多云多模型”的路,而不是跟着别人的节奏起舞。

所以我们看到,虽然火山引擎不直接做大模型,但通过为大模型企业提供AI基础设施,国内几十家做大模型的企业,多数已经在火山引擎的云上。

又比如,由于大量的服务于大模型企业,也使得火山引擎针对大模型的服务支撑不断强化,并打造了深层次的软硬件一体化能力,如火山引擎的自研DPU,将通信优化的算法直接写到网卡硬件中,以降低延迟、削减拥塞等。

如是的类似技术细节还有很多,但笔者认为,真正关键的不仅仅在于火山引擎的技术,还有它为大模型赛道设计的独特模式和竞争策略。

3. 多云多模型和1+N

从AI到大模型,从大模型到大模型商业化落地,其中最大的堵点,主要不是技术问题,而是商业模式问题。

Chatgpt出现之前,各家企业的AI商业化落地,都磕磕绊绊。其实最大的问题,是没有让用户看到价值,同时也不容易让用户感受到价值。

Chatgpt出现后,大家都对AI的价值看的很清楚了,但问题是,什么样的商业模式才能迅速让大模型的优势得以发挥。

这就涉及到对大模型应用模式的底层逻辑判断。

而谭待告诉笔者,他认为未来大模型应用最核心的两个特征,是“多云多模型”和“1+N”。

所谓的多云多模型,指的是——未来的企业会同时选择不同层次的多个模型和多家企业的云服务,来解决不同层次的问题。

“未来大模型赛道的格局,会是少数几家超级模型+一部分通用大模型+很多垂直领域的细分模型”,谭待说:“这就和企业用工一样,不是所有的问题都要博士毕业的员工才能解决,博士干博士的活儿、硕士、本专科生也都根据自己的能力干力所能及的工作,才是一个相对的最优解。所以未来的大模型赛道也会是,一个企业会同时用到多种模型和多种功能。”

但模型又并不是越多越好,过多的模型增加了试错的成本,增加了技术的复杂性,所以火山引擎的判断是,未来较大的可能是,一个企业选择一个主要的大模型作为主干,同时选择多个专用模型解决不同的问题,也就是“1+N”。

无论是哪一种模式,都面临一个底层逻辑——火山方舟这样的大模型服务平台,要能提供尽可能多的选择、组合,同时提供高水平的服务。

我们可以从用户和大模型提供商的角度,来看这种服务逻辑的优点。

先从对大模型用户的突出优点来看。

第一个优点,是可以快速的“试穿试用”。

火山方舟目前集成了百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI等,未来可想而知的还会集成更多的大模型提供商。在火山方舟的统一支撑下,企业可以灵活选择、低成本试错,不用跨平台就能寻找更适合自己企业的模型服务。

第二个优点,是获得与模型提供商一致的服务。

火山方舟的“模型精调”模式,就是一个实用价值很高的服务。

火山引擎智能算法负责人吴迪指出,从短期看,训练大模型很昂贵,但是从长期看,模型的推理开销会超过训练开销。

图:火山引擎智能算法负责人吴迪

这意味着,模型并不是越大越好。例如,微软以医学文章为主要数据集,精调了生物领域的BioGPT-Large模型,仅有15亿参数,但在 PubMedQA 基准测试中的准确率,却优于有着上千亿乃至数千亿参数的大型通用语言模型。

而“火山方舟”提供了丰富的模型精调和评测支持。甚至可以让一家企业用统一的工作流对接多家大模型,再通过自动化和人工评估直观对比模型精调效果。

而精调其实也是需要很高的技术门槛的,所以火山方舟还将通过提供运营干预工具,让用户可以快速设置相关规则,这样在模型已经投入使用后,无需精调模型即可干预模型输出结果。

总之,是怎么便宜、实用、方便,就怎么来。

第三个优点,是超强的安全性。

聚合多模型、服务多用户,这样的架构决定了一个问题会被凸显出来,那就是安全问题。

既有模型服务商的安全问题,也有用户的安全问题。前者在意大模型的源代码安全,后者在意自己独家且精调过的数据的安全。

而火山方舟对用户的需求把握精准,通过互信计算框架,满足基于不同客户的安全和隐私保护诉求,设计了包括安全沙箱、可信硬件以及联邦学习方案,来保证合作的多方在互信的基础上推理、精调等,让模型提供商和用户都更加放心的使用。

这将是火山方舟的一个重要竞争力。

接下来,我们再分析一下火山方舟模式对于大模型服务商的优势。

首先,火山引擎作为一个成熟的云计算服务商,将很好的提升大模型企业和市场对接的效率,让大模型企业跳过“冷启动期”。

其实,无论是大模型开发企业单独提供服务,还是通过火山方舟平台,服务用户的路径在原理上基本是类似的。

但对于大模型开发企业来说,特别是在早期,单独修建这样一条服务路径的成本不仅很高,而且只能由企业自身承担,这样效率不仅低下,成本也很难被摊薄。

而加入火山方舟就相当于把商品放进了成熟的渠道,不但可以共用路径、共享服务,还可以得到火山引擎的能力加持,等于说跳过了冷启动阶段,直接进入了服务落地阶段。这对于初创大模型企业的吸引力十分巨大。

其次,火山引擎提供了应用企业所需的、完整的技术支持。

火山方舟一切从实际需求出发来提供服务——模型厂商担心算力和工程稳定性,火山引擎就提供技术支持;大模型要真正应用,安全信任和推理成本问题必须解决,火山方舟就实现了安全互信计算;更不要说,还有前叙的模型精调支持、训推一体等服务,并且可以通过公有云的弹性,帮助厂商降低成本。

最后,随着越来越多的模型被集成,有可能酝酿新的模式和能力。

我们反复的讨论过,无论是“多云多模型”还是“1+N”,本质都是不同层次、不同功能的模型能力的组合。而火山方舟的开放性,决定了这种组合是跨平台的,其组合形态和数量级会指数级的提升,因而,也为酝酿出基于全盘的最优组合乃至跨越式创新提供了机会,它不仅将成为模型服务的集合者,也会成为模型服务的创新平台。

结语:

客观的说,虽然大模型之战非常火热,但其实总体上来说,还是很初级的阶段,而其原因是多方面的:

一个是大模型技术远远没有固化,未来发展可期;

一个是现在对大模型发展路径已经开始发生争议,未来发展充满挑战;

一个是大模型的商业化落地还在探索,这才是最终决定大模型的价值体现的关键一步;

但是,很显然,大模型的开发,并不是任何企业都可以胜任的。未来这个赛道会有非常细的生态分层,例如最具实力的去开发超级大模型,有一定实力的可能专攻产业级大模型,甚至精调、预训练、数据等领域都会产生新的独角兽。

而火山方舟的价值在于,在赛道的极早期就卡位在聚合多模型的大模型服务平台的定位上,为未来发展繁衍出超级生态进行了周到的布局。

当然,不得不说的是,多模型聚合是未来模型即服务的方向,现在也有越来越多的企业宣布自己集成更多的大模型,这既是这个赛道发展的必然,也是火山方舟未来也要面对更激烈的挑战的前奏。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

THE END
0.大模型定价低于行业价格99%,火山引擎助力车企加速驶入“AI时代”近日,火山引擎举办2024春季Force原动力大会,首次发布了字节跳动自研大模型家族、升级火山方舟大模型服务平台,并联合中国电动汽车百人会、中国一汽等20余家组织、厂商成立汽车大模型生态联盟,探索新一代人车交互形态、提升汽车全场景AI新体验,全方位赋能汽车产业智能化转型。面对智能化带来的颠覆性变革,汽车产业要如何从容应jvzq<84yyy4dpjzvqpkxu7hqo1npw|mkejgoi8724651787:1fkucrqa42852>7:58;48@3jvor
1.“火山方舟”发布构建大模型服务平台6月28日,字节跳动旗下火山引擎发布大模型服务平台“火山方舟”,面向企业提供模型精调、评测、推理等服务。目前,“火山方舟”集成了百川智能、出门问问、智谱AI等多家AI科技公司及科研院所的大模型。 今年以来,云厂商纷纷召开相关产品发布会,而大模型成为吸引关注的重要砝码。3月底和4月初,百度和阿里巴巴先后公布大模jvzq<84hkgre0:5lsmg/exr0ep532;8284?0e?9:626:2@3ujvsm
2.云+AI,火山引擎助力泛互联网行业创新和增长火山引擎AI火山引擎凭借多年的技术沉淀和产品创新,已经形成云基础设施、豆包大模型和方舟2.0的全栈产品体系,可助力企业构建一个可信赖的大模型应用平台,满足企业在 AI 时代下的多元化需求,在数字化转型的道路上加速前行。 火山引擎智能算法负责人、火山方舟负责人吴迪表示,作为云基础设施提供商,火山引擎通过模型效果优化、系统性能强化、成本持续降 jvzquC41pg}t0|npc0ipo7hp1u~04976/2;.4=4fgvgjn6npcyogv};:379827xjvor
3.火山方舟点击查看豆包大模型手把手应用教程与解决方案白皮书 立即查看 最新活动 企业开通最新模型享五折,19.9元限量抢购最新模型千万Tokens 立即秒杀 特惠活动 最新福利 协作奖励计划二期全面升级,免费每日领取单模型最高500万Tokens 立即参与 极速体验火山方舟 极速体验模型 jvzquC41yy}/xxqegpmjpn3eqo5qtxiwev5btt
4.大模型产业,Maas成“风”?朱啸虎模型火山不同模型在不同的场景下,效果是各擅胜场。一个经过良好精调的中小规格模型,在特定工作上的表现可能不亚于通用的、巨大的基座模型,而推理成本可以降低到原来的十分之一。 在这种综合认知下,与其他大模型厂商所走的路径有所不同,火山引擎的切入方式并非是从头自研,而是发布大模型服务平台“火山方舟”,面向企业提供jvzq<84m0uooc7hqo0io1jwvkerfa@9836858>8a3dice=j2f2622:=:sd4ivvq
5.开发者指南|从购买到实战,手把手教你玩转火山方舟CodingPlan它兼容Anthropic API等主流开发环境,让你无需修改现有的集成代码,就能将豆包模型接入。 完美支持Claude Code、veCLI、Cursor、Cline、Codex CLI等主流工具环境,Coding Plan 都能很好地支持,让你在熟悉的工具中调用豆包模型。 稳定可靠的保障: 所有服务均依托火山方舟超大资源池,告别卡顿和排队,为你提供稳定、畅快的算力jvzquC41dnuh0lxfp0tfv8hufpyru}52685bt}neng5eg}fknu527=>73;:9
6.火山方舟大模型智能数据洞察(私有化)火山方舟大模型是特色专区算子中的智能化数据处理工具,支持对接火山引擎大模型服务,通过自定义模型配置、生成策略及角色人设,实现非结构化数据解析、多语言翻译等功能,适用于企业数据智能化处理场景。本文为您介绍如何使用火山方舟大模型。 功能概述 火山方舟大模型算子对接火山引擎大模型服务,可对存储在 TOS 存储桶中的jvzquC41yy}/xxqegpmjpn3eqo5eqlx169871:;237?5
7.DeepSeek+CherryStudio本地部署大模型(简单能用)三、对接火山引擎 豆包 使用抖音号、手机号、头条号注册均可 3.1注册 3.1.1进入控制台 3.2.2 进入火山方舟 点击左上角蓝色区域 点击火山方舟 3.2开通模型 3.3创建接入点 3.3.1创建 3.3.2复制模型ID 四、火山引擎接入cherryStudio 4.1添加模型 4.2接入检查 jvzquC41dnuh0lxfp0tfv8r2a8799;<2;1gsvrhng1jfvjnnu1762=77397
8.方舟招聘方舟招聘招聘AML-火山方舟大模型推理系统工程师 【上海-江湾】 35-65k·15薪 5-10年本科 字节跳动 互联网融资未公开10000人以上 杜女士 HRBP 汉氏方舟东营健康科普中心 【东营-西四路】 20-30k 3-5年大专 东营市优而美生物科技有限公司 专业技术服务1-49人 jvzquC41yy}/nrjrkp4dqv4u19?c6:96eg6ch:f3cd=4c?ih84k1g@hc51
9.豆包大模型应用落地,又有新进展。8月21日,火山引擎在AI创新巡展活搭载火山方舟大模型服务平台,通过火山引擎RTC实现语音数据的高效采集、处理和传输,并深度整合豆包·语音识别模型和豆包·语音合成模型,简化语音到文本和文本到语音的转换过程,火山引擎对话式AI实时交互解决方案,提供优秀的智能对话和自然语言处理能力,帮助应用快速实现用户和云端大模型的实时语音通话。 jvzquC41zwkrk~3eqo522B<86;9748823;>95?>
10.MetaGPT配置各个大模型APImetagpt配置qwen本地部署的大模型我们以OpenAI API为例说明配置过程,其他大模型的API配置过程是相同的。 您可以通过设置 config2.yaml完成配置 使用config2.yaml 在当前工作目录中创建一个名为config的文件夹,并在其中添加一个名为config2.yaml的新文件。 将示例config2.yaml文件的内容复制到您的新文件中。 jvzquC41dnuh0lxfp0tfv8f994916=6;1cxuklqg1fkucrqu13:739<9:2
11.微信小程序接入DeepSeek模型(火山方舟),并在视图中流式输出通过流式输出,DeepSeek模型可以在处理过程中实时地将结果发送给小程序,小程序前端则能够立即接收到这些数据,并在视图中动态展示出来。这样,用户就可以边等待边看到已经接收到的结果,大大提升了用户体验。 本文中的DeepSeek模型为火山方舟(字节跳动火山引擎)中的DeepSeek大模型,当前可以免费使用。jvzquC41dnuh0lxfp0tfv8qhs9<24991ctzjeuj1fgzbkux136;:;A<94
12.大模型加持,火山引擎加速数据价值的“飞轮效应”|火山引擎|字节今年6月,火山引擎推出了大模型服务平台火山方舟,来拥抱大模型时代的到来。在此次大会中,火山引擎数智平台VeDI对数据产品大数据研发治理套件DataLeap和智能数据洞察DataWind进行了升级,以AI加持,降低企业数据消费门槛。 字节跳动数据平台负责人罗旋表示:“无论何种技术赋能,其核心都在于进一步降低业务使用门槛,更好地探索数据jvzq<84m0uooc7hqo0io1jwvkerfa:<;:9=84=h23?14{t{30nuou