火山引擎的“低姿态”,和“多云多模型”的未来

©️深响原创 · 作者|何文

在争辩中,在实践中,大模型于国内的发展趋势渐渐清晰。

相比几个月前的“狂热”,大模型入局者开始变得冷静,落地产业已成共识。而在市场端,来自零售、金融、制造、政务等领域的客户也表现出了蓬勃且明确的需求,大模型被各界视为智能化升级的关键抓手。

此情此景下,基于供给侧大模型持续迭代,大模型应用侧正在迎来快速发展。客户也逐渐找到务实的应用之道,出于成本和具体场景的考虑,企业对大模型的应用往往是“多线并行”,有主力模型也有协助模型。这意味着行业需要千亿参数的通用大模型,也需要百亿、十亿参数的模型。

这些趋势共同说明的问题是:大模型要渗透到千行百业,需要有更多的模型提供方和需求方,需要一个繁荣的生态。

这样的生态必然是多方努力的结果。而就在趋势逐渐明晰的时候,火山引擎迈出了新的一步。

火山方舟,搭台做服务

6月28日,在2023火山引擎V-Tech体验创新科技峰会上,火山引擎发布了大模型服务平台“火山方舟”。这是一个连接着大模型供给方和需求方的服务平台。

你可以把它理解为集合多家旗舰店的商城,客户可以在上面接触优质的大模型,并基于火山方舟的功能,低门槛地应用大模型。目前,MiniMax、智谱AI、复旦MOSS、百川智能、IDEA、澜舟科技、出门问问等企业旗下的大模型已经“登陆”火山方舟。根据火山引擎方面的披露,火山方舟的首批邀测企业包括了金融、汽车、消费等众多行业的客户。

具体而言,火山方舟的重点功能分为模型广场、模型精调、模型评测、模型推理、应用插件和运营干预工具。每项功能都有它的针对性。

例如,供应方可以在模型广场上进行模型的创建、上传、部署,需求方则能看到模型效果并快捷体验。熟悉大模型的人都会知道,要在实际场景里应用大模型,基于自家数据的训练和精调必不可少。火山方舟的模型精调简化了这个步骤,客户只需选择模型并上传标注数据集即可完成精调。此外,客户也将在这个过程中建设和积累自己的精调数据集,形成自己宝贵的数据资产。

其他功能指向的同样是大模型使用方的痛点。以模型评测为例,市面上有那么多模型,客户会希望在购买服务前先做测评。简而言之,火山方舟希望为大模型供需双方“搭好台”,让双方能更专注地“做好自己的事”,更高效地触及彼此。

为此,火山方舟上投入了自身的所有优势和资源,比如充沛的算力、高速训练模型、安全互信机制。为了推动企业搭上大模型快车,火山方舟还在“搭台”的同时,为企业提供更多服务支持。峰会上,北京银行CIO龚伟华表示,北京银行将与火山方舟合作,在算力优化、模型精调等方面展开研究,共同推动金融风控、营销等模型应用落地。

无论是对于模型供给方,还是需求方,火山方舟都是一个标准的“服务平台”。这一定位相当特别,你很难用一个简单的“支持方”或是“撮合者”来描述火山方舟。

该如何理解火山方舟的定位?一切都要回到一个最基本的问题:当前的大模型市场,到底需要什么?

在有需要的地方,做擅长的事

在如何布局大模型的问题上,目前许多公司都给出了答案。他们发布了自研大模型,发布了基于自身模型打造的模型平台,强调的是“来接入我们的模型”。相比之下,火山引擎似乎没有想当“主角”的意思。

一方面,这次发布的火山方舟是完全开放的,来自外部的优质大模型都能登陆平台,企业客户可以根据实际需要自由选择模型。另一方面,火山方舟也不仅仅是卖算力或提供技术底座,它还深入到了和模型提供方、企业客户的合作中,帮着模型提供方降低训练和推理的成本,帮着企业去做应用落地。

这些相对“低姿态”的动作,是火山引擎基于对行业的判断做出的。在今年4月的“FORCE原动力”大会上,火山引擎总裁谭待表示,企业使用多家云服务已成常态,同时各行业也都拥有自己的私有训练语料,大模型会在千行百业中生长,并形成多模型共生甚至协作的生态。“未来将是‘多云多模型’的时代。”

有了对行业的判断,火山引擎接下来做的是深入市场,了解趋势中的企业需要什么。在峰会后的交流中,谭待表示,模型厂商的需求主要是“尽快把自己的大参数模型训练出来”,企业关心的则是如何把大模型应用在具体的营销、客服场景中,以及如何处理好成本和安全的问题。

火山引擎在其中找到了发挥自身价值的空间——模型厂商担心算力和工程稳定性,火山引擎就提供技术支持;大模型要真正应用,安全信任和推理成本问题必须解决,火山方舟就实现了安全互信计算,并通过模型精调支持、训推一体和公有云的弹性,帮助厂商降低成本,助力市场上大模型的“百花齐放”。

“百花齐放”是市场的明确需求。模型应用侧的企业是极度务实的,他们看重的是效果好不好,成本高不高。一个强大的通用大模型固然很好,但在某些具体场景会显得“大材小用”,且在财务上也不划算。因此,千亿、百亿、十亿参数的模型都有市场价值。

谭待打了个比方:通用大模型好比工资高的博士,但不少应用场景只是“小学数学题”水平,用付给博士的价格去解小学题显然是不合理的。因此不少企业会选择精调后的中小模型,在获得媲美大模型效果的同时,降低推理成本。

但这会带来另一个问题,要同时应用多个模型,还要在这些模型上做精调,一是得有足够多模型可以选,二是要有足够丰富便捷的工具可以用。所以你会发现,火山方舟的每个功能都是从实际的供需痛点延伸出来的。它更多地聚焦在市场需求上,做自己擅长的事,推动大模型在千行百业的渗透。

一个好的技术创新一定是普适的、普惠的。它不是只为解决“大问题”的重器,也不是只有少数人买得起的昂贵方案。“多云多模型”生态是大模型普适、普惠的一种可能性,而火山引擎正在做的,是让这种可能性来得更快,更有持续性。

持续性指的是,大模型技术会不断迭代,企业需求也在变化,行业需要一个让供需两端稳定对接,并随着时代发展不断变化的“统一的工作流”。这也是火山方舟试图实现的,基于火山方舟,模型将应用于场景,场景数据又将反哺模型。这样的“模型-场景”数据闭环对供需两端都有价值,也是大模型新可能性的来源。

基于“火山方舟”,抖音集团内部已有十多个业务团队在代码纠错等研发提效场景,文本分类、总结摘要等知识管理场景,以及数据标注、归因分析等方面进行探索。与此同时,来自不同行业的客户也在积极探索大模型落地的方式。

随着各方实践持续进行,关于大模型的着眼点和着手点都将变得更丰富。一个丰富的大模型生态正在被构建,而这需要不同层别、不同环节的从业者的共同努力。没有谁能靠一己之力做完所有的事。从火山方舟的一系列功能和发力点来看,火山引擎在知行合一的路又进了一步。

THE END
0.大模型定价低于行业价格99%,火山引擎助力车企加速驶入“AI时代”近日,火山引擎举办2024春季Force原动力大会,首次发布了字节跳动自研大模型家族、升级火山方舟大模型服务平台,并联合中国电动汽车百人会、中国一汽等20余家组织、厂商成立汽车大模型生态联盟,探索新一代人车交互形态、提升汽车全场景AI新体验,全方位赋能汽车产业智能化转型。面对智能化带来的颠覆性变革,汽车产业要如何从容应jvzq<84yyy4dpjzvqpkxu7hqo1npw|mkejgoi8724651787:1fkucrqa42852>7:58;48@3jvor
1.“火山方舟”发布构建大模型服务平台6月28日,字节跳动旗下火山引擎发布大模型服务平台“火山方舟”,面向企业提供模型精调、评测、推理等服务。目前,“火山方舟”集成了百川智能、出门问问、智谱AI等多家AI科技公司及科研院所的大模型。 今年以来,云厂商纷纷召开相关产品发布会,而大模型成为吸引关注的重要砝码。3月底和4月初,百度和阿里巴巴先后公布大模jvzq<84hkgre0:5lsmg/exr0ep532;8284?0e?9:626:2@3ujvsm
2.云+AI,火山引擎助力泛互联网行业创新和增长火山引擎AI火山引擎凭借多年的技术沉淀和产品创新,已经形成云基础设施、豆包大模型和方舟2.0的全栈产品体系,可助力企业构建一个可信赖的大模型应用平台,满足企业在 AI 时代下的多元化需求,在数字化转型的道路上加速前行。 火山引擎智能算法负责人、火山方舟负责人吴迪表示,作为云基础设施提供商,火山引擎通过模型效果优化、系统性能强化、成本持续降 jvzquC41pg}t0|npc0ipo7hp1u~04976/2;.4=4fgvgjn6npcyogv};:379827xjvor
3.火山方舟点击查看豆包大模型手把手应用教程与解决方案白皮书 立即查看 最新活动 企业开通最新模型享五折,19.9元限量抢购最新模型千万Tokens 立即秒杀 特惠活动 最新福利 协作奖励计划二期全面升级,免费每日领取单模型最高500万Tokens 立即参与 极速体验火山方舟 极速体验模型 jvzquC41yy}/xxqegpmjpn3eqo5qtxiwev5btt
4.大模型产业,Maas成“风”?朱啸虎模型火山不同模型在不同的场景下,效果是各擅胜场。一个经过良好精调的中小规格模型,在特定工作上的表现可能不亚于通用的、巨大的基座模型,而推理成本可以降低到原来的十分之一。 在这种综合认知下,与其他大模型厂商所走的路径有所不同,火山引擎的切入方式并非是从头自研,而是发布大模型服务平台“火山方舟”,面向企业提供jvzq<84m0uooc7hqo0io1jwvkerfa@9836858>8a3dice=j2f2622:=:sd4ivvq
5.开发者指南|从购买到实战,手把手教你玩转火山方舟CodingPlan它兼容Anthropic API等主流开发环境,让你无需修改现有的集成代码,就能将豆包模型接入。 完美支持Claude Code、veCLI、Cursor、Cline、Codex CLI等主流工具环境,Coding Plan 都能很好地支持,让你在熟悉的工具中调用豆包模型。 稳定可靠的保障: 所有服务均依托火山方舟超大资源池,告别卡顿和排队,为你提供稳定、畅快的算力jvzquC41dnuh0lxfp0tfv8hufpyru}52685bt}neng5eg}fknu527=>73;:9
6.火山方舟大模型智能数据洞察(私有化)火山方舟大模型是特色专区算子中的智能化数据处理工具,支持对接火山引擎大模型服务,通过自定义模型配置、生成策略及角色人设,实现非结构化数据解析、多语言翻译等功能,适用于企业数据智能化处理场景。本文为您介绍如何使用火山方舟大模型。 功能概述 火山方舟大模型算子对接火山引擎大模型服务,可对存储在 TOS 存储桶中的jvzquC41yy}/xxqegpmjpn3eqo5eqlx169871:;237?5
7.DeepSeek+CherryStudio本地部署大模型(简单能用)三、对接火山引擎 豆包 使用抖音号、手机号、头条号注册均可 3.1注册 3.1.1进入控制台 3.2.2 进入火山方舟 点击左上角蓝色区域 点击火山方舟 3.2开通模型 3.3创建接入点 3.3.1创建 3.3.2复制模型ID 四、火山引擎接入cherryStudio 4.1添加模型 4.2接入检查 jvzquC41dnuh0lxfp0tfv8r2a8799;<2;1gsvrhng1jfvjnnu1762=77397
8.方舟招聘方舟招聘招聘AML-火山方舟大模型推理系统工程师 【上海-江湾】 35-65k·15薪 5-10年本科 字节跳动 互联网融资未公开10000人以上 杜女士 HRBP 汉氏方舟东营健康科普中心 【东营-西四路】 20-30k 3-5年大专 东营市优而美生物科技有限公司 专业技术服务1-49人 jvzquC41yy}/nrjrkp4dqv4u19?c6:96eg6ch:f3cd=4c?ih84k1g@hc51
9.豆包大模型应用落地,又有新进展。8月21日,火山引擎在AI创新巡展活搭载火山方舟大模型服务平台,通过火山引擎RTC实现语音数据的高效采集、处理和传输,并深度整合豆包·语音识别模型和豆包·语音合成模型,简化语音到文本和文本到语音的转换过程,火山引擎对话式AI实时交互解决方案,提供优秀的智能对话和自然语言处理能力,帮助应用快速实现用户和云端大模型的实时语音通话。 jvzquC41zwkrk~3eqo522B<86;9748823;>95?>
10.MetaGPT配置各个大模型APImetagpt配置qwen本地部署的大模型我们以OpenAI API为例说明配置过程,其他大模型的API配置过程是相同的。 您可以通过设置 config2.yaml完成配置 使用config2.yaml 在当前工作目录中创建一个名为config的文件夹,并在其中添加一个名为config2.yaml的新文件。 将示例config2.yaml文件的内容复制到您的新文件中。 jvzquC41dnuh0lxfp0tfv8f994916=6;1cxuklqg1fkucrqu13:739<9:2
11.微信小程序接入DeepSeek模型(火山方舟),并在视图中流式输出通过流式输出,DeepSeek模型可以在处理过程中实时地将结果发送给小程序,小程序前端则能够立即接收到这些数据,并在视图中动态展示出来。这样,用户就可以边等待边看到已经接收到的结果,大大提升了用户体验。 本文中的DeepSeek模型为火山方舟(字节跳动火山引擎)中的DeepSeek大模型,当前可以免费使用。jvzquC41dnuh0lxfp0tfv8qhs9<24991ctzjeuj1fgzbkux136;:;A<94
12.大模型加持,火山引擎加速数据价值的“飞轮效应”|火山引擎|字节今年6月,火山引擎推出了大模型服务平台火山方舟,来拥抱大模型时代的到来。在此次大会中,火山引擎数智平台VeDI对数据产品大数据研发治理套件DataLeap和智能数据洞察DataWind进行了升级,以AI加持,降低企业数据消费门槛。 字节跳动数据平台负责人罗旋表示:“无论何种技术赋能,其核心都在于进一步降低业务使用门槛,更好地探索数据jvzq<84m0uooc7hqo0io1jwvkerfa:<;:9=84=h23?14{t{30nuou