大模型产业,aas成“风”

在高企的算力、场景、研发壁垒之下,并不是所有企业都适合自研大模型,对于大多数企业而言,需要更经济的参与方式。

‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍前些时候,“天才黑客”George Hotz在接受Latent Space(一家AI技术播客)采访时曾透露,OpenAI的GPT-4其实是一个由8个2200亿参数组成的混合专家模型,核算下来,即为1.76万亿参数。同时,这些模型还经过了针对不同数据、任务分布及推理的训练。

尽管这种说法并没有得到OpenAI官方回应,但随着这一讨论的持续发酵,另外两个话题也随即被推向了舆论的前端。

一个是统治了半导体产业大半个世纪的“摩尔定律”或已走向终结,取而代之的,将是锚定在算力层的“新摩尔定律”;另一个则是暴涨的算力需求,会快速诱发算力焦虑,以及各路玩家对于算力资源的争夺。

尽管眼下大模型风头最盛,但众所周知,大模型对于数据、算力、投入等方面的极高的要求,市场已经逐渐意识到——似乎并不是所有企业都适合自行开发,对于大多数企业而言,或许需要一种“更经济”方式,参与到新生产力时代。

时代呼唤新的数字基础设施服务商。从云入端,数字基础设施服务商应该如何切入、怎么部署,或许,我们可以从6月28日火山引擎大模型发布会上找到一些答案。

关于自研大模型的 “ 机会问题 ” ,金沙江创投的朱啸虎与正在进行 GPT创业的傅盛恰好有过一轮交锋。

作为创业者,傅盛认为,大模型催生了很多新的架构在大模型之上的创业机会,但作为投资方的朱啸虎,则认为大模型摧毁了创业。因为模型、算力和数据,到目前阶段已经多数集中于大厂。

这种认知,是朱啸虎在AIGC领域投资多次之后所得出的结论。而在后续回应中,朱啸虎的千言万语则汇成了八个字:场景优先,数据为王。

一位科技领域资深学者也曾表达过同样的观点。在他看来,通用大模型是一项高耗能、高投入的“长期事业”,无论是出于能力方面的考虑,还是出于必须性方面的考虑,自研大模型并非适用于所有企业。

对于绝大多数企业(特别是中小企业)而言,想要搭乘大模型的“快车”实现将本增效,最理性的选择,或是借助一些外部数字基础设备服务商的力量,有针对性地解决场景应用问题。

对此,火山引擎总裁谭待则认为,在模型应用端,面对多模型生态和企业1+N应用模式,同样需要提供更好的产品和方案,解决这里面计算、安全、成本等通用问题。让交易成本足够低,让替代成本足够低,这样才能不断降低大模型的使用门槛,让众多企业可以更加高效的应用大模型技术。

只不过,随着不同产业、不同企业对大模型需求的暴涨,技术密度、网络带宽、存储需求等等,都呈现出几何级增长,算力的巨量消耗显然是一个无法忽视的问题。火山引擎算法负责人吴迪将其划分为“三级火箭”的体系——

第一级的大模型供应商和研究机构,负责为全行业提供具备竞争力的基座模型和垂直模型;第二级技术积累深厚的公司,在保留自研模型的同时,也会调用其他厂商的模型落地至不同场景;第三级的各行业大模型应用商,则会把大模型能力深入到生活的各个领域。

大模型一旦进入大规模应用阶段,用来调试和推理的算力消耗,将会迅速超过了模型预训练所需的部分。按照吴迪的预测,到2024年秋天之后,以推理为主的大模型算力消耗,将超过预训练消耗的60%,并且在2025年的某个时刻,超越预训练算力消耗。

在此基础上,对于在应用层跃跃欲试的大模型应用企业来说,与其绑定某一家厂商的大模型,同样的成本如果拿来调用多个精调之后的垂类模型,效果可能会更好。原因无他,性价比是选用模型的核心因素——

不同模型在不同的场景下,效果是各擅胜场。一个经过良好精调的中小规格模型,在特定工作上的表现可能不亚于通用的、巨大的基座模型,而推理成本可以降低到原来的十分之一。

在这种综合认知下,与其他大模型厂商所走的路径有所不同,火山引擎的切入方式并非是从头自研,而是发布大模型服务平台“火山方舟”,面向企业提供模型精调、评测、推理等全方位的平台服务(MaaS,即Model-as-a-Service)。

从这种结构来看,“火山方舟”正试图打造一家初具规模的“AI商店”,某种意义上,这或许也是大模型行业发展的某种必然。

对于大部分企业而言,大模型的需求固然已经出现,但在 “ 万模竞发 ” 大背景下,应该如何选择适配自己真实需求的大模型,同样也是一道难题。

所谓“难”,主要体现在两个方面——

其一,与判别式AI相比,生成式AI暂时没有行业标准可供参考,企业如果按传统的销售逻辑一家家寻找和调用,成本显然难以控制。

其二,企业使用大模型,数据泄露是首要担心的问题。谭待提到,与此前的深度学习实践不同,模型提供方和使用方,现在很可能已经出现了分离;特别是,如果到了私有化部署的阶段,不仅作为使用方的企业要承担更高成本,作为模型生产方也会担心自己的知识资产。

早在今年初,三星公司在“全面拥抱”ChatGPT之后,在20天内就发生了3起机密外泄事件,其中两次和半导体设备有关,1次和内部会议有关。这让三星半导体的核心机密,通过ChatGPT泄露。

究其原因,三星员工直接将企业机密信息以提问的方式输入到ChatGPT中,会导致相关内容进入学习数据库,从而可能泄漏给更多人。在“数据防火墙”构建尚未完善时,贸然在公司业务中使用大模型的风险,不言而喻。

正因如此,火山方舟已经上线了基于安全沙箱的大模型安全互信计算架构。根据吴迪的介绍,该方案采用了计算隔离、存储隔离、网络隔离和流量审计等手段,以确保模型的机密性、完整性和可用性。

此外,对于如何选择适合企业的大模型,谭待给出了自己一些想法,他认为,企业首先需要明确自己的需求,并基于需求场景,制定可量化的评估指标。

这意味着,模型的能力主要分为逻辑推理、文本生成和风险控制等很多种,各种能力的不同侧重导致了成本分布的不同。企业根据自己的需求,需要对这些能力进行全方位测评,选择性价比最合适的。

无论是数据安全还是模型精调,都是企业在构建、训练大模型过程中不可或缺的环节。这也是火山方舟所能提供的重要价值之一。

在接受媒体采访时,谭待更是重申了火山方舟的平台属性。他认为,基于此前的多模型行业判断,所以需要平台提供对应的多模型服务能力,让企业可以更方便使用对应模型。

回到火山方舟,在目前阶段,同样也并不会下场做自研模型,而是侧重于为企业提供安全、低成本的服务平台。

如果简单翻译则是,在同一个“选模型”流程下,企业可以同时对多个模型同时进行调试和能力评测,甚至在不同场景下,还可以灵活切换不同的模型,实现最优的模型组合。这也是火山引擎一直强调多模型“高性价比”的意义所在。

值得注意的是,火山方舟上线的可用模型数量在7个左右。这也是火山方舟“精品策略”的体现。如智谱AI旗下的千亿基座认知模型ChatGLM,通过与火山方舟的精调能力和综合解决方案相结合,已经成功解决了千亿模型训练的稳定性、性能优化等挑战。

在MMLU、C-Eval等中英文权威榜单中表现优异的baichuan-7B同样也是如此,入驻火山方舟之后,企业用户的大模型接入门槛和使用成本出现了显著下降,对于更多企业而言,以较低成本获取专业服务,自此成了现实。

尽管大模型方兴未艾,但业内已基本形成了这样一种共识:大模型真正的价值体现,还是落脚在能与企业的实际需求相结合,并最终在产业层面激活生产力。

无论是“多模型”火山方舟,还是其他科技企业发布的大模型产品,对于这些数字基础设施服务上来说,接下来要做的事情还有:AI基础设施的创新突破,产业链的深度构造,行业的持续下沉,以及开发者生态的孕育等等。

THE END
0.大模型定价低于行业价格99%,火山引擎助力车企加速驶入“AI时代”近日,火山引擎举办2024春季Force原动力大会,首次发布了字节跳动自研大模型家族、升级火山方舟大模型服务平台,并联合中国电动汽车百人会、中国一汽等20余家组织、厂商成立汽车大模型生态联盟,探索新一代人车交互形态、提升汽车全场景AI新体验,全方位赋能汽车产业智能化转型。面对智能化带来的颠覆性变革,汽车产业要如何从容应jvzq<84yyy4dpjzvqpkxu7hqo1npw|mkejgoi8724651787:1fkucrqa42852>7:58;48@3jvor
1.“火山方舟”发布构建大模型服务平台6月28日,字节跳动旗下火山引擎发布大模型服务平台“火山方舟”,面向企业提供模型精调、评测、推理等服务。目前,“火山方舟”集成了百川智能、出门问问、智谱AI等多家AI科技公司及科研院所的大模型。 今年以来,云厂商纷纷召开相关产品发布会,而大模型成为吸引关注的重要砝码。3月底和4月初,百度和阿里巴巴先后公布大模jvzq<84hkgre0:5lsmg/exr0ep532;8284?0e?9:626:2@3ujvsm
2.云+AI,火山引擎助力泛互联网行业创新和增长火山引擎AI火山引擎凭借多年的技术沉淀和产品创新,已经形成云基础设施、豆包大模型和方舟2.0的全栈产品体系,可助力企业构建一个可信赖的大模型应用平台,满足企业在 AI 时代下的多元化需求,在数字化转型的道路上加速前行。 火山引擎智能算法负责人、火山方舟负责人吴迪表示,作为云基础设施提供商,火山引擎通过模型效果优化、系统性能强化、成本持续降 jvzquC41pg}t0|npc0ipo7hp1u~04976/2;.4=4fgvgjn6npcyogv};:379827xjvor
3.火山方舟点击查看豆包大模型手把手应用教程与解决方案白皮书 立即查看 最新活动 企业开通最新模型享五折,19.9元限量抢购最新模型千万Tokens 立即秒杀 特惠活动 最新福利 协作奖励计划二期全面升级,免费每日领取单模型最高500万Tokens 立即参与 极速体验火山方舟 极速体验模型 jvzquC41yy}/xxqegpmjpn3eqo5qtxiwev5btt
4.大模型产业,Maas成“风”?朱啸虎模型火山不同模型在不同的场景下,效果是各擅胜场。一个经过良好精调的中小规格模型,在特定工作上的表现可能不亚于通用的、巨大的基座模型,而推理成本可以降低到原来的十分之一。 在这种综合认知下,与其他大模型厂商所走的路径有所不同,火山引擎的切入方式并非是从头自研,而是发布大模型服务平台“火山方舟”,面向企业提供jvzq<84m0uooc7hqo0io1jwvkerfa@9836858>8a3dice=j2f2622:=:sd4ivvq
5.开发者指南|从购买到实战,手把手教你玩转火山方舟CodingPlan它兼容Anthropic API等主流开发环境,让你无需修改现有的集成代码,就能将豆包模型接入。 完美支持Claude Code、veCLI、Cursor、Cline、Codex CLI等主流工具环境,Coding Plan 都能很好地支持,让你在熟悉的工具中调用豆包模型。 稳定可靠的保障: 所有服务均依托火山方舟超大资源池,告别卡顿和排队,为你提供稳定、畅快的算力jvzquC41dnuh0lxfp0tfv8hufpyru}52685bt}neng5eg}fknu527=>73;:9
6.火山方舟大模型智能数据洞察(私有化)火山方舟大模型是特色专区算子中的智能化数据处理工具,支持对接火山引擎大模型服务,通过自定义模型配置、生成策略及角色人设,实现非结构化数据解析、多语言翻译等功能,适用于企业数据智能化处理场景。本文为您介绍如何使用火山方舟大模型。 功能概述 火山方舟大模型算子对接火山引擎大模型服务,可对存储在 TOS 存储桶中的jvzquC41yy}/xxqegpmjpn3eqo5eqlx169871:;237?5
7.DeepSeek+CherryStudio本地部署大模型(简单能用)三、对接火山引擎 豆包 使用抖音号、手机号、头条号注册均可 3.1注册 3.1.1进入控制台 3.2.2 进入火山方舟 点击左上角蓝色区域 点击火山方舟 3.2开通模型 3.3创建接入点 3.3.1创建 3.3.2复制模型ID 四、火山引擎接入cherryStudio 4.1添加模型 4.2接入检查 jvzquC41dnuh0lxfp0tfv8r2a8799;<2;1gsvrhng1jfvjnnu1762=77397
8.方舟招聘方舟招聘招聘AML-火山方舟大模型推理系统工程师 【上海-江湾】 35-65k·15薪 5-10年本科 字节跳动 互联网融资未公开10000人以上 杜女士 HRBP 汉氏方舟东营健康科普中心 【东营-西四路】 20-30k 3-5年大专 东营市优而美生物科技有限公司 专业技术服务1-49人 jvzquC41yy}/nrjrkp4dqv4u19?c6:96eg6ch:f3cd=4c?ih84k1g@hc51
9.豆包大模型应用落地,又有新进展。8月21日,火山引擎在AI创新巡展活搭载火山方舟大模型服务平台,通过火山引擎RTC实现语音数据的高效采集、处理和传输,并深度整合豆包·语音识别模型和豆包·语音合成模型,简化语音到文本和文本到语音的转换过程,火山引擎对话式AI实时交互解决方案,提供优秀的智能对话和自然语言处理能力,帮助应用快速实现用户和云端大模型的实时语音通话。 jvzquC41zwkrk~3eqo522B<86;9748823;>95?>
10.MetaGPT配置各个大模型APImetagpt配置qwen本地部署的大模型我们以OpenAI API为例说明配置过程,其他大模型的API配置过程是相同的。 您可以通过设置 config2.yaml完成配置 使用config2.yaml 在当前工作目录中创建一个名为config的文件夹,并在其中添加一个名为config2.yaml的新文件。 将示例config2.yaml文件的内容复制到您的新文件中。 jvzquC41dnuh0lxfp0tfv8f994916=6;1cxuklqg1fkucrqu13:739<9:2
11.微信小程序接入DeepSeek模型(火山方舟),并在视图中流式输出通过流式输出,DeepSeek模型可以在处理过程中实时地将结果发送给小程序,小程序前端则能够立即接收到这些数据,并在视图中动态展示出来。这样,用户就可以边等待边看到已经接收到的结果,大大提升了用户体验。 本文中的DeepSeek模型为火山方舟(字节跳动火山引擎)中的DeepSeek大模型,当前可以免费使用。jvzquC41dnuh0lxfp0tfv8qhs9<24991ctzjeuj1fgzbkux136;:;A<94
12.大模型加持,火山引擎加速数据价值的“飞轮效应”|火山引擎|字节今年6月,火山引擎推出了大模型服务平台火山方舟,来拥抱大模型时代的到来。在此次大会中,火山引擎数智平台VeDI对数据产品大数据研发治理套件DataLeap和智能数据洞察DataWind进行了升级,以AI加持,降低企业数据消费门槛。 字节跳动数据平台负责人罗旋表示:“无论何种技术赋能,其核心都在于进一步降低业务使用门槛,更好地探索数据jvzq<84m0uooc7hqo0io1jwvkerfa:<;:9=84=h23?14{t{30nuou