火山引擎发布“火山方舟”加速大模型应用落地百川算法

央广网北京6月29日消息(记者郭彦伟)6月28日,在由火山引擎主办、英伟达合作举办的“V-Tech体验创新科技峰会”上,火山引擎发布大模型服务平台“火山方舟”,面向企业提供模型精调、评测、推理等全方位的平台服务(MaaS,即Model-as-a-Service)。目前,“火山方舟”集成了百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI(以拼音首字母排序)等多家AI科技公司及科研院所的大模型,并已启动邀测。

“企业使用大模型,首先要解决安全与信任问题”,火山引擎总裁谭待表示,“火山方舟”实现了大模型安全互信计算,为企业客户确保数据资产安全。基于“火山方舟”独特的多模型架构,企业可同步试用多个大模型,选用更适合自身业务需要的模型组合。

火山引擎总裁谭待公布“火山方舟”首批大模型合作伙伴

首创安全互信计算

与小模型“自产自用”不同的是,大模型的生产门槛很高,数据安全成为大模型时代的新命题。

谭待认为,企业使用大模型,最担心的是数据泄露。如果将大模型私有化部署,企业将承担更高的成本,模型生产方也会担心知识资产安全。“火山方舟”的首要任务就是做好大模型使用者、提供者和云平台可以互相信任的安全保障。

火山引擎智能算法负责人吴迪介绍,“火山方舟”已上线了基于安全沙箱的大模型安全互信计算方案,利用计算隔离、存储隔离、网络隔离、流量审计等方式,实现了模型的机密性、完整性和可用性保证,适用于对训练和推理延时要求较低的客户。

火山引擎智能算法负责人吴迪介绍“安全互信计算”

吴迪表示,“火山方舟”还在探索基于NVIDIA新一代硬件支持的可信计算环境、基于联邦学习的数据资产分离等多种方式的安全互信计算方案,更全面地满足大模型在不同业务场景的数据安全要求。

会上,NVIDIA开发与技术部亚太区总经理李曦鹏表示,NVIDIA与火山引擎过往合作成果丰硕,双方合作的GPU推理库ByteTransformer在IEEE国际并行和分布式处理大会(IPDPS 2023)上获得最佳论文奖,双方还联合开源了高性能图像处理加速库CV-CUDA,并在大规模稳定训练、多模型混合部署等方面的技术合作上取得成效。

未来NVIDIA和火山引擎团队将继续深化合作,包括在NVIDIA Hopper架构进行适配与优化、机密计算、重点模型合作优化、共同为重点客户提供支持以及NeMo Framework适配等,携手助力大模型产业繁荣。

降低大模型使用成本

中国科学技术信息研究所等机构发布的《中国人工智能大模型地图研究报告》显示,截至今年5月,国内已公开披露的大模型数量达到79个。

大模型密集涌现,企业面临“选择困难”。在吴迪看来,技术发展日新月异,国内大模型正在快速迭代,不同大模型在特定任务上各有千秋,企业不必急于绑定一家大模型,而是应该结合自身业务场景,综合评估使用效果和成本,在不同场景选用更具性价比的模型。

吴迪称,训练大模型很昂贵,但是从长期来看,模型的推理开销会超过训练开销。效果和成本的矛盾永远存在,降低推理成本会是大模型应用落地的重要因素。“一个经过良好精调的中小规格模型,在特定工作上的表现可能不亚于通用的、巨大的基座模型,而推理成本可以降低到原来的十分之一。”

资料显示,微软以医学文章数据精调了生物领域的BioGPT-Large模型,仅有15亿参数,其在PubMedQA基准测试中的准确率却优于有着上千亿乃至数千亿参数的大型通用语言模型。

“火山方舟”提供了丰富的模型精调和评测支持。吴迪介绍,企业可以用统一的工作流对接多家大模型,对于复杂需求可设置高级参数、验证集、测试集等功能,再通过自动化和人工评估直观对比模型精调效果,在不同业务场景里还可灵活切换不同的模型,实现最具性价比的模型组合。这些自定义指标和评估数据的积累,将成为企业在大模型时代宝贵的数据资产。

吴迪透露,抖音集团内部已有十多个业务团队试用“火山方舟”,在代码纠错等研发提效场景,文本分类、总结摘要等知识管理场景以及数据标注、归因分析等方面探索,利用大模型能力促进降本增效。这些内部实践在快速打磨“火山方舟”,推动平台能力的进一步完善。

“火山方舟”的首批邀测企业还包括金融、汽车、消费等众多行业的客户。北京银行CIO龚伟华表示,大模型与客户营销、办公协同、数据智能的结合,在金融应用场景有巨大潜力。北京银行将与“火山方舟”合作,在算力优化、模型精调等方面展开研究,共同推动金融风控、营销等模型应用落地。

助力大模型“跑完最后一公里”

集成多个大模型,供客户直接对比,“火山方舟”的多模型架构不仅为企业提供了丰富选择,也得到众多大模型生产方的积极响应。

ChatGLM是智谱AI推出的千亿基座认知模型,其开源版本在大模型开源领域极具影响力,近期智谱AI还对ChatGLM做了新升级,大幅提升了模型能力。在“火山方舟”上,智谱AI提供具有竞争力的大模型,火山引擎提供高性价比资源、针对不同行业的精调能力及综合解决方案,共建安全可靠的第三方MaaS服务,合力推动各行业的智能化发展。智谱AI CEO张鹏介绍,智谱AI在火山引擎平台上解决了千亿模型训练的稳定性、性能优化等挑战。

baichuan-7B发布后在MMLU、C-Eval等中英文权威榜单中均表现优异。百川智能联合创始人焦可表示,作为一款授权后可免费商用的开源大模型,开发者们可以通过baichuan-7B低成本部署模型,并根据自身需求灵活拓展模型能力,而本次与“火山方舟”的合作也将有效降低企业用户的大模型接入门槛和使用成本,帮助更多企业轻松获取专业服务。

MiniMax等大模型企业代表也亮相参加“火山方舟”的发布仪式。此前,MiniMax联合创始人杨斌公开分享了与火山引擎的合作成果:MiniMax在火山引擎上实现了从月至周级别的大模型迭代速度,和指数级的用户交互增长,“或许是国内第一家在公有云上实现数千卡并行训练的公司”。MiniMax还自研了超大规模的推理平台,稳定支撑着每天上亿次的大模型推理调用。MiniMax的文本、语音、视觉三个模态大模型登陆“火山方舟”,是双方合作的进一步深化。

科研机构同样是推动大模型技术发展的重要力量,复旦大学自然语言处理实验室开发的MOSS大模型、IDEA研究院开发的姜子牙系列大模型,均是该领域的代表作。IDEA研究院认知计算与自然语言研究中心讲席科学家张家兴表示,大模型生产方会不断提升基础模型能力,为大模型应用完成90%—99%的工作,“火山方舟”为代表的云平台要帮助客户为不同场景精调模型,“跑完最后一公里”。张家兴认为,“在技术驱动和需求拉动的作用下,大模型的世界必然百花齐放”。

谭待判断,企业使用大模型,未来可能会呈现“1+N”的模式:“1”是通过自研或深度合作,形成1个主力模型;由于成本和场景复杂多元等原因,在这个主力模型之外,还会有N个模型同时应用。

“每一次技术的大变革,都会带来体验创新的新机会”,谭待坦言,“火山方舟”还在起步阶段,工具链和下游应用插件需要持续完善。平台还将接入更多大模型,并逐步扩大邀测范围,与企业客户共建开放合作的多模型生态,加速大模型在各行各业的应用落地。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

THE END
0.IDC:2025年上半年大模型公有云市场,火山引擎占比49.2%排名第一IDC:2025年上半年大模型公有云市场,火山引擎占比49.2%排名第一Video Player is loading.00:00/00:00 Loaded: 0% 视频加载失败,请查看其他精彩视频 相关视频 猜你喜欢 00:05:39 美媒:想买安世的芯片可以,但中方 00:02:06 Dexmal开源Dexbotic 00:07:03 越南在南沙疯狂造岛,中国为何不阻 jvzquC41xkjfq7xkpc4dqv3ep1v0hrscpek04977/2?.3B4fgvgjn6nphs€d{w>99:7857i0jvsm
1.抖音大规模实践火山引擎向量数据库对外开放服务快科技解决方案就是,将火山知识库文档和数据通过向量特征提取,然后存储到向量数据库中,应用LLM大语言模型与向量化的知识库检索和比对知识,构建火山引擎Oncall智能问答,可以让聊天机器人的回答更具专业性和时效性,构建专属Chatbot。未来,火山引擎Oncall的FAQ知识将持续沉淀,知识库持续完善,同时还能提供大模型训练数据,处理大量客jvzquC41pg}t0v~ftk|ft|3eqo521B871;968:;0jvs
2.万有商城云市场大模型AISaaS应用火山引擎万有商城荟聚优秀SaaS伙伴,为企业提供内容创意、直播工具、电商运营、广告营销、企业办公、网站建设等软件产品与服务,一站式助力客户运营提效和生意增长。jvzquC41ocxlg}3xqnifppnpg0ipo8
3.產學研齊聚楊浦,共話大模型產業創新未來火山引擎推出火山方舟大模型,提供模型訓練、推理、評測、精調等全方位功能和穩定可靠的安全互信方案﹔優刻得推出智能雲平台,提高全要素生產力﹔復旦大學與阿裡雲共同建設CFFF智算平台,推出多學科融合創新的AI for Science計算集群“切問1號”和專用高性能計算集群的“近思1號”,聚焦高性能、低能耗、靈活穩定、強拓展jvzq<84uj0vfqyqg0eun0ls1DKM61w71428419>471i25=<8:/:17A94:24ivvq
4.火山引擎大模型应用启动邀测,抖音十多个业务团队已试用6月28日,火山引擎发布大模型服务平台“火山方舟”,面向企业提供模型精调、评测、推理等全方位的平台服务(MaaS,即Model-as-a-Service)。目前,“火山方舟”集成了百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI等多家AI科技公司及科研院所的大模型,并已启动邀测。 jvzquC41hktbplj0gcyuoxsg{0ipo8sgyu525>9.42842?7;49<63B:85;4ivvq
5.火山引擎大模型生态:“SaaS+AI”商业化的新解法转动“数据飞轮”,需要更多 SaaS 伙伴使用大模型技术;随着调用量和使用深度的增加,大模型也会越用越好用。这也是火山引擎“万有计划·豆包企服联盟”期望带给 SaaS 伙伴的帮助:通过政策、技术、服务等资源上的支持,鼓励更多 SaaS 伙伴尝试大模型技术,解除在大模型探索、商业化过程中的种种顾虑。 jvzquC41yy}/gkwwp0ipo87246683B4p/3=82=3jvor
6.升级云服务火山引擎要做AI大模型“发动机”火山引擎总裁谭待表示,AI大模型有巨大潜力和创新空间,火山引擎会服务客户做好大模型,共同推动各行业的智能化升级。据悉,火山引擎机器学习平台经过抖音等海量用户业务长期打磨,支持单任务万卡级别的超大规模分布式并行训练场景。jvzq<84yyy4djrscpg}t0lto1ep0497512:.3A4;;;816B3ujvsm
7.海尔消金携手火山引擎,共建消费金融大模型产经在生成式人工智能浪潮的推动下,金融科技正迎来新一轮的创新与变革。5月10日,海尔消费金融(以下简称“海尔消金”)与火山引擎正式宣布,双方将共同成立金融大模型联合创新实验室,致力于构建消费金融垂直大模型,并在精准营销、智能客服、贷后管理、风控等业务场景中持续探索大模型的创新应用,从而加速海尔消金的智能化转型jvzquC41yy}/eny0eqs/ew4y|u0e‚z1361796530yivvq
8.火山模型和优化(向量化执行编译执行)文章讨论了现代CPU的处理特性,包括超标量流水线、乱序执行、分支预测、多级存储和SIMD优化,以及这些特性如何影响数据库查询性能。文章提到了火山模型和向量化执行模型在数据库执行器中的应用,分析了各自的优劣,并探讨了编译执行和数据预取等优化策略。 文章目录 jvzquC41dnuh0lxfp0tfv8vsa6:88?=:51gsvrhng1jfvjnnu1743<:588;
9.字节终于掀桌子了快科技5月 15 日,字节跳动首次向外界“推销”旗下 AI 大模型——其自研豆包“全家桶”官宣将通过火山引擎(字节旗下六大业务板块之一,其余五块分别是抖音、大立教育、飞书、朝夕光年、TikTok)对外提供服务。 至此,字节跳动纵身跳入国内大模型混战,其大模型版图正式浮出水面。 jvzquC41pg}t0v~ftk|ft|3eqo521B=21;>1;<;0jvs
10.火山引擎云上实战:DeepSeekR1大模型(全尺寸)本文将介绍两种在火山引擎云上部署 DeepSeek-R1 全尺寸模型服务的方案,涵盖大模型推理服务的 Terraform 一键部署、容器化部署、资源弹性伸缩和模型可观测。 来源| 火山引擎云基础 在AI 大模型日新月异的当下,企业在使用大模型时往往面临着数据隐私保护和性能优化的挑战。为了解决这些问题,企业 AI 大模型在云端进行私jvzquC41zkk/kwkqs0io1jwvkerf1;:8:h::h?5d37k83;=;99l39k
11.火山引擎吴迪:带你了解大模型的应用和未来技术解析火山引擎提供了火山方舟这个平台,火山方舟平台上面有众多优质的、精选的国内的高质量商用模型,像智谱AI的ChatGLM的商用版本,像MiniMax的MiniMax-ABAB 5.5以及字节跳动的云雀模型等等。我们有很多客户基于方舟平台,在这些优质的商用模型上去开发自己的应用。 大模型,将在哪些方面帮助职场人? jvzquC41yy}/xxqegpmjpn3eqo5eqlx185<11:6742=5