火山引擎:揭秘豆包视频模型背后的“底层升级”火山引擎视频云豆包

【亿邦原创】让一张招照片开口说话,让一段思考变成影像,让一个商品自动旋转展示……这些AI视频模型的丰富应用极大拓展了娱乐和营销的边界,让视频生产进入AI时代。

但视频数据的指数级增长,对计算效能提出了严峻考验,也对音视频处理的生产端、交互端和消费端提出了全新要求。

1、释放AI生产力

仓库中还没上架的商品,可以自动拍摄高清素材,一键生成营销主图、讲解视频,一键上传店铺与账号。

直播刚结束,后台就躺着几十条剪辑好的直播切片,同时叠加营销要素,可以直接投放带货。

更有甚者,基于商品图、直播素材、行业知识和模型理解能力,大模型已经开始自己创作商品的短视频剧本,再自动基于剧本,生成风格多样的商品营销短视频。

这些新场景和新应用,已经可以横向复用,实现店铺级的自动化托管服务,并在抖音超市、跨境电商、苹果自营、云奥莱、超值购、秒杀等多个业务铺开。

抖音电商自营电商负责人陈洁透露,以抖音超市的使用过程中,日均曝光增加500W,点击率增加300%,转化率提升100%,成交规模提升50%,商家效率提升300%。

“优质内容能带来流量,也能带来持续交易。”陈洁表示。

分析用户兴趣,持续创作与用户兴趣相关的商品内容、短视频内容、直播内容,这是商家在抖音电商平台的有效经营方法。但商品丰富性的增加也带来运营成本的快速攀升,内容质量层次不齐,内容更新频率更是难以保障。

前述对仓库内商品自动采集、自动生成营销主图、自动生成讲解视频与展示视频,就是抖音电商自营电商和火山引擎视频云共同研发的、对商品高清采集的自动化硬件设备。

对于商家运营来说,原先复杂费劲的商品素材生产工作,现在只需要坐在电脑面前做二次的确认即可。

“通过AIGC,无论是商品的曝光度、点击率、转化率的过程指标,还是在订单的成交规模以及商家的运营效率,都有非常多的提升。”陈洁认为。

2、AI点燃视频云

在丰富多元的视频生成能力背后,火山引擎在视频云上的进展发挥了基石作用。

视频云指面向视频应用场景的全部公有云和专属云基础设施,视频内容分发网络(含点播带宽),以及在视频云基础设施上部署的视频产品、服务或解决方案。IDC将其划分为“视频直播”、“音视频通信”、“视频点播与媒体处理”、 “媒体生产与媒资管理”等赛道。

近期,火山引擎在视频云技术大会上,火山引擎发布了大模型训练视频预处理方案,用于解决视频大模型训练的成本、质量和性能等方面的技术挑战。目前,该技术方案已应用于豆包视频生成模型。

这套大模型训练视频预处理方案依托于自研的多媒体处理框架BMF,能有效应对模型训练的算力成本挑战。还在算法和工程方面进行了调优,可以对海量视频数据高质量预处理,短时间内实现处理链路的高效协同,提高模型训练效率。

Bytedance Research负责人李航介绍,豆包视频生成模型PixelDance在训练过程中采用了火山引擎的大模型训练视频预处理方案,充分利用了大量潮汐资源,为模型训练提供了有力支撑。火山引擎视频云团队提供的点播解决方案还为PixelDance生产的视频提供了从编辑、上传、转码、分发、播放的全生命周期一站式服务,让模型的商业化应用有了保障。

据了解,豆包视频生成模型PixelDance于9月24日发布,采用DiT架构,通过高效的DiT融合计算单元和全新设计的扩散模型训练方法,突破了多主体运动的复杂交互、多镜头切换的内容一致性难题,在业界引起广泛关注。目前,豆包视频生成模型已通过火山引擎面向企业开启邀测。

3、AI视频时代的星辰大海

作为视频领域的头号玩家,火山引擎在视频生成上的探索远不止电商营销素材的生成。

亿邦动力注意到,7月还上线了首部AIGC短剧《三星堆:未来启示录》上线,以1.4亿次播放量证明了AI与视频结合的强大吸引力。

9月24日,在深圳AI创新巡展上,火山引擎发布了两款视频生成模型,突破多主体互动难关。

Vision Pro年初提出的空间视频概念在抖音VR直播中得到了完美应用,借助小范围6 Dof技术,实现内容的实时追随和全景直播,为用户带来了实时沉浸式看直播的全新体验。

火山引擎还和山西高平二郎庙金代戏台合作,通过AI生成3D内容和大场景重建方案,为珍贵的历史建筑生成了3D数字资产,并以虚拟直播间的形式应用于抖音的戏曲直播场景。

这些成果背后是生成式AI多模态、大模型、全景直播、三维重建等技术的共同推动。火山引擎CEO谭待认为,本轮技术突破正在将我们从流畅实时高清的数字世界带入更智能、更交互、更沉静的AI世界。这不仅意味着技术的飞跃,更代表着体验方式的一场变革。

视频正迅速崛起为人类的第二语言,视频的表达手段和效果超过文字,也带来内容生产、交互服务的新变革。

在AIGC、多模态等技术的共同推动下,用户体验在多个维度上经历着深刻转变,“基于抖音业务实践和与行业客户共创,火山引擎视频云正积极探索AI大模型与视频技术的深度融合,在技术底座、处理链路和业务增长层面为企业寻找解法。”谭待说。

THE END
0.捷成股份——与“豆包”“火山引擎”“剪映”深度合作版权合作:捷成股份作为影视版权运营和服务的公司,是字节跳动旗下产品包括火山引擎相关业务的影视版权核心供应商之一。火山引擎所服务的企业客户在进行视频内容创作、分发等业务时,需要大量正版影视版权内容,捷成股份的丰富版权资源为其提供了有力支持,满足了企业客户对优质内容的需求6.虚拟人合作:捷成股份旗下的虚拟人公司jvzquC41iwhb0|npc0ipo7hp1Ay>vqwgcf,ckmB438?'vri?3:;26=
1.火山引擎2025原动力大会点评:豆包家族产品革新AGENT落地进入加速期字节跳动在北京召开火山引擎大会,意在展示AI 技术与产业链融合的新机遇,我们看好豆包模型产品革新下,成本革命驱动普惠化,AI Agent 落地进入加速器。 投资要点: 我们认为本次 大会标志着火山引擎正式进入“全产品升级+成本下探+Agent 落地”新阶段,通过技术、定价和生态三重驱动,正在推进 AI 从实验室走向生产;同时,也为整个jvzquC41uvudm7mgzwt/exr14286/9;/4253498974?60qyon
2.字节跳动豆包大模型发布,火山引擎全栈AI服务助力企业智能化转型火山引擎一直致力于构建开放共享的生态理念,自2021年发布万有计划以来,已经帮助100+家 SaaS 企业实现了业务增长,实现近万单客户签约。豆包企服联盟,是万有计划针对大模型落地的专项计划。万有计划·豆包企服联盟将提供一揽子支持规划,帮助 SaaS 企业实现 AI 升级,为行业客户提供更多开箱即用的 AI 应用。 jvzquC41yy}/frfpmgpj0lto1pku1?:5294ivvq
3.字节跳动豆包大模型发布,火山引擎全栈AI服务助力企业智能化转型豆包APP 是字节跳动重点投入的大模型应用,据朱骏透露,豆包平台月度活跃用户达到2,600万,已有超过800万个智能体被创建。 豆包大模型在服务字节内部的同时,也在与火山引擎的众多企业客户合作共创。谭待认为,企业在不同业务场景中,需要不同特点的模型,从而实现最佳效果和性价比。为此,豆包大模型提供的是一个多模态模型家jvzquC41pg}t0|npc0ipo7hp1unbpp}wph{tjns14285/9:/395eg}fkn/oocuesw733:>680yivvq
4.火山引擎发布大模型训练视频预处理方案已应用于豆包视频生成模型10月15日,火山引擎在视频云技术大会上发布了大模型训练视频预处理方案,助力解决视频大模型训练的成本、质量和性能等方面的技术挑战。目前,该技术方案已应用于豆包视频生成模型。 火山引擎总裁谭待在活动致辞时表示,在AIGC、多模态等技术的共同推动下,用户体验在多个维度上经历着深刻转变。“基于抖音业务实践和与行业客户共创,火山引擎视频 jvzq<84dl0vfqyqg0eun0ls1p4532;9132771l66766.6:52;8820qyon
5.火山引擎总裁回应大模型“价格战”:现在回归合理水平,原来太贵  8月21日,字节跳动旗下火山引擎总裁谭待在接受澎湃新闻记者采访时,谈到了此前轰动行业的大模型“价格战”。   当天,火山引擎AI创新巡展在上海举办。会上,火山引擎发布了豆包大模型产品升级,并携手多点 DMALL成立零售大模型生态联盟,基于豆包大模型打造零售AI解决方案。谭待透露,字节跳动旗下最新版豆包大语jvzq<84yyy4ykwmwcpku0lto1fohk}fn146369=451
6.火山引擎发布豆包最新深度思考模型每经北京4月17日电(记者杨昕怡)在今日火山引擎AI创新巡展杭州站现场,火山引擎总裁谭待发布了最新的豆包1.5 深度思考模型。据介绍,该模型在数学、编程、科学推理等专业领域及创意写作等通用任务中表现突出。同时,模型采用MoE架构,总参数200B,激活参数为20B,低于业界同类模型参数规模的50%,具备显著的推理成本优势。同时,jvzq<84zkpybpkfp036kstf0eqs/ew4424;16:<1e8<87<8:;74tj}rn
7.豆包概念股涨超11%本周机构密集调研相关上市公司|火山引擎南凌科技(23.530,0.13,0.56%)周五发布机构调研纪要,在回答公司和字节跳动火山引擎豆包AI的合作细节时表示,南凌科技与火山引擎在多个领域开展合作,是火山引擎全线产品的代理商。同时,南凌科技融合火山引擎生态资源,优化网络架构,在新一代的零信任网络安全架构开展紧密合作,进行优势互补,在双赢的基础上进行更多业务方面的深度jvzq<84hkpgoen3ukpg/exr0ep5kl|14285/:7/375eql2kpe€rcƒu565;:3@3ujvsm
8.火山引擎回应“字节跳动被曝将打造‘豆包汽车’”:纯属谣言,没有据网友爆料,字节跳动将打造“豆包汽车”,该计划将协同字节跳动旗下火山引擎的汽车云业务,围绕智能汽车的“座舱 + 智驾”两大板块,提供汽车智能智驾终端解决方案,可视为对标华为鸿蒙智行中软件解决方案的布局。 对此,火山引擎相关负责人对界面新闻回应称,纯属谣言。火山引擎为众多汽车客户提供高效的算法训练平台,自身并没jvzq<84o0etiwkjk0eun1ltpvgtu1;547/681;>1eqtugwya3;988:<30jznn
9.火山引擎总裁谭待:建议企业家先个人使用豆包APP火山引擎总裁谭待:建议企业家先个人使用豆包APP发现更多热门视频 王楚钦暴扣全场欢呼 北京时间3.6万次播放 美国博主震撼发言:要救美国,必须搞社会主义混合制! 闻新洞察1.5万次播放 40岁男子坚持面部刮痧一年,脸部红润紧致效果显著 于晓攀6916次播放 台湾一军官表示别整那些没用的花活,真遇上解放军无人机,直接投降保住战车 慢吞吞得熊爪子2.8万次jvzquC41xkjfq7xkpc4dp8kkpctdg8724731667;1fkucrq/kpkvxw}u648:;=90f0nuou
10.蓝色光标:与火山引擎合作基于豆包模型等推动AI营销深度整合蓝色光标在互动平台表示,11月,蓝色光标已与火山引擎达成深度合作,双方将基于火山方舟、豆包·视频生成模型、扣子专业版智能体开发平台,在视频生成、视频服务解决方案以及营销行业智能体应用等领域展开深入合作,共同推动AI与营销体系的深度整合、加速营销行业AI化进程。jvzquC41o0jejn0eqs0d{ngh1714=57697/j}rn
11.OPPO、vivo、荣耀、小米、三星、华硕、字节跳动成立智能终端大据IT之家此前报道,字节跳动在 2024 春季火山引擎 Force 原动力大会上正式宣布自家豆包大模型正式开启对外服务。 据介绍,豆包大模型包含豆包通用模型 Pro、豆包通用模型 liti、豆包・角色扮演模型、豆包・语音合成模型、豆包・声音复刻模型、豆包・语音识别模型、豆包・文生图模型、豆包・Function Call 模型。 jvzquC41yy}/k}mqog4dqv4219<919:50jzn
12.国产大模型到了“后发先至”时刻?火山引擎新浪财经另外,还有许多人不太清楚“火山引擎”“火山方舟”“豆包大模型”“扣子”之间的关系。 火山引擎是字节跳动旗下云服务平台,大模型只是其中一个业务板块。 火山方舟是大模型服务平台,可以调用、训练和评测大模型,理论上应该可以使用各家的产品,不过事实上,除了豆包大模型,只提供了GLM3、Mistral和Moonshot三款开源模型,jvzq<84hkpgoen3ukpg/exr0ep5xo872463246781fud/rsgcw{zv<9:4:630|mvon
13.火山引擎携手蜜度共启豆包大模型合作新篇章产2024年7月5日,在2024世界人工智能大会暨人工智能全球治理高级别会议上,北京火山引擎科技有限公司(以下简称:火山引擎)与蜜度科技股份有限公司(以下简称:蜜度)举行豆包大模型合作备忘录签约仪式。双方将聚焦内容洞察,深入探索细分垂直行业的需求,通过“AI+”的深度链接,推进人工智能技术的全时、全域应用,为各行各业的数智jvzquC41yy}/eny0eqs/ew4y|u0e‚z13619>7320yivvq
14.智能体浪潮里,豆包的崛起之路对专业开发者来说,豆包背靠火山引擎的联动如同一个智能体开发加速器,提供强大的算力支撑和模块化组件,省去了模型训练、算力调试等复杂环节,还打通了从创作到变现的闭环。开发者在火山引擎上开发的智能体,可通过豆包生态快速触达海量用户,借助抖音、今日头条等流量入口实现精准分发。 jvzquC41yy}/rltpnktf0lto0et0cr4ctvodnn4355;96=3jvor
15.字节跳动发布豆包大模型主力模型比行业价格低99.3%中国青年网讯(记者 张亚云)今日,字节跳动豆包大模型在火山引擎原动力大会上正式发布。火山引擎是字节跳动旗下云服务平台,据火山引擎总裁谭待介绍,经过一年时间的迭代和市场验证,豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一,目前日均处理1200亿Tokens文本,生成3000万张图片。 jvzq<84hkpgoen3{qwzi0ls1hktbpljaif~x1;5462;0v;5462;27h6747:46A3jvo
16.火山引擎回应筹备“豆包汽车”:纯属谣言火山引擎回应筹备“豆包汽车”:纯属谣言发现更多热门视频 孙颖莎成功复仇陈熠,展现强大实力! 耳中的影视2.9万次播放 梅德韦杰夫:美方对俄“最后通牒”加剧战争威胁 滚动播报3.3万次播放 女子发声反对女性胸部被性化,呼吁拒绝物化价值观 道哥日记1.2万次播放 平野美宇在厦门增重一公斤,全因蒯曼和覃予萱频繁投喂,张成教练jvzquC41xkjfq7xkpc4dp8kkpctdg8724731967;1fkucrq/kplje€yy99997=<0f0nuou
17.比行业价格低99%,豆包家族开“卷”?火山引擎谭待:人人用得起才是好这是一只搭载AI应用平台“扣子”所生成的bot(机器人程序)的机器狗。在5月15日的火山引擎原动力大会上,火山引擎总裁谭待现场宣布扣子以及扣子所属的字节跳动豆包大模型家族正式出道,豆包大模型将通过火山引擎对外提供服务,推出新一代全栈AI服务,帮助企业用更低的成本和更易落地的方案进行AI转型。 jvzquC41zwkrk~3eqo5:8<:476:2887;24?:39:
18.火山引擎发布行业首个大模型IT赋能平台,接入豆包大模型10月16日,火山引擎在上海推出行业首个大模型IT赋能平台“飞连”。该平台接入豆包大模型,通过All in One产品架构统管身份、网络、终端、数据等IT的核心要素,在多场景落地AI应用。飞连从2021年开始通过火山引擎对外开放服务。从字节跳动内部大规模使用,到多行业场景实践,飞连目前服务20多个行业,超过1500家客户,覆盖30jvzquC41o0zigyfrgt4dp8sgyuJfvjnnahusyjwfa4?15::47