豆包大模型家族全面升级重磅发布视觉理解模型

12月18日,2024火山引擎FORCE原动力大会·冬在上海举办,火山引擎带来豆包大模型家族全新升级。豆包大模型12月日均tokens使用量超过4万亿,较5月发布时期增长超过33倍。

火山引擎总裁 谭待

okens调用规模化增长的同时,豆包大模型在不同场景中都在快速增长、全面开花。比如信息处理场景,最近3个月豆包大模型调用量增长了39倍,帮助企业更好的分析和处理内外部数据;在客服与销售场景,调用量增长16倍,帮助企业更好的服务客户,扩大销售;在硬件终端场景,增长13倍,AI工具增长9倍。

不断增加的调用量和多场景覆盖,让豆包大模型越来越全面,迎来重磅升级。

豆包·视觉理解模型发布,拓宽大模型场景边界

视觉,是人类理解这个世界最重要的手段。对于大模型来说也是如此,只有做好视觉理解,才能让模型有能力处理好真实世界的信息,辅助人类完成一系列复杂工作。本次大会正式发布了豆包·视觉理解模型,用户可以同时输入文本和图像相关的问题。模型能够综合理解并给出准确的回答。这将极大地简化应用的开发流程,解锁更多的大模型价值场景。

更强的内容识别能力:不仅可以识别出图像中的物体类别、形状等基本要素,还能理解物体之间的关系、空间布局以及场景的整体含义。      更强的理解和推理能力:不仅能更好地识别内容,还能根据所识别的文字和图像信息进行复杂的逻辑计算。

更细腻的视觉描述能力:可以基于图像信息,更细腻地描述图像呈现的内容,还能进行多种文体的创作。

基于以上能力,豆包·视觉理解模型在教育、旅游、电商等场景有着非常广泛的应用。在教育场景中,为学生优化作文、科普知识;在旅游场景中,帮助游客看外文菜单、讲解照片中建筑的背景知识;在电商营销场景中,帮助商家充分描述商品细节,高效发布种草广告等等。视觉理解能力将极大拓展大模型的场景边界,为大模型的场景使用打开天花板,在金融、医疗、建筑、地理、体育、物流等诸多行业还有非常广阔的应用前景。

豆包·视觉理解的输入价格为每千tokens 0.003元,比行业平均价格降低85%,相当于一块钱可以处理284张720P的图片,视觉理解模型正式走进厘时代。同时火山引擎还将提供更高的初始流量,RPM达到了15,000次,TPM达到120万,让企业和开发者用好视觉理解模型,找到更多创新场景。

豆包大模型家族再进化,豆包通用模型pro迭代新版本

在本次大会中,火山引擎除了推出视觉理解模型之外,还发布、升级了多个其他模型。大模型家族成员更丰富,大模型能力再提升。

豆包通用模型pro完成新版本迭代:综合任务处理能力较5月份提升32%,在推理上提升13%,在指令遵循上提升9%,在代码上提升58%,在数学上提升43%,在专业知识领域能力提升54%。

豆包·音乐模型4.0发布:从 “高光片段” 走向 “完整歌曲”,支持包括前奏、主歌、副歌、间奏、过渡段的3分钟全曲创作;歌词局部修改,仍能适配原有旋律;全曲风格、情感和音乐逻辑保持一致,曲风连贯。

豆包·文生图模型2.1发布:支持“一键P图”,可以高精度指令理解,对中英文、专有名词“来者不拒”;高质量编辑效果,聚焦目标,不“误伤”原图;高效率创新模型,可实现多元风格,美观自然。支持“一键海报”,中文精准生成,高质量精准生成中文;图文精妙融合,字体与图片内容巧妙融合;极速海报生成,模型最快做到6秒出图。

veOmniverse+豆包·3D生成模型发布:veOmniverse支持高保真视觉渲染、大规模渲染算力池、物理&传感精确模拟、即开即用的3D编辑器。豆包·3D生成模型,支持文生3D、图生3D及多模态生成,1min生成高保真、高质量3D资产,复杂物品、物品组合大规模场景生成,支持多模态3D资产编辑。

此外,豆包·视频生成模型将在2025年1月正式对外开放服务,用户可在火山引擎官网预约正式服务。

全域搜索、高效记忆为模型落地加速

为了帮助企业轻松应对信息获取和搜索推荐的挑战,火山引擎推出全域AI搜索,通过场景化搜索推荐一体化服务、企业私域信息整合服务、联网问答服务,将企业的信息、业务和用户需求紧密结合,帮助企业实现“发现更多,推荐更准,搜索无限可能”。

火山引擎AI搜推引擎基于基于豆包大模型家族的融合增强技术驱动;搜索推荐一体,有强大的推荐能力、结果精准、深度个性化;支持多模态,文本、图像、音频、视频全能理解;电商、信息检索、娱乐场景通通适用;性能强,支持百亿内容规模、超大规模吞吐、亳秒级检索。联网问答Agent基于抖音集团海量优质实时内容更丰富;秒级呈现,依据问题提供时效性热点答案更高效;图片、语音、文字等多模态可视化创新交互更创新,帮助企业实现全域信息一触即达。

记忆对大模型是非常重要的,记忆未来会是大模型必备的能力。火山引擎融合了更好的上下文缓存技术和RAG技术,发布大模型记忆方案,将通过更快的响应速度、更低的使用成本、更精准的效果、以及亿级别的记忆片段,帮助客户构建更有效的记忆方案。

扣子升级1.5版本,让AI离应用更近一步:

开发者生态逐渐完善:超过100万活跃开发者,发布超过200万个智能体。

全新的AI应用开发环境:支持GUI搭建界面,并且可以一键发布为小程序 、H5、API等多种应用形态。

更强的多模态能力:提供音视频对话能力,端到端延迟响应低至1秒,低成本SDK快速接入各类硬件。

海量的精品模板:涵盖多业务场景,一键复制使用

HiAgent升级1.5版本,帮助企业敏捷构建企业级 AI 原生应用的能力中心:

更懂AI转型:提供观测&评测体系,保障效果生产可用;提供100+行业应用模板,企业可开箱即用;提供配套AI咨询,帮助企业找到AI落地路径。

更深业务适配:提供丰富的企业级插件、灵活的应用集成机制;GraphRAG构建知识图谱,提供细粒度的知识资产管理;生成式画布融合CUI和GUI,打造智能交互引擎。

更强安全保障:支持 RAG 知识库和大模型全栈私有化部署。

模型落地加速将为企业带来更多机遇,助力多行业加速智能化转型。在汽车领域,过去7个月,豆包大模型汽车行业日均tokens消耗增长了50倍,目前已服务国内市场近八成汽车品牌,稳坐汽车行业大模型服务商第一梯队。在智能终端领域,豆包大模型服务了终端行业客户50+AI应用场景,覆盖超过了3亿个终端设备,为消费者带来更加智能的生活与工作体验,来自智能终端的豆包大模型日均tokens调用量从5月到12月增长了100倍。

技术架构面向AI全面转型AI云与基础设施持续创新

火山引擎在基础架构、数据分析等层面带来新服务,为企业打造更便捷、更高效、更安全的AI体验。

火山引擎认为下一个十年,计算范式应该从云原生,进入到AI云原生的新时代。AI云原生,将以GPU为核心重新来优化计算、存储与网络架构,GPU可以直接访问存储和数据库,来显著的降低IO延迟。同时,全系统提供更高规模的高速互联,和端到端的安全保护。基于AI云原生的理念,火山引擎推出新一代计算、网络、存储和和安全产品。在计算层面,新一代的火山引擎GPU实例,通过vRDMA网络,支持大规模并行计算和P/D分离推理架构,显著提升训练和推理效率,降低成本。存储上,新推出的EIC弹性极速缓存,能够实现GPU直连,使大模型推理时延降低1/50;成本降低20%。在安全层面,火山将推出PCC私密云服务,构建大模型的可信应用体系。

此外,火山引擎还升级了数据飞轮2.0,全链路AI开启数智生产力新时代。所有的数据分析产品,包括cdp、BI、用户行为分析、AB测试等,都推出了基于大模型的智能化新功能。同时,推出全模态数据湖解决方案,让企业可以统一的管理好结构化数据和非结构化数据,并结合传统ETL和大模型进行综合分析。

未来,火山引擎将持续提升模型能力,优化模型服务,推动 AI 在各行业的深度融合与创新应用。更强能力、更低价格、更易落地的豆包大模型将助力开启更智能、高效、便捷的 AI 未来。未来,火山引擎将持续提升模型能力,优化模型服务,推动 AI 在各行业的深度融合与创新应用。“更强模型、更低价格、更易落地”的豆包大模型将助力开启更智能、高效、便捷的AI未来。

本文转载自快科技,转载目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请联系快科技通知我方删除,我方将在收到通知后第一时间删除内容!本文只提供参考并不构成任何投资及应用建议。本站拥有对此声明的最终解释权。

THE END
0.字节跳动的大模型实力,终于藏不住了!豆包语音合成比如,字节跳动就给自家大模型,起名叫「豆包」,就冲这名字,就是要干大事的。 上周在字节旗下火山引擎原动力大会上,我又Get到了豆包的另一种更牛掰的解释:豆包就是“都包”,以后你的工作,它“都包”。 以前,大家只用过「豆包AI智能助手」,就已经欲罢不能。 jvzquC41dnuh0lxfp0tfv8}zwg957?<:1cxuklqg1fkucrqu139:3=64:3
1.火山引擎升级豆包系列模型近日,火山引擎发布豆包大模型的系列更新,包括豆包大模型1.6原生支持多种思考长度,并推出豆包大模型1.6lite、豆包语音合成模型2.0、豆包声音复刻模型2.0等全新模型。 随着AI产业落地持续加速,截至今年9月底,豆包大模型日均tokens(词元)调用量已突破30万亿,相比5月底增长超80%。在企业市场,IDC报告显示,2025年上半年中国公jvzquC41yy}/u}ickn/exr1ygh0im}y1463766213>0exsvgpz`6:<6:24ivvq
2.火山引擎发布豆包编程模型火山引擎新浪财经11月11日,火山引擎正式发布豆包编程模型(Doubao-Seed-Code)。该模型专为 Agentic 编程任务深度优化,在多项权威基准测试中达到国内领先水平。同时,豆包编程模型采用分层定价模式与全量透明 Cache 能力,综合使用成本比行业平均水平降低 62.7%。 以创建一个交互式英语学习网站为例,相同tokens使用量下(0-32k输入区间),Claujvzq<84hkpgoen3ukpg/exr0ep5tvxhm1v532;:/333238iqe/ooh€okz815;;430yivvq
3.火山引擎正式发布豆包编程模型火山引擎编程模型豆包财联社11月11日电,今天,火山引擎正式发布豆包编程模型( Doubao-Seed-Code):专为 Agentic 编程任务深度优化,在 SWE-Bench-Verified 官方榜单中刷新 SOTA,更兼容 Anthropic API 等主流开发环境。豆包编程模型综合使用成本相比业界平均水平降低62.7%,国内最低价。目前,该模型已通过火山方舟平台全量开放 API。特别jvzquC41o07757hqo1jz1jwvkerf1TJ5G9P:29:3;:IKP7mvon
4.【明日主题前瞻】火山引擎正式发布豆包编程模型,AI编程有望成为B端最先火山引擎正式发布豆包编程模型( Doubao-Seed-Code):专为 Agentic 编程任务深度优化,在 SWE-Bench-Verified 官方榜单中刷新 SOTA,更兼容 Anthropic API 等主流开发环境。豆包编程模型综合使用成本相比业界平均水平降低62.7%,国内最低价。目前,该模型已通过火山方舟平台全量开放 API。 民生证券吕 jvzquC41hktbplj0gcyuoxsg{0ipo8f142863:6357<24:643;4ivvq
5.当火山引擎正式的发布了豆包大模型家族之后,凭借着更强的模型能力5月15号,当火山引擎正式的发布了豆包大模型家族之后,凭借着更强的模型能力,更低的应用成本和更易落地的解决方案,豆包大模型在各行各业都得到了广泛的应用,豆包大模型的日均调用量也在高速的增长。 5月份我们刚推出的时候,模型的日均tokens调用量1,200亿,到7月份的时候涨到5,000亿,到9月份1.3万亿,截止12月15jvzquC41zwkrk~3eqo52:>:48374488394973<;
6.火山引擎发布豆包编程模型,刷新SOTA并推出低价开发套餐火山引擎今日正式推出专为Agentic编程优化的豆包编程模型(Doubao-Seed-Code),在SWE-Bench-Verified榜单中以78.80%的成绩刷新SOTA。该模型支持256K长上下文与视觉理解能力,可基于UI设计稿或截图生成代码,显著提升前端开发效率。依托大规模Agent强化学习系统,模型通过万级并发沙盒训练,实现端到端自主编程能力。同时,其兼容AntjvzquC41yy}/fxsgyu4dqv4pgyy0fnyckn591?7666840qyon
7.火山引擎发布豆包大模型1.6与视频生成模型Seedance1.0pro6月 11 日,在火山引擎 FORCE 原动力大会上,字节跳动旗下火山引擎正式发布豆包大模型1.6、豆包・视频生成模型Seedance 1.0 pro、豆包・语音播客模型,豆包・实时语音模型也在火山引擎全量上线,豆包大模型家族已成为拥有全模态、全尺寸、高性价比的领先模型矩阵。截至 2025 年 5 月底,豆包大模型日均 tokens 使用jvzquC41dnuh0lxfp0tfv8vsa4?88A6;91gsvrhng1jfvjnnu175:>>8239
8.豆包大模型调用实现volcenginesdkarkruntime豆包大模型调用实现 地址 首先进入官方火山方舟管理控制台,账号登录-火山引擎 (volcengine.com)。 选择所需模型,开通api 首先开通api 选择一个模型开通,有一定免费额度 代码调用api实现大模型调用 进入对应模型,找到模型的ID 依赖准备,这边使用java版本的 <dependency> <groupId>com.volcengine</groupId>jvzquC41dnuh0lxfp0tfv8|gkzooa?8:42;748ftvkimg8igvcomu8662894:B7
9.10月16日,火山引擎发布了豆包大模型的系列更新,包括豆包大模型1.6原10月16日,火山引擎发布了豆包大模型的系列更新,包括豆包大模型1.6原生支持多种思考长度,并推出了豆包大模型1.6lite、豆包语音合成模型2.0、豆包声音复刻模型2.0等全新模型。随着AI产业落地持续加速,截至2025年9月底,豆包大模型日均tokens调用量已突破30万亿,相比今年5月底增长超80%。 jvzquC41zwkrk~3eqo525:5675=8388795775=7
10.豆包大模型视觉理解大模型 在线推理 批量推理 图像转tokens Doubao-1.5-vision-pro 0.0030元/千输入tokens0.0090元/千输出tokens 0.0015元/千输入tokens0.0045元/千输出tokens 最高1312tokens/图 Doubao-1.5-vision-lite 0.0015元/千输入tokens0.0045元/千输出tokens 0.00075元/千输入tokens0.00225元/千输出tokens 最高1312tokens/图jvzquC41yy}/xxqegpmjpn3eqo5qtxiwev5eq~gcq1EsgoBckj{c0ls
11.【大模型】豆包大模型接入|10分钟带你手把手接入自己的项目中去4、回到控制台火山方舟管理控制台 (volcengine.com) ,进入在线推理板块,点击创建推理接入点: 大模型已成为推动各行各业创新的关键力量,在本篇博客中,我将以火山引擎的云服务,特别是其大模型服务,来增强我们的项目并实现业务的增长,帮助你快速上手并实现大模型的调用。 jvzquC41dnuh0lxfp0tfv8r2a9:37>8251gsvrhng1jfvjnnu175498252?
12.火山引擎发布豆包大模型1.6据证券时报,6月11日,字节跳动旗下火山引擎举办FORCE原动力大会。会上,火山引擎发布了豆包大模型1.6,按“输入长度”区间定价,深度思考、多模态能力与基础语言模型统一价格。在企业使用量最大的0-32K输入区间,豆包1.6的输入价格为0.8元/百万tokens、输出8元/百万tokens,综合成本只有豆包1.5深度思考模型或DeepSeek R1的jvzquC41yy}/{rhck0ipo8sgyu522;;794;20qyon
13.火山引擎正式发布豆包编程模型火山引擎新浪财经据火山引擎官微消息,火山引擎今日正式发布豆包编程模型(Doubao-Seed-Code)。据介绍,该模型专为Agentic编程任务深度优化,在SWE-Bench-Verified官方榜单中刷新SOTA,兼容Anthropic API等主流开发环境。目前,该模型已通过火山方舟平台全量开放API。 海量资讯、精准解读,尽在新浪财经APPjvzq<84hkpgoen3ukpg/exr0ep5kl|14286/:6/335eql2kph}{gƒ|3;;:9;@3ujvsm
14.豆包大模型日均tokens使用量超5,000亿,火山引擎全栈AI服务升级助7月25日,2024火山引擎AI创新巡展·成都站正式举办。截至7月,豆包大模型日均tokens使用量已突破5,000亿。平均每家企业客户日均tokens使用量较5月15日模型发布时期增长了22倍。会上带来豆包大模型最新能力升级,火山方舟、扣子专业版、HiAgent和云基础设施也迎来了全面更新。 jvzquC41yy}/frfpmgpj0lto1pkxu8;78;=/j}rn
15.豆包大模型公布价格清单,火山引擎总裁不认可“羊毛出在猪身上”新浪科技讯 5月21日上午消息,近期火山引擎官网更新了豆包大模型的定价详情,全面展示豆包通用模型不同版本、不同规格的价格信息。在模型推理定价大幅低于行业价格的基础上,豆包通用模型的 TPM(每分钟Tokens)、RPM(每分钟请求数)均达到国内最高标准。以豆包主力模型 pro-32k 为例,价格比行业低99%,TPM限额则高达同规格jvzq<84hkpgoen3ukpg/exr0ep5squq14285/9:/435eql2kpc|ze‚|652>73:3ujvsm
16.大模型语音合成API豆包语音ssml 能力已支持,详见SSML 标记语言--豆包语音-火山引擎 (volcengine.com) 暂时不支持音高调节 大模型音色语种支持中英混 大模型非双向流式已支持latex公式 在websocket/http 握手成功后,会返回这些 Response header Key 说明 Value 示例 X-Tt-Logid 服务端返回的 logid,建议用户获取和打印方便定位问题,使用默认格jvzquC41yy}/xxqegpmjpn3eqo5eqlx187<21:7797>5
17.火山引擎正式发布豆包编程模型火山引擎新浪财经每经AI快讯,据火山引擎公众号消息,今天,火山引擎正式发布豆包编程模型:专为Agentic编程任务深度优化,在SWE-Bench-Verified官方榜单中刷新SOTA,更兼容Anthropic API等主流开发环境。豆包编程模型综合使用成本相比业界平均水平降低62.7%,国内最低价。目前,该模型已通过火山方舟平台全量开放API。同时,TRAE中国版正式接入豆包编程jvzq<84hkpgoen3ukpg/exr0ep5squq14286/:6/335eql2kph}{gƒ|3;;::8?3ujvsm
18.火山引擎体验豆包图像创作模型4.0 立即体验 体验完整能力,请访问 AI体验中心 Agent 开发平台与精选 AI 应用 火山方舟 一站式大模型开发平台,体验超全模型,每款豆包大语言模型提供50万Tokens免费额度,企业用户参与协作计划可获得500万Tokens免费额度。 API 构建应用 平台提供模型精调、推理、评测等全方位功能与服务,提供丰jvzquC41yy}/xxqegpmjpn3eqo5@h{to?ygzvxfik
19.字节火山引擎发布豆包编程模型,使用成本较行业降低62.7%大模型蓝鲸新闻11月11日讯 11月11日,字节跳动火山引擎正式发布豆包编程模型(Doubao-Seed-Code)。据官方介绍,该模型专为Agentic编程任务深度优化,在多项权威基准测试中达到国内领先水平,同时也是国内首个支持视觉理解能力的编程模型。豆包编程模型采用分层定价模式与全量透明Cache能力,综合使用成本比行业平均水平降低62.7%。以创建jvzquC41yy}/3?80eqs0f‚4ctvodnn4MG5RD;RG277<9Y9F0jvsm