重磅!火山引擎发布豆包大模型和款gent开发应用工具,性价比拉满!视频思考

智东西6月11日报道,今日,在FORCE原动力大会上,火山引擎推出豆包大模型1.6、豆包·视频生成模型Seedance 1.0 pro、豆包·语音播客模型,还升级了Agent开发平台等AI云原生服务。

豆包大模型1.6系列包含三个模型,分别为doubao-seed-1.6、1.6-thinking以及1.6-flash,其中1.6-thinking在推理能力和指令执行测评中超越DeepSeek-R1-0528。

在价格方面,豆包1.6变为按“输入长度”区间定价,深度思考、多模态能力与基础语言模型统一价格。在企业使用量最大的0-32K输入区间,豆包1.6的输入价格为0.8元/百万tokens、输出8元/百万tokens,综合成本只有豆包1.5深度思考模型或DeepSeek R1的1/3。

豆包·视频生成模型Seedance 1.0 pro首次在评测榜单Artificial Analysis的文生视频、图生视频两项任务上均排名首位,超越Veo3、可灵2.0等多模态模型。

并且,Seedance 1.0 pro模型每千tokens仅0.015元,每生成一条5秒的1080P视频只需3.67元,相当于1万元预算可以制作2700多条5秒的1080P视频,被火山引擎称为“业界最低”。

此外,火山引擎AI云原生全栈服务升级,推出了火山引擎MCP服务、PromptPilot智能提示工具、AI知识管理系统、veRL强化学习框架等面向 Agent 开发和应用的工具产品,并推出多模态数据湖、AICC私密计算、大模型应用防火墙,以及一系列AI Infra套件。

火山引擎最新数据显示,豆包大模型日均tokens使用量超过16.4万亿,较去年5月首次发布时增长137倍。另据知名行研机构IDC报告,豆包大模型在中国公有云大模型市场份额排名第一,占比高达46.4%。

一、豆包大模型1.6推理测评超DeepSeek-R1,使用成本降至1/3

据悉,豆包大模型1.6系列包含三个模型,分别为doubao-seed-1.6、1.6-thinking以及1.6-flash,并且这三个模型都支持256K上下文。doubao-seed-1.6是All-in-One的综合模型,深度思考、多模态理解、图形界面操作等多项能力。用户可以选择开启或关闭深度思考、自适应思考三种方式,其中自适应思考模式可根据提示词难度自动决定是否开启思考,提升效果的同时大幅减少tokens消耗。

doubao-seed-1.6-thinking是豆包大模型1.6系列在深度思考方面的强化版本,在代码、数学、逻辑推理等基础能力上有进一步提升。doubao-seed-1.6-flash是豆包大模型1.6系列的极速版本,支持深度思考和多模态理解。比较有特点的是,flash的延迟极低,TOPT仅需10毫秒,火山引擎称其视觉理解能力比肩友商旗舰模型。

智东西从现场了解到,豆包大模型1.6-thinking在推理能力、多模态理解能力、GUI操作能力上较1.5 pro有一定提升,其在GPQA Diamond(推理能力)和Multichallenge(指令执行)榜单上超越DeepSeek-R1-0528,与OpenAI-03-high的差距也在逐步缩小。

1.6系列模型支持多模态理解和图形界面操作,能够理解和处理真实世界问题,该能力支持了豆包APP最新的实时视频通话功能,在企业端可广泛应用于电商商品审核、自动驾驶标注、安全巡检等场景。

豆包1.6的图形界面(GUI)操作能力可以帮助用户完成一系列“智能体”类的跨平台操作能力。演示案例显示,豆包1.6可自动操作浏览器完成酒店预定,识别购物小票并整理成Excel表格等任务。

豆包大模型1.6在推理速度、准确度与稳定性上也有明显提升。豆包大模型1.6具有边想边搜、DeepResearch深度研究能力,能独立思考、规划、使用搜索等各种研究工具,可以在5-30分钟内生成一份调研报告。

据悉,目前豆包大模型已涵盖多模态、视频、图像、语音、音乐等模型品类。在行业应用上,豆包大模型已与全球TOP10手机厂商中的9家、8成主流汽车品牌、70%的系统重要性银行及超5成985高校等达成合作。

为方便企业使用,火山引擎还推出大模型应用实验室,并开源了手机助手、实时视频理解、DeepSearch等应用,帮助企业快速搭建AI应用原型,编排专属智能体。用户可在火山引擎官网大模型应用实验室、GitHub方舟开源站点下载使用。

二、Seedance 1.0多视频生成能力登顶,播客大模型可一句话生成脚本

豆包视频生成模型Seedance 1.0 pro也在原动力大会上亮相。该模型具备三大特性:无缝多镜头叙事、多动作及随心运镜、稳定运动与真实美感。Seedance支持文字与图片输入,可生成多镜头无缝切换的1080P高品质视频,主体运动稳定性与画面自然度较高。

在评测榜单Artificial Analysis上,Seedance在文生视频、图生视频两项任务上均排名首位,超越Veo3、可灵2.0等多模态模型。

原动力大会上还宣布,豆包·实时语音模型全量上线火山方舟,对企业客户开放使用。该模型支持自然语言高级指令控制,具备唱歌表演、声线模仿、方言演绎等多种能力,在语气、用语、思考方式等方面更加拟人。

此外,豆包·语音播客模型也同时发布。用户输入对话、网页链接、长文本或文档,语音播客模型即可生成播客脚本后创作出双人对话式播客作品。此外,播客模型自带的深度搜索功能还可以生成跟进热点话题的播客内容。

二、12款Agent开发工具亮相,数据获取成本降低80%

火山引擎智能算法负责人吴迪认为,要构建高生产力的Agent,既要用好AI,整合高质量的应用;又要做好AI,关注底层技术本身的优化和创新。为此,此次火山引擎带来了12款Agent开发工具产品的发布和升级,分别是TRAE、MCP(模型上下文协议)服务、提示词优化应用PromptPilot、AI知识管理产品以及开源veRL强化学习框架,还有多模态数据湖、AICC私密计算、大模型应用防火墙,以及一系列AI Infra套件。

首先,AI IDE产品TRAE迎来进一步升级,可以为开发者提供代码补全、局部代码生成功能,还支持代码重构、批量修改、知识问答等复杂任务。吴迪在会上透露,TRAE下一个版本还将整合不同Agent和工具,协调任务流程,实现自动串联操作,逐步从AI辅助编程向支持AI开发全流程进阶。据字节跳动技术副总裁洪定坤爆料,在字节内部,超过80%的工程师在使用TRAE辅助开发。自今年1月上线以来,TRAE的整体月活用户已经超过了100万。

火山引擎MCP服务正式发布,链接Agent开发体系、大模型工具生态、云服务,打通TRAE、 火山方舟和扣子,提供200+MCP服务。开发者可以通过MCP,控制火山引擎的云服务组件,完成计算、网络、存储等环境部署。

吴迪认为:模型越强,提示词越重要。提示词优化应用PromptPilot可以在互动中引导用户明确需求,自动撰写和优化提示词,可以积累案例自动优化提示词。同时,该应用还具备多轮对话、视觉理解、复杂工具调用的优化能力,还可以自主判断是否开启模型精调等。

为解决企业知识管理问题,火山引擎正式发布AI知识管理产品,该款产品支持文本、图像、音频、视频等多模态内容对话式交互,可以结合本地与互联网知识,提供内容理解和问答服务,推出可交互的推理“做个计划”功能,实现人机协作制定、修改计划。该产品目前已在火山引擎全量邀测。

吴迪提到,多步骤复杂任务的成熟和落地是2025年的重要趋势。最后,火山引擎在会上发布了开源veRL强化学习框架。veRL可扩展多种强化学习算法,无缝集成现有LLM基础设施与模块化API,开发者可以借此搭建RL模型开发管线,提升对话规划、智能编程、复杂策略优化等场景的开发效率与资源利用率。 除了提供开源框架,此次火山引擎还上线了veRL平台,支持强化学习需求。

此外,在数据基础设施方面,火山引擎推出多模态数据湖解决方案和Data Agent。多模态数据湖是新一代AI Native的数据基建,该解决方案可以帮助企业在多模态数据处理、检索和分析场景上,识别和利用多模态数据资产,驱动企业AI模型训练与决策。Data Agent具备数据主动分析、智能洞察、策略生成能力,可将日常取数速度从小时级到分钟级,数据获取成本降低80%。该产品的复杂分析效率可以从周级到小时级,洞察及时性提升90%,可以大幅节省深度分析报告、方案等的产出时间和人力成本。

在AI基础设施方面,火山引擎AI infra推出AgentKit,为企业级Agent打造的全栈开发和服务工具链。AgentKit基于火山引擎veFaaS预置模板,集成了豆包大模型1.6与Computer Use等工具,用户只需选择模型和配置参数即可快速部署,实现分钟级10万核扩容。AgentKit还可以构建完整工具生态体系,支持多终端Tool Use、覆盖数十类三方MCP Server。

训练套件TrainingKit则面向后训练环节,可以实现高达60%+的MFU(算力利用率),通过veRL框架、 Sandbox百万核秒并发能力,可以有效提升后训练效率。以及,推理套件ServingKit可以从模型部署、在线推理、服务运维三个阶段进行加速和提效,支持开源推理框架,并针对主流模型进行算子优化,性能相比社区最新版本可以提升2-3倍。

安全是一切Agent运行的基础,针对企业数据和用户隐私保护,火山引擎还推出两款AI安全产品。AICC密态计算可以通过用户个人密钥加密、CPU/GPU硬件可信环境计算、数据流转落盘全密文的方式,让企业在不损失推理效果的前提下,安全合规地使用云端模型。另外,大模型应用防火墙则可以通过精调的小参数模型、分层漏斗策略、流式送检机制,保障精准拦截攻击变种,同时不会增加推理延迟。

结语:字节跳动AI全栈路径明晰

字节跳动在FORCE原动力大会上发布的AI产品矩阵,揭示了其以“模型能力+工具链+基础设施”为核心的产业智能化路径。从豆包大模型1.6的架构升级到视频生成、语音交互等全模态能力的突破,再到AI云原生全栈服务的系统化构建,字节跳动的AI战略已形成从模型研发到应用落地的闭环。

THE END
0.一文读懂火山引擎云数据库产品及选型数据库nosql关系型数据库火山引擎数据库传输服务 DTS(Database Transmission Service)提供了数据迁移、数据同步、数据订阅于一体的数据库数据传输管理服务,支持关系型数据库、非关系型数据库数据源间的数据传输,降低数据库之间数据流通复杂性,可在业务不停服的前提下轻松完成数据库迁移上云。相较于第三方迁移工具,数据库传输服务 DTS 可以更方便jvzquC41pg}t0|npc0ipo7hp1u~04974/38.2>4fgvgjn6nossynty=86:71:7xjvor
1.火山引擎产品介绍思维导图模板火山引擎是字节跳动旗下的企业级技术服务平台,提供各种云计算、大数据和人工智能技术服务。产品涵盖内容管理、数据智能、人工智能和云基础架构等多个领域,包括不限于智能推荐、机器翻译、智能客服、语音识别、视觉识别等技术。火山引擎旨在帮助客户降低技术开发和业务运营的成本,提高工作效率和创新能力。火山引擎的产品和jvzquC41yy}/r{teguypp7hqo1|jg€488e:9::i8c6ie5@;ddf;76?:
2.对话火山引擎谭待:大模型的下一个战场在哪?亿邦数字化频道赵何娟:现在国内的做大模型的企业和团队非常多,包括像月暗、智谱、百川,在国内来说相对来说有一些知名度的大模型,基本上还是在火山引擎上跑。作为一个行业底层服务的提供商来说,你会觉得国内现在的“百模大战”“千模大战”优势在哪里?或者有一些什么问题? jvzquC41yy}/gkwwp0ipo8724667494p/3=79>3jvor
3.火山引擎代理火山云代理商抖音云火山引擎是字节跳动旗下的云服务平台,将字节跳动快速发展过程中积累的增长方法、技术能力和应用工具开放给外部企业,提供云基础、视频与内容分发、数智平台VeDI、人工智能、开发与运维等服务,帮助企业在数字化升级中实现持续增长。jvzquC41yy}/w{q;0et0
4.字节收购蓝色光标??重视火山方舟、豆包、扣子智能体核心合作伙伴!!蓝色光标宣布与火山引擎达成深度合作,双方将基于火山方舟、豆包·视频生成模型、扣子专业版智能体开发平台,在视频生成、视频服务解决方案以及营销行业智能体应用等领域展开深入合作,共同推动AI与营销体系的深度整合、加速营销行业AI化进程。 豆包·视频生成模型具备精准的语义理解、强大的动态表现与多样化运镜、一致性多镜头jvzquC41yy}/lrz{cpmpppxjg0ipo8f1f4jxmzx3o6Elg‚|qtfC&GA*;5'?E'N=':;+C4.J7':;&:B*G8'G1'A<
5.火山引擎火山引擎是字节跳动旗下的云与AI服务平台。在AI时代,聚焦豆包大模型和AI云原生技术,为企业提供从 Agent 开发到部署的一站式服务,助力企业AI转型与创新发展。jvzquC41yy}/xxqegpmjpn3eqo5
6.发布两个“王炸”模型!火山引擎出大招,翻译和设计师要慌了想知道火山引擎要折腾些什么新东西吗?跟着我走就对了。 大约一个月前,我到上海参加了 "2025 火山引擎春季 FORCE 原动力大会 "。 作为半年一次的大会,火山引擎那次确实带来了很多值得关注的更新,除了豆包大模型 1.6 的正式发布、豆包大模型家族的全面焕新,还有颇受关注的扣子和 TRAE 的新消息,颇有种想把其他同类jvzq<84yyy4{ctjt0et0pn|u1cxuklqgapkx0ymrArq>8A=c3:6::n>h2;;1fl9hhhj4
7.携手火山引擎,海创汇加速“专精特新”企业数智化转型山东站而且,火山引擎在人工智能领域有着丰富的产品布局,例如豆包大模型(自研大模型)、火山方舟(一站式大模型服务平台)、AI应用开发平台(扣子专业版|Hi Agent),在与行业外部企业深度共创中,适配多种业务场景,激发企业增长潜能。 海创汇是海尔集团面向全球创业者打造的创业加速服务平台,也是工信部认定的首批支持国家级专精特新“小巨 jvzquC41uf4djrsc0eun1uzsk181295;5:532;:234704>>6:9>40qyon
8.通过搭建质量体验体系火山引擎视频云打造面向体验的产品矩阵2月25日,火山引擎视频云科技原力峰会顺利召开。 火山引擎视频云是如何发展起来的?火山引擎要做什么样的视频云?未来视频云又会是什么样的?火山引擎视频云技术负责人浩铭在以《面向体验,助推超视频时代新增长》为主题的演讲中,分享了对视频体验、交互、增长的观察与思考,并介绍了火山引擎视频云的从前、现在,以及未来的jvzquC41pg}t0v~ftk|ft|3eqo521A6:1:798990jvs
9.谢皓:AIAgent在边缘云的探索与实践边缘计算4.智能体在火山引擎边缘云的实践 接下来讲讲智能体在边缘云的实践。 4.1 协同扣子实现工厂自动巡检 第一个案例是跟扣子协作,实现了工厂的自动巡检。扣子是开发新一代 AI 智能体的应用开发平台,有一系列灵活好用的组件和工具,我们联动扣子通过定制插件和工作量让智能体具备了感知,操作设备的能力,实现了工厂的自动巡jvzquC41zkk/kwkqs0io1jwvkerf1@97fe73g
10.音视频费用扣子火山引擎官方文档中心,产品文档、快速入门、用户指南等内容,你关心的都在这里,包含火山引擎主要产品的使用手册、API或SDK手册、常见问题等必备资料,我们会不断优化,为用户带来更好的使用体验jvzquC41yy}/xxqegpmjpn3eqo5eqlx1:6:6:867:7718Hwgfkxfe}B3
11.抖音是由什么引擎提供数据|帆软数字化转型知识库火山引擎的强大之处在于其人工智能和推荐算法。字节跳动通过深度学习、机器学习等技术,对用户行为数据进行建模和分析,从而实现精准的内容推荐。推荐算法是火山引擎的核心,它通过分析用户的历史行为、兴趣爱好、社交关系等多个维度,生成个性化的推荐结果。推荐算法还会不断进行自我优化,通过A/B测试和在线学习,不断提升推荐效jvzquC41yy}/hjstwct/exr1dnuh1jwvkerf1?833690
12.【信达计算机|豆包大模型行业深度】AI投入持续加大,C端、B端两手齐抓字节跳动推出的新一代AI agent开发平台扣子,允许用户快速搭建基于大模型的各种智能体bot,并发布到各个社交平台、通讯软件或部署到网站等其他渠道。目前,扣子专业版集成了1万+插件,可以调用国内流行的大语言模型如豆包、通义千问等。2024年12月18日,在火山引擎FORCE原动力大会上,正式发布了扣子1.5版本。扣子1.5集成了jvzq<84hkpgoen3ukpg/exr0ep5squq14286/98/275eql2kpgtrcw}435<2993ujvsm
13.扣子不甘于人后,搭建自己的企业机器人火山引擎扣子扣子(coze.cn)是新一代 AI 应用开发平台。无论你是否有编程基础,都可以在扣子上快速搭建基于大模型的各类 Bot,并将 Bot 发布到各个社交平台、通讯软件或部署到网站等其他渠道。 火山引擎面向企业和个人用户推出企业级的 AI 应用开发平台,即扣子专业版。扣子专业版在扣子基础版可视化灵活编排 Bot 的能力基础上,承诺jvzquC41dnuh0lxfp0tfv8}w{{687>4ctvodnn4fgvgjn|4362<699;4
14.豆包大模型定价开启“厘时代”火山引擎助推金融行业加速升级5月15日,在火山引擎原动力发布会上,字节跳动豆包大模型家族、火山方舟2.0、AI应用及AI云基础设施等一系列最新产品正式发布。 火山引擎是字节跳动旗下云服务平台,据火山引擎总裁谭待介绍,经过一年时间的迭代和市场验证,字节跳动自研的豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一,目前日均处理1200亿TokejvzquC41ycv/gjxvoqtf{7hqo1g04976278159=38;?:4>3jvor