破局与进化:火山引擎atagent从落地实践到架构未来文章开发者社区

Data Agent整体介绍

智能分析Agent产品演进

智能分析Agent技术架构演进

智能分析Agent落地新进展

Data Agent未来架构展望

我想从一个“四象限”框架开始谈起。

自ChatGPT支持上传Excel文件以来,许多数据从业者就开始思考:能否利用Agent或大模型来替代传统的数据分析工作?这个四象限划分了不同的技术路径:第一象限是纯大模型(Bare Metal),直接调用API生成文本;第四象限代表传统数据产品,如BI工具和归因分析系统;第二象限则是通用Agent,例如Deep Research这类能撰写报告、进行调研的产品。

然而,通用Agent在处理数据分析任务时往往力不从心。一个典型的例子是SQL代码生成:如果没有经过精心设计,其生成正确代码的成功率可能像“抽卡”一样随机,十次尝试中或许只有两三次能写对。更关键的问题在于企业知识的融合——公司的指标平台是一个复杂的系统工程,通用Agent难以理解和接入这种专业的数据知识体系。

正因如此,Data Agent的价值得以凸显。它需要既能无缝对接企业的知识基座,又能在数据领域通过精细化的流程设计和工具链优化,切实提升业务适用性和数据结果的准确性。

那么,什么是数据分析Agent?

简而言之,数据分析Agent第一代可以理解为“Chat BI”,即聊天式的商业智能交互;第二代则更接近通用Agent在数据领域的深度应用,能够执行端到端的自动化分析任务。在火山引擎,我们构建了完整的产品体系来支持这些能力,包括Chat BI数据洞察报告、开放的数据分析Agent接口,以及自动生成仪表盘等功能。

这套产品的能力是分层构建的。

最底层负责适配各种模型底座,如火山引擎内部系统或兼容OpenAI协议的外部模型;向上是数据能力底座,解决企业最核心的数据连接、权限管控等基础问题;再上一层是配置管理层,致力于将散乱的数据命名和描述进行语义化处理,并结合业务知识库和知识图谱,使模型能够真正理解企业的数据内涵;最顶层则是面向用户的数据消费产品,例如支持多轮追问的Chat BI界面,以及今年新推出的深度研究模式。

这些能力不仅可以通过原生的用户界面使用,也能通过开放的API集成到企业的OA系统或工作流平台中。

谈到产品演进,一个关键概念是“Product Model Fit”——产品形态必须与模型能力相匹配。在Pre-LM(前大模型)时代,人们尝试用BERT等小模型做Text-to-SQL,效果如同玩具,难以实际落地;进入前大模型时代后,BI产品开始加入归因预测等增强分析功能,但对用户要求过高,普通人难以驾驭。直到2023年底ChatGPT 3.5的出现,催生了一批Chat BI产品,但其应用场景仍显局限,灵活性不足。

真正的转折点出现在2024年。O3推理模型的出现,让Deep Research这类产品展现出令人惊艳的能力,它让我第一次感受到AI在数据分析领域接近L3/L4级自动驾驶的智能水平。今年之所以被称为“Agent元年”,正是因为模型能力终于能够支撑开放式的Agent设计理念。

我们的第一代产品“智能问数”就是在ChatGPT 3.5时期诞生的。在设计时,我们特别关注了数据分析师的实际工作流程:他们使用仪表盘等工具时,并非直接创建仪表盘,而是先灵活地查询数据、寻找洞察,再将有价值的结论固化为报表。因此,我们的产品让用户先通过主动提问进行灵活分析,接着系统自动进行归因和下钻以发现关键维度,最后用户可以将有价值的问题收藏并自动生成日报或周报。这看似是一个简单的聊天机器人(Chatbot),实则完整还原了从临时性洞察到例行化监控的业务闭环。

当然,任何产品都有其局限性。Chat BI能否真正发挥作用?关键在于找到合适的应用场景。它可能无法完全替代专业分析师的全套工具链,但对于一线业务人员来说却非常适用。例如,我们为抖音地推团队部署后,八千多名成员可以随时在移动端查询数据,其灵活性远超传统BI工具。这引出了一个核心矛盾:产品开发不能一味追求技术先进性,更要解决“Product Market Fit”(产品市场契合度)——即明确谁需要这个产品,在什么场景下使用?这才是决定产品能否成功落地的关键。

引入新产品后,关键在于找准它能替代哪些现有场景。例如,Chat BI能否替代传统BI系统?对于熟练的数据分析师而言可能不行,他们已精通现有工具。但在我们火山引擎落地的案例中,像抖音地推团队这样的一线人员,规模达八千人且常年在户外奔波,传统BI根本无法在移动端灵活支持他们实时查询数据、服务客户。恰恰是这种移动端、临时性的查询场景,成为了Chat BI大放异彩的舞台。

这涉及到三种替代逻辑:产品替代要看目标用户,场景替代要看任务复杂度。例如,分析师需要同时计算同环比、占比并进行归因分析,当前Chat BI的架构尚难以支撑如此复杂的任务;技能替代则要看用户角色,决策层和一线员工可能是最合适的受益者。归根结底,Chat BI并非万能钥匙,无法通吃所有场景,找准其“Product Market Fit”(PMF)的突破口至关重要。

因此,我们在2025年推出了“深度分析模式”,它更接近通用Agent的形态:用户只需提出一个开放性问题,系统便能自动生成分析计划、拆解子任务、执行到底,最终输出Markdown报告或网页。

虽然看起来能处理更开放的问题,但也带来了新的挑战,其中“领域知识”是首要障碍。人类语言本身存在局限性,例如广告行业的“消耗”一词,外行人可能完全不解其意。为此,我们构建了结构化知识库来解决专业术语问题。

此外,分析框架也需要专门沉淀,因为在拆解开放性问题时,模型的理解可能与企业惯用的分析逻辑存在偏差;还有领域常识,例如电商行业的“黑话”往往散落在飞书文档中,我们通过对接企业知识库,挖掘出这些“冰山下的知识”。

数据准确性更是硬性要求。Chat BI偶尔算错一个数字或许尚可容忍,但当深度分析报告涉及二十个数据点时,即使每个点有99%的准确率,其整体准确率经过连乘也会骤降至82%。更不用说用户提问本身可能模糊不清,结果也难以校验。

我们引入了反问澄清机制和自动化校验手段,如同给Agent配备了一位“质检员”,逐步将准确度打磨提升。带着这些思考,接下来我们探讨技术架构如何支撑这些需求。

在技术架构层面,Data Agent的整体框架与我们之前提到的产品能力矩阵是匹配的:最底层处理模型集成、数据接入、智能配置等基础工作;向上则通过Open API、MCP(模型控制平面)甚至谷歌的A to A协议,使企业能够灵活地将Agent能力嵌入其自有系统中。

这里需要重点介绍“智能问数”架构的演进。1.0版本大家可能比较熟悉:用户提问后,系统首先进行Schema Linking(理解问题并定位相关数据),接着通过语义粗排和精排选择数据集,再结合知识库和Prompt生成代码,最后将代码转换成不同引擎可执行的语句并可视化结果。这套流程在学术论文中常见,但在实际应用中发现泛化能力不足。事实证明,在模型能力提升之后,过于清晰的流程反而会显得僵化。

因此我们升级到2.0版本:将原先固定的模块拆解为工具包,例如数据集选择工具、图表洞察工具、SQL/Python沙箱等。用户问题输入后,系统动态规划执行流程,像搭积木一样按需调用工具。这更接近真正的Agent理念,模型能够理解上下文,并能采用类似React架构的思路进行自我优化,提升输出质量。简而言之,架构从“流水线”进化为了“智能调度站”。

深度分析模式的架构在短短半年内就迭代了三次。今年5月在北京分享的版本是“Plan-and-Execute”模式:先由Coordinator生成计划,再分派给Worker工具执行。听起来合理,但实际运行中暴露了问题:第一个工具生成的SQL筛选条件,在传递给第二个工具时可能丢失。上下文传递如同掉入黑洞,第一步设定的全局规则在后续执行中可能被忽略。这种架构在需要动态调整时尤其吃力,一旦计划生成便难以中途优化。

另一个棘手的问题是动态调整能力。之前的架构一旦生成计划就僵化执行,中途优化困难重重。因此,我们从“Plan-and-Execute”升级到“One Agent”模式。但在落地时发现,用户需求存在显著差异:开放性问题需要启发式思路,而日报周报等模板化任务更看重稳定性。新架构对这两类需求进行了分流处理,同时优化了工具设计,确保模型在编写SQL等操作时能记住上下文规则,即使经过二十步操作也不会丢失关键信息。

架构升级后,数据准确性确实得到了提升,但客户的需求不止于此,他们希望报告能提供有价值的业务洞察。我们发现“One Agent”在“举一反三”、结合业务场景提出建议方面仍有不足。

于是我们更进一步:拆分出专门负责数据探查的Agent和专注于数据洞察的Agent,各司其职;配备了上下文引擎来管理记忆;并重新设计了Agent Workspace,本质上是为模型打造一个更趁手的“工作台”,让它能够以更自然的方式调用工具。这就是我们当前3.0架构的核心思想。

谈到落地效果,在电商场景中,一线运营人员使用Chat BI进行数据查询和归因分析,能够将高频问题沉淀为自动化报告;另一个智能投顾案例中,Agent生成的营销活动报告直接提升了投资顾问的工作效率。

首先,错误会指数级放大。单步99%的准确率,在二十步操作后可能骤降至82%。架构设计必须直面这一数学规律,通过冗余校验、多重验证等手段与之对抗。

其次,团队需要并行实验。过去半年我们架构迭代三次,正是依靠多线并行的验证策略。如果死磕单一方案,一旦模型能力升级,原有方案很容易掉队。搞Data Agent开发,敏捷比完美更重要。

THE END
0.火山引擎火山引擎是字节跳动旗下的云与AI服务平台。在AI时代,聚焦豆包大模型和AI云原生技术,为企业提供从 Agent 开发到部署的一站式服务,助力企业AI转型与创新发展。jvzquC41yy}/xxqegpmjpn3eqo5tgv
1.火山引擎火山方舟 豆包大模型 语音合成 云服务器 生态与合作 火山引擎坚持“内外融合、价值共生”的生态理念,通过优质及差异化的产品技术、丰富的抖音集团生态资源,携手伙伴一起为客户构建云上增长新动力 查询合作伙伴 AI生态伙伴招募HOT AI场景x技术融合,共赴智能未来 jvzquC41rcxupnw0xqrdgwlkpg4dqv4
2.火山引擎火山引擎云上增长新动力© 京ICP备20018813号-48 jvzq<84|l{zyr7hp1
3.火山引擎火山引擎云上增长新动力© 京ICP备20018813号-47 jvzq<84|l{zyf7hp1
4.火山引擎火山引擎云上增长新动力© 京ICP备20018813号-46 jvzq<84{vzvu|7hp1
5.火山引擎官网火山引擎是字节跳动旗下的云与AI服务平台。在AI时代,聚焦豆包大模型和AI云原生技术,为企业提供从 Agent 开发到部署的一站式服务,助力企业AI转型与创新发展。jvzquC41yy}/xxqercxupnw0eqs0
6.账号登录简体中文 欢迎来到火山引擎 手机号登录 登录视为您已阅读并同意火山引擎服务条款和隐私政策 登录 忘记账号忘记密码 IAM子用户登录|企业联邦登录 其他登录方式 邮箱 没有账号?现在就注册jvzquC41eqttquj0xqrdgwlkpg4dqv4
7.ByteHouseByteHouse 是火山引擎旗下的一款云原生数据仓库,为用户提供极速分析体验,能够支撑实时数据分析和海量数据离线分析。便捷的弹性扩缩容能力,极致分析性能和丰富的企业级特性,助力客户数字化转型。jvzquC41d{zfjxzug0io1
8.飞连SSO单点登录VPN终端安全合规便捷Wifi认证通过火山引擎飞连的 All in one 解决方案,亿咖通在员工体验、办公效率、安全保障上都有了大幅提升:不但从以前的 6 个客户端减少至 1 个客户端,还实现了 100% 终端管控,规避不可信设备接入企业网络。 已用模块:虚拟专用网络网络准入终端防病毒 一个平台实现全场景安全入网,覆盖 Linux 终端 覆盖远程接入、员工入网、访 jvzquC41yy}/hnnnkct/ew4
9.火山引擎安卓版下载火山引擎官方版下载v1.5火山引擎app对企业的实际需求,提供了一站式的云服务解决方案。软件凭借云基础、视频云、边缘云、大数据和人工智能等核心服务,助力企业在数字化升级中实现持续增长。它简化了技术门槛,降低了资源投入,让企业能够更轻松地享受到数字化带来的红利。 软件特色 jvzquC41o0isut~0eqs0oru1uqlu1?588;>/j}rn
10.火山引擎AI一体机DeepSeek版来了火山引擎deepseek为满足企业将 DeepSeek 与本地数据和关键业务场景打通融合的新需求,火山引擎重磅推出了火山引擎AI一体机-DeepSeek 版,旨在通过更高性能优化、更全产品能力和更强安全防护的一站式解决方案,加速企业 AI 升级。 火山引擎 AI 一体机-DeepSeek 版可小时级完成部署,让企业快速完成 AI 与业务的融合,轻量的 AI 云原生jvzquC41dnuh0lxfp0tfv8vsa9949?6291gsvrhng1jfvjnnu1757B:6356
11.火山引擎火山引擎是字节跳动旗下的云服务平台,将字节跳动快速发展过程中积累的增长方法、技术能力和应用工具开放给外部企业,提供云基础、视频与内容分发、数智平台VeDI、人工智能、开发与运维等服务,帮助企业在数字化升级中实现持续增长。jvzquC41yy}/xxqegpmjpn3eqo5be}nxkv0Rjwvpgx.CR2Uqn{ukxs
12.火山引擎火山引擎是字节跳动旗下的云服务平台,将字节跳动快速发展过程中积累的增长方法、技术能力和应用工具开放给外部企业,提供云基础、视频与内容分发、数智平台VeDI、人工智能、开发与运维等服务,帮助企业在数字化升级中实现持续增长。jvzquC41yy}/xxqegpmjpn3eqo5qtxiwev5mkj1ncxhg|uqtvymkj
13.火山引擎业务咨询jvzquC41rcxupnw0xqrdgwlkpg4dqv4eqpzbe}4qeggogwlkpg
14.火山引擎万有伙伴 融合伙伴产品、服务和技术方案,构建更具备市场领先性的产品及解决方案 伙伴权益 伙伴级别 先锋级优选级精英级 万有商城 资源位 - 可申请 优先支持 商城入驻 - 可申请 优先支持 营销支持 火山引擎官网展示 - 可申请 优先支持 火山引擎授牌 - jvzquC41rcxupnw0xqrdgwlkpg4dqv4rctzog{4ycppw
15.火山引擎开发者社区火山引擎开发者社区是面向开发者的开放性技术论坛,覆盖 AI,大模型,云计算,云原生,数据库,云存储,边缘云等领域,通过技术文章、活动、比赛、问答、课程等形式,为开发者与企业提供先进的云上技术能力与经验。jvzquC41fg|fnxugt0|pnljpiktf0lto1
16.火山引擎火山引擎是字节跳动旗下的云服务平台,将字节跳动快速发展过程中积累的增长方法、技术能力和应用工具开放给外部企业,提供云基础、视频与内容分发、数智平台VeDI、人工智能、开发与运维等服务,帮助企业在数字化升级中实现持续增长。jvzquC41rcxupnw0xqrdgwlkpg4dqv4rtqmscvrg1ygo{xz
17.文章技术博客探索云计算与AI的世界火山引擎开发者社区是火山引擎的 TOD 社区,致力于链接火山引擎和开发者,为大家提供前沿技术内容和丰富的技术活动,打造更好的开发者文化和氛围,共建开源生态。 AI工程化 2025-10-22 n8n官方推出AI工作流生成器,用自然语言构建工作流 AI企业应用人工智能与算法开发与运维 专注于AI领域(大模型、MLOPS/LLMOPS 、AI应用jvzquC41fg|fnxugt0|pnljpiktf0lto1cxuklqgu
18.通过火山引擎本地部署DeepSeekR1火山引擎api价格表火山引擎为DeepSeek-R1模型提供的免费额度及相关信息如下: 1.50 万 Tokens 体验包 新用户注册火山引擎并完成实名认证后,可免费获得 50 万 Tokens 的推理额度,支持文本生成、对话、代码编写等全功能。该额度适用于 DeepSeek-R1 满血版(非蒸馏版),用完后才会开始按量计费。 jvzquC41dnuh0lxfp0tfv8|gkzooa=:5238868ftvkimg8igvcomu8667;6:;=6
19.AI教学智能体开发平台大单:火山引擎(中)|云头|ai教学|ai教学智能体拟定供应商信息:北京火山引擎科技有限公司 云头条声明:如以上内容有误或侵犯到你公司、机构、单位或个人权益,请联系我们说明理由,我们会配合,无条件删除处理。 特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。 Notice: The content above (including thejvzquC41yy}/3?80eqs0f‚4ctvodnn4MG;?6C?F2737E8[Q0jvsm
20.火山引擎招聘网2025年火山引擎招聘信息猎聘2025年火山引擎招聘信息,海量高薪猎头职位等你来选,了解火山引擎岗位要求、薪资待遇等真实招聘信息,找高薪职位,上猎聘!jvzquC41yy}/nrjrkp4dqv4|rjyzsv
21.最强DeepSeekR1+火山引擎:无长度限制,本地部署+知识库,注册即享750万最近火山引擎推出了自家联网版的DeepSeekR1,并且加入了联网的功能,不用担心DeepSeek本体的服务器繁忙了,可以说直接是DeepSeek本体的替代品。现在注册即送30块体验价(相当于750wtoken)。下面就是教大家如何直接使用火山引擎使用R1和接入CherryStudio作为本地部署,最后一部分讲一下如何使用火山引擎。 jvzquC41dnuh0lxfp0tfv87623e96=>7:980c{ykenk0fnyckny03=;4:3>56
22.基本介绍账号相关1个企业主体支持实名认证10个火山引擎账号。 如有特殊需求,请提工单或联系您的客户经理进行申请。 实名认证入口 登录到火山引擎之后,如果账号未进行实名认证可以在控制台或者账号管理当中找到实名认证的入口。 火山引擎顶部导航 点击用户名,可以点击未实名进入实名认证控制台,也可以在下拉菜单中选择“账号管理”,在账号jvzquC41yy}/xxqegpmjpn3ep1jpe|4848708=>57
23.让智能体开发如“拼积木”般便利!合合信息携手火山引擎共探大模型为满足不同用户需求,合合信息与火山引擎联合,在火山引擎Hi Agent、Coze等AI应用创新平台中,共同实践文档解析领域的“企业级+开发者级”的分层设计,并提供配套部署方案,实现全场景覆盖。 其中,Hi Agent聚焦企业级用户,提供智能体从开发、评测、观测到优化的全周期管理,企业可从包括TextIn文档解析模块在内的多个行业“jvzquC41o0hcvwjyu0ipo7hp1cxuklqg176:3==
24.火山引擎火山引擎Force原动力大会 2022火山引擎Force原动力大会 2022/07/20 10:00-18:00 北京 数字新引擎 · 云上新增长 万象云:行业实践深度分享,共同探讨新引擎合作下的增长新可能 创新云:全面布局首次呈现,共同感受云业务创新的增长新动力 数智云:前瞻观点巅峰碰撞,共同夯实数字时代下的云服务新基础 jvzquC41yy}/xxqegpmjpn3ep1gdvr{kv{5pxnwxkg}
25.微信小程序调用火山方舟(字节跳动火山引擎)中的DeepSeek大模型微信小程序的轻量化特性与DeepSeek大模型的AI能力结合,可快速构建智能问答、内容生成等场景化服务。通过火山方舟平台提供的标准化接口,开发者无需深入算法细节即可调用模型能力。 一、注册火山引擎账号,创建APIKey和model(接入点ID) 1.注册并登陆火山引擎账号,网址为:https://console.volcengine.com/ jvzquC41dnuh0lxfp0tfv8qhs9<24991ctzjeuj1fgzbkux136;94<52:
26.火山引擎火山引擎是字节跳动旗下的云服务平台,将字节跳动快速发展过程中积累的增长方法、技术能力和应用工具开放给外部企业,提供云基础、视频与内容分发、数智平台VeDI、人工智能、开发与运维等服务,帮助企业在数字化升级中实现持续增长。jvzquC41yy}/xxqegpmjpn3eqo5qtxiwev5kkvjpi