火山引擎ataeap推出两款大模型应用:对话式检索与开发,打破代码语言屏障文章开发者社区

自上世纪50年代,以“计算机”作为代表性象征的信息革命开始,社会对于先进生产力的认知便开始逐步更迭—— 从信息化 (通常认为是把企业中的信息资源与信息技术有机结合,从而提高企业的管理水平和效率 )到数字化( 普遍认为是以数据分析为核心,利用各种业务数据去反哺和优化业务过程)转变。

企业希望通过数字化来突破业务瓶颈,实现转型升级。而这期间,数据作为新的生产要素,其重要性毋庸置疑。

9月19日,2023火山引擎数据驱动科技峰会发布数据产品大语言模型(Large Language Models)应用:DataLeap-找数助手、DataLeap-开发助手和DataWind-分析助手,为企业提供从数据资产的检索、到数据开发,再到数据应用的全链路AI能力。

上述能力的发布,其目的就是让企业能更便捷地生产数据、应用数据,实现更普惠的数据消费,为数字化提供现实基础。

DataLeap是火山引擎数智平台(VeDI)推出的大数据研发治理套件,核心是帮助企业快速完成数据集成、开发、运维、治理、资产、安全等全套数据中台建设。

DataLeap此次升级发布的两款大模型应用能力 “DataLeap-找数助手” 与 “DataLeap-开发助手”, 主要聚焦在企业数据资产查询与数据开发运维两大核心场景,通过大模型能力的加持,降低企业数据资产检索和数据开发的准入门槛。

从企业数据消费的链路来看, 数据资产的检索、管理可以看作是消费的第一环。 找到正确的数据资产,继而才能实现数据的消费。

数据的查找和使用本身强依赖业务专业知识的输入。过去传统技术方案下,数据资产检索重依赖数据结构化管理,需要大量的人力保障,且不够灵活。

同时,非结构化数据与数据资产的关联缺失,会导致大量业务信息缺失,而以往基于关键词在结构化及非结构化数据中的检索,由于检索链路割裂,会大大降低基于业务场景的数据查找和消费效率。

此外,检索提供的是基于关键词的候选答案集合,需要人为再次筛选确认,不是直接的答案,导致用户很难有良好体验。

与 大语言模型(LLM) 结合后,资产查询的方式变得更“ 拟人化” :在与用户对话式的过程中,大语言模型(LLM)可以理解用户真实意图,让搜索过程更聚焦,节约了人为判断的成本。

同时,伴随模型语义理解分析能力的逐步提升,对话式检索相比单纯地用关键词检索的方式,其全链路的检索效率也更高。

在功能上,“DataLeap-找数助手”目前主要提供三类:

● 找数据,表、数据集、仪表盘等

● 问含义,指标的口径信息、维度枚举值含义等

● 业务咨询,业务知识咨询,如业务常见术语含义,业务分类等信息

其核心优势在于:

● 问答式查询方式,查询效率更高;

● 轻量化接入能力,支持自助接入企业知识库;

● 语料充分,元数据中心能力完善可提供企业级服务

能力发布后,“DataLeap-找数助手”将让企业的数据资产检索变得更快,使得低成本管理、真正的自助式数据消费变得可行。

利用“DataLeap-开发助手”,可以实现通过自然语言描述,自动生成代码;针对已有的代码可以自动实现Bug修复,代码优化、解释与注释等;对话式方式进行文档搜索、函数使用、代码示例等问题咨询。

过去,研发人员必须充分熟悉SQL等数据开发语言, 才能高效支持数据分析背后的开发需求。 但在现实场景中,数据分析师、依赖数据的业务运营人员都会有大量的数据消费诉求,也就意味着需要大量的专业数据研发人员来支持一些看似基础但仍需要人为介入的开发工作。

“DataLeap-开发助手”底层采用大语言模型,经过海量的代码和语料训练,可以根据用户的自然语言输入,自动关联包括表Schema在内的元数据信息,生成高质量的数据加工代码,并具备代码的理解、改写以及领域知识的问答能力。

目前看,“DataLeap-开发助手”主要提供以下3个细分场景的服务:

● 生成代码: 描述需要处理的问题可以自动生成代码,例如:从多张数据表中,通过关联,自动查询、统计指标数据;

●智能问答:根据你描述的问题进行答疑,例如忘记 Spark 函数怎么写,唤起智能开发助手,询问函数使用方式;

●修复/优化代码:用户可以直接在 SQL 编辑器中通过AI修复功能,了解详细的报错原因,并基于修复建议“一键完成”选中代码的修复/优化。

“DataLeap-开发助手”的核心优势在于:

● 适配多场景数据开发,简单场景自动开发,复杂场景辅助提效

● 内置于编辑器,灵活唤起,减少多工具切换成本,交互体验对齐桌面原生 IDE(集成开发环境)

其核心价值是 打破了语言障碍,极大程度降低了数据开发的准入门槛, 同时让专业数据研发人员更聚焦复杂场景的需求,利用开发助手优化代码,提高研发生产效率与代码质量。

以 DataLeap 为代表的火山引擎多个数据产品拥抱AI, 本质是为了降低数据消费门槛, 通过数据消费来实现企业数据资产与业务应用的飞轮效应,提升企业活力。

产品介绍

火山引擎大数据研发治理套件DataLeap

一站式数据中台套件,帮助用户快速完成数据集成、开发、运维、治理、资产、安全等全套数据中台建设,帮助数据团队有效的降低工作成本和数据维护成本、挖掘数据价值、为企业决策提供数据支撑。

THE END
0.IDC:2025年上半年大模型公有云市场,火山引擎占比49.2%排名第一IDC:2025年上半年大模型公有云市场,火山引擎占比49.2%排名第一Video Player is loading.00:00/00:00 Loaded: 0% 视频加载失败,请查看其他精彩视频 相关视频 猜你喜欢 00:05:39 美媒:想买安世的芯片可以,但中方 00:02:06 Dexmal开源Dexbotic 00:07:03 越南在南沙疯狂造岛,中国为何不阻 jvzquC41xkjfq7xkpc4dqv3ep1v0hrscpek04977/2?.3B4fgvgjn6nphs€d{w>99:7857i0jvsm
1.抖音大规模实践火山引擎向量数据库对外开放服务快科技解决方案就是,将火山知识库文档和数据通过向量特征提取,然后存储到向量数据库中,应用LLM大语言模型与向量化的知识库检索和比对知识,构建火山引擎Oncall智能问答,可以让聊天机器人的回答更具专业性和时效性,构建专属Chatbot。未来,火山引擎Oncall的FAQ知识将持续沉淀,知识库持续完善,同时还能提供大模型训练数据,处理大量客jvzquC41pg}t0v~ftk|ft|3eqo521B871;968:;0jvs
2.万有商城云市场大模型AISaaS应用火山引擎万有商城荟聚优秀SaaS伙伴,为企业提供内容创意、直播工具、电商运营、广告营销、企业办公、网站建设等软件产品与服务,一站式助力客户运营提效和生意增长。jvzquC41ocxlg}3xqnifppnpg0ipo8
3.產學研齊聚楊浦,共話大模型產業創新未來火山引擎推出火山方舟大模型,提供模型訓練、推理、評測、精調等全方位功能和穩定可靠的安全互信方案﹔優刻得推出智能雲平台,提高全要素生產力﹔復旦大學與阿裡雲共同建設CFFF智算平台,推出多學科融合創新的AI for Science計算集群“切問1號”和專用高性能計算集群的“近思1號”,聚焦高性能、低能耗、靈活穩定、強拓展jvzq<84uj0vfqyqg0eun0ls1DKM61w71428419>471i25=<8:/:17A94:24ivvq
4.火山引擎大模型应用启动邀测,抖音十多个业务团队已试用6月28日,火山引擎发布大模型服务平台“火山方舟”,面向企业提供模型精调、评测、推理等全方位的平台服务(MaaS,即Model-as-a-Service)。目前,“火山方舟”集成了百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI等多家AI科技公司及科研院所的大模型,并已启动邀测。 jvzquC41hktbplj0gcyuoxsg{0ipo8sgyu525>9.42842?7;49<63B:85;4ivvq
5.火山引擎大模型生态:“SaaS+AI”商业化的新解法转动“数据飞轮”,需要更多 SaaS 伙伴使用大模型技术;随着调用量和使用深度的增加,大模型也会越用越好用。这也是火山引擎“万有计划·豆包企服联盟”期望带给 SaaS 伙伴的帮助:通过政策、技术、服务等资源上的支持,鼓励更多 SaaS 伙伴尝试大模型技术,解除在大模型探索、商业化过程中的种种顾虑。 jvzquC41yy}/gkwwp0ipo87246683B4p/3=82=3jvor
6.升级云服务火山引擎要做AI大模型“发动机”火山引擎总裁谭待表示,AI大模型有巨大潜力和创新空间,火山引擎会服务客户做好大模型,共同推动各行业的智能化升级。据悉,火山引擎机器学习平台经过抖音等海量用户业务长期打磨,支持单任务万卡级别的超大规模分布式并行训练场景。jvzq<84yyy4djrscpg}t0lto1ep0497512:.3A4;;;816B3ujvsm
7.海尔消金携手火山引擎,共建消费金融大模型产经在生成式人工智能浪潮的推动下,金融科技正迎来新一轮的创新与变革。5月10日,海尔消费金融(以下简称“海尔消金”)与火山引擎正式宣布,双方将共同成立金融大模型联合创新实验室,致力于构建消费金融垂直大模型,并在精准营销、智能客服、贷后管理、风控等业务场景中持续探索大模型的创新应用,从而加速海尔消金的智能化转型jvzquC41yy}/eny0eqs/ew4y|u0e‚z1361796530yivvq
8.火山模型和优化(向量化执行编译执行)文章讨论了现代CPU的处理特性,包括超标量流水线、乱序执行、分支预测、多级存储和SIMD优化,以及这些特性如何影响数据库查询性能。文章提到了火山模型和向量化执行模型在数据库执行器中的应用,分析了各自的优劣,并探讨了编译执行和数据预取等优化策略。 文章目录 jvzquC41dnuh0lxfp0tfv8vsa6:88?=:51gsvrhng1jfvjnnu1743<:588;
9.字节终于掀桌子了快科技5月 15 日,字节跳动首次向外界“推销”旗下 AI 大模型——其自研豆包“全家桶”官宣将通过火山引擎(字节旗下六大业务板块之一,其余五块分别是抖音、大立教育、飞书、朝夕光年、TikTok)对外提供服务。 至此,字节跳动纵身跳入国内大模型混战,其大模型版图正式浮出水面。 jvzquC41pg}t0v~ftk|ft|3eqo521B=21;>1;<;0jvs
10.火山引擎云上实战:DeepSeekR1大模型(全尺寸)本文将介绍两种在火山引擎云上部署 DeepSeek-R1 全尺寸模型服务的方案,涵盖大模型推理服务的 Terraform 一键部署、容器化部署、资源弹性伸缩和模型可观测。 来源| 火山引擎云基础 在AI 大模型日新月异的当下,企业在使用大模型时往往面临着数据隐私保护和性能优化的挑战。为了解决这些问题,企业 AI 大模型在云端进行私jvzquC41zkk/kwkqs0io1jwvkerf1;:8:h::h?5d37k83;=;99l39k
11.火山引擎吴迪:带你了解大模型的应用和未来技术解析火山引擎提供了火山方舟这个平台,火山方舟平台上面有众多优质的、精选的国内的高质量商用模型,像智谱AI的ChatGLM的商用版本,像MiniMax的MiniMax-ABAB 5.5以及字节跳动的云雀模型等等。我们有很多客户基于方舟平台,在这些优质的商用模型上去开发自己的应用。 大模型,将在哪些方面帮助职场人? jvzquC41yy}/xxqegpmjpn3eqo5eqlx185<11:6742=5