英特尔至强加持下的火山引擎,要降低大模型的应用门槛

在大模型继续上新的这个年底,12月18日,字节跳动火山引擎的豆包系列大模型也迎来了再次更新,一口气上新了15款大模型产品。

这其中,尤以豆包视觉理解模型最为亮眼,不仅拥有内容识别、理解推理、视觉描述等能力,还将价格再次打到了每千tokens 0.003元。

视觉大模型由此也或将迎来又一次大范围的普及应用。

就接下来的大模型产业落地来看,模型推理正在被提升到一个新高度,这对异构算力提出了更高要求。

在豆包系列大模型冬季发布会上,火山引擎联合英特尔展示了双方的合作成果,我们看到了基于AI PC的“扣子”,看到了企业级的AI方案。

我们也看到了,火山引擎联合英特尔对外发布了基于英特尔至强6性能核处理器的火山引擎第四代通用计算型实例g4il。

在英特尔至强6性能核处理器加持下,火山引擎的g4il云实例,也将再次降低大模型的应用门槛,为AI时代下的云服务提供了一个新选择。

01 火山引擎g4il实例,要降低大模型使用门槛

中国信通院《2024全球数字经济白皮书》统计数据显示,截至今年一季度,全球人工智能核心企业约有3万家,全球AI独角兽达到了234家,其中,中国则涌现出了71家AI独角兽企业。

就大模型而言,全球人工智能大模型数量为1328个,中国占比高达36%。

作为国内大模型领域的核心玩家,字节跳动先是在2023年8月上线了云雀大模型,后又在2024年5月正式推出了多模态大模型豆包,而如今的豆包已经成了日均调用量高达4万亿次的主流模型。

大模型的发展,进一步催生了对算力的高需求,尤其是在当下大模型进入产业落地阶段时,对于高性能异构算力也提出了更高的需求。

英特尔公司市场营销集团副总裁、中国区云与行业解决方案和数据中心销售部总经理梁雅莉指出,“英特尔至强6处理器正是为了适配数据中心异构多元算力需求而生。”

在大模型进入到应用落地阶段后,越来越多企业有了尝鲜大模型的想法和需求,为了满足这样的大模型测试、预研和轻量级大模型应用开发需求,火山引擎的g4il实例应运而生。

g4il实际上已经是火山引擎第四代通用计算型实例。

据火山引擎计算产品负责人王睿介绍,“g4il搭载了最新的英特尔至强6性能核处理器和火山引擎自研的DPU,实现了计算、存储和网络性能的全面升级,相比上一代产品,g4il在视频转码、Web应用、和数据库应用方面分别实现了17%、19%和20%的性能提升。”

此外,g4il还在以下几个方面得到了进一步提升:

首先,得益于英特尔至强6性能核处理器在CPU核数上的突破,g4il的单机CPU核密度相比上一代产品有了翻倍的提升,在算力的性价比上也有了很大的提升;

其次,通过采用火山引擎双单路创新服务器架构,g4il再次降低了整体的爆炸半径,有力地保障了产品稳定性;

第三,通过新增大包传输能力(Jumbo Frame)、机密计算能力(TDX),以及支撑最新云盘吞吐类型SSD,火山引擎进一步丰富了g4il实例的功能。

王睿指出,“英特尔在英特尔至强6性能核处理器上引入了MRDIMM技术,并新增支持AMX FP16指令集,更大的内存带宽和更强的矩阵运算能力,为AI推理加速提供了更优的底层基础环境。”

火山引擎的实测数据显示,相较于英特尔EMR CPU+DDR5内存,基于英特尔至强6性能核的g4il吞吐性能最高提升了80%,相较于单卡的A10和L20 GPU也有不小的优势。

在火山引擎FORCE原动力大会现场,我们在英特尔展区也看到了基于g4il实例的文生文的大模型演示,在现场演示过程中,当向PC上的大模型提问“什么是AMX时”,它可以在用户界面流畅地生成对应的答案。

据现场工作人员介绍,“这其实是在g4il实例上基于16个虚拟CPU核做7B模型的推理效果,这样的配置已经基本可以满足用户量较小、请求并发度较低的使用场景。”

在大模型成为全球焦点时,GPU开始被视为大模型的标配产品,实际上,作为通用算力的CPU依然可以满足不少大模型使用场景的需求。

据现场工作人员介绍,“基于g4il实例,企业用户只需要16个虚拟CPU核就可以做7B左右模型的推理验证工作,而当企业最终将这样的产品转化为真实落地产品时,可以再基于这一模型最终的用户数、并发量选配更高配的硬件规格,由此就可以降低用户使用门槛。”

对于一个百人规模的中小型公司,当需要在公司内部自研一个知识库问答系统时,甚至完全可以基于CPU、在g4il实例上来实现,这也将极大降低企业的大模型使用门槛。

而在生成式AI成为云时代标配,越来越多企业结合内部数据尝试使用大模型时,数据安全性也变得越来越重要。

对此,作为算力供应商的英特尔和火山引擎也深有体会。

02 如何消除大模型的数据安全隐忧?

2024年6月,在今年的WWDC2024上,苹果终于发布了他们的Apple Intelligence,高度重视隐私安全的苹果在WWDC2024上多次强调了用户隐私安全的重要性,并采用端云结合模式打造了Apple Intelligence。

数据安全问题并非只是大模型遇到的问题,相应的隐私计算技术也已经在近些年逐渐成熟。

如今成熟的隐私计算技术大致可以分为两个流派:

第一个流派是基于密码学的同态加密、多方安全计算、差分隐私、零知识证明等技术,这些技术完全依赖密码学方式实现数据可用不可见的保护。

不过,基于密码学的技术如今存在一个普遍问题,那就是会为企业带来较高的计算和通讯开销。

第二个流派是基于硬件、芯片构建数据安全处理的可信执行环境,此类技术又被称为机密计算。

据英特尔技术专家介绍,“机密计算得益于更低的损耗、更高的性能,更符合如今云计算时代的部署要求,正在成为云计算中构建数据可用而不可见的保护策略的主流技术方式。”

2019年,Linux基金会成立了机密计算联盟,该联盟的目标旨在定义机密计算标准,支持和推广开源机密计算工具和框架的开发,联盟创始成员包括英特尔、AMD、Arm、谷歌、红帽、阿里、华为、腾讯等来自全球的科技公司。

面对当下数据应用环境,机密计算主要致力于解决三大问题:

第一,数据机密性,确保用户数据在处理和使用过程中不外泄;

第二,数据完整性,确保待处理数据安全可靠、未发生篡改,确保计算结果的安全性和可信性;

第三,代码完整性,确保用户数据的程序代码安全可靠,未被植入恶意代码。

作为机密计算的创始成员之一,英特尔在机密计算领域一直都在进行着技术研发,并在将这些技术应用到至强处理器中。

英特尔最早是在第三代英特尔至强可扩展处理器中应用了SGX技术,后又在第四代和第五代英特尔至强可扩展处理器中应用了TDX技术。

英特尔技术专家指出,“TDX技术构建的可信执行环境可以承载完整的用户虚拟化实例,只要用户的程序能跑在虚拟化环境里,都可以直接迁移到机密计算解决方案。”

而随着机器学习、大模型应用等高算力场景的不断涌现,用户数据有了在通用处理器和异构加速器之间进行协同计算的需求,英特尔又进一步推出了TDX Connect技术,这项技术可以使用户数据在异构加速场景中的计算得到机密性保护。

以大模型核心应用场景之一RAG为例。

RAG是检索增强生成模型,本质上是基于知识库、数据库的内容检索,大模型在生成内容时,参照数据库有针对性地增强生成结果,从而提升生成结果质量和准确性。

在这一应用场景中,由于行业知识库或企业知识库一定含有企业敏感信息,例如行业流程、企业流程,乃至技术文档。

用户在部署RAG服务时,对其是否会被窃取会存有疑虑,基于英特尔TDX构建的机密虚拟化实例,无论是RAG应用中的信息提取、数据库应用,还是模型生成流程,都可以在不改变应用程序中间框架前提下直接访问机密虚拟机,从而实现在云中隔离和保护用户在使用RAG部署过程中的数据安全。

实际上,火山引擎最近就基于英特尔TDX技术,推出了g3ilt TDX机密计算实例,这一云实例可以为云上AI场景构建端到端的机密计算方案。

我们在大会现场,也看到了g3ilt TDX机密计算实例的现场展示。

当然,基于英特尔至强6性能核处理器的火山引擎第四代通用计算型实例g4il同样支持TDX机密虚拟机,与此同时,针对云上AI场景,火山引擎打造了端到端安全解决方案。

王睿在大会上介绍称,“基于CPU和GPU硬件机密计算能力,火山引擎在固件、内核、虚拟化以及操作系统等方面做了深度调优,在机密计算云服务器上,火山引擎提供了机密容器、密钥管理、基线管理、远程证明和安全RAG等丰富的安全能力和服务,为AI应用当中的训练推理,前后端数据处理全场景提供安全保障。”

过去十年,终端厂商比拼的是“性能”和“参数”,如今,竞争的焦点正转向“智能程度”。

我们如何从云时代过渡到AI时代?

Fractal AI Research实验室开发了Fathom-DeepResearch智能搜索系统,该系统由两个4B参数模型组成,能够进行20多轮深度网络搜索并生成结构化报告。研究团队创新了DUETQA数据集、RAPO训练方法和认知行为奖励机制,解决了AI搜索中的浅层化、重复性和缺乏综合能力等问题,在多项基准测试中显著超越现有开源系统,为AI助手向专业研究工具转变奠定了基础。

快手科技与清华大学合作发现当前AI语言模型训练中存在严重的权重分配不平衡问题,提出了非对称重要性采样策略优化(ASPO)方法。该方法通过翻转正面样本的重要性权重,让模型把更多注意力放在需要改进的部分而非已经表现良好的部分,显著提升了数学推理和编程任务的性能,并改善了训练稳定性。

THE END
0.一文读懂火山引擎云数据库产品及选型数据库nosql关系型数据库火山引擎数据库传输服务 DTS(Database Transmission Service)提供了数据迁移、数据同步、数据订阅于一体的数据库数据传输管理服务,支持关系型数据库、非关系型数据库数据源间的数据传输,降低数据库之间数据流通复杂性,可在业务不停服的前提下轻松完成数据库迁移上云。相较于第三方迁移工具,数据库传输服务 DTS 可以更方便jvzquC41pg}t0|npc0ipo7hp1u~04974/38.2>4fgvgjn6nossynty=86:71:7xjvor
1.火山引擎产品介绍思维导图模板火山引擎是字节跳动旗下的企业级技术服务平台,提供各种云计算、大数据和人工智能技术服务。产品涵盖内容管理、数据智能、人工智能和云基础架构等多个领域,包括不限于智能推荐、机器翻译、智能客服、语音识别、视觉识别等技术。火山引擎旨在帮助客户降低技术开发和业务运营的成本,提高工作效率和创新能力。火山引擎的产品和jvzquC41yy}/r{teguypp7hqo1|jg€488e:9::i8c6ie5@;ddf;76?:
2.对话火山引擎谭待:大模型的下一个战场在哪?亿邦数字化频道赵何娟:现在国内的做大模型的企业和团队非常多,包括像月暗、智谱、百川,在国内来说相对来说有一些知名度的大模型,基本上还是在火山引擎上跑。作为一个行业底层服务的提供商来说,你会觉得国内现在的“百模大战”“千模大战”优势在哪里?或者有一些什么问题? jvzquC41yy}/gkwwp0ipo8724667494p/3=79>3jvor
3.火山引擎代理火山云代理商抖音云火山引擎是字节跳动旗下的云服务平台,将字节跳动快速发展过程中积累的增长方法、技术能力和应用工具开放给外部企业,提供云基础、视频与内容分发、数智平台VeDI、人工智能、开发与运维等服务,帮助企业在数字化升级中实现持续增长。jvzquC41yy}/w{q;0et0
4.字节收购蓝色光标??重视火山方舟、豆包、扣子智能体核心合作伙伴!!蓝色光标宣布与火山引擎达成深度合作,双方将基于火山方舟、豆包·视频生成模型、扣子专业版智能体开发平台,在视频生成、视频服务解决方案以及营销行业智能体应用等领域展开深入合作,共同推动AI与营销体系的深度整合、加速营销行业AI化进程。 豆包·视频生成模型具备精准的语义理解、强大的动态表现与多样化运镜、一致性多镜头jvzquC41yy}/lrz{cpmpppxjg0ipo8f1f4jxmzx3o6Elg‚|qtfC&GA*;5'?E'N=':;+C4.J7':;&:B*G8'G1'A<
5.火山引擎火山引擎是字节跳动旗下的云与AI服务平台。在AI时代,聚焦豆包大模型和AI云原生技术,为企业提供从 Agent 开发到部署的一站式服务,助力企业AI转型与创新发展。jvzquC41yy}/xxqegpmjpn3eqo5
6.发布两个“王炸”模型!火山引擎出大招,翻译和设计师要慌了想知道火山引擎要折腾些什么新东西吗?跟着我走就对了。 大约一个月前,我到上海参加了 "2025 火山引擎春季 FORCE 原动力大会 "。 作为半年一次的大会,火山引擎那次确实带来了很多值得关注的更新,除了豆包大模型 1.6 的正式发布、豆包大模型家族的全面焕新,还有颇受关注的扣子和 TRAE 的新消息,颇有种想把其他同类jvzq<84yyy4{ctjt0et0pn|u1cxuklqgapkx0ymrArq>8A=c3:6::n>h2;;1fl9hhhj4
7.携手火山引擎,海创汇加速“专精特新”企业数智化转型山东站而且,火山引擎在人工智能领域有着丰富的产品布局,例如豆包大模型(自研大模型)、火山方舟(一站式大模型服务平台)、AI应用开发平台(扣子专业版|Hi Agent),在与行业外部企业深度共创中,适配多种业务场景,激发企业增长潜能。 海创汇是海尔集团面向全球创业者打造的创业加速服务平台,也是工信部认定的首批支持国家级专精特新“小巨 jvzquC41uf4djrsc0eun1uzsk181295;5:532;:234704>>6:9>40qyon
8.通过搭建质量体验体系火山引擎视频云打造面向体验的产品矩阵2月25日,火山引擎视频云科技原力峰会顺利召开。 火山引擎视频云是如何发展起来的?火山引擎要做什么样的视频云?未来视频云又会是什么样的?火山引擎视频云技术负责人浩铭在以《面向体验,助推超视频时代新增长》为主题的演讲中,分享了对视频体验、交互、增长的观察与思考,并介绍了火山引擎视频云的从前、现在,以及未来的jvzquC41pg}t0v~ftk|ft|3eqo521A6:1:798990jvs
9.谢皓:AIAgent在边缘云的探索与实践边缘计算4.智能体在火山引擎边缘云的实践 接下来讲讲智能体在边缘云的实践。 4.1 协同扣子实现工厂自动巡检 第一个案例是跟扣子协作,实现了工厂的自动巡检。扣子是开发新一代 AI 智能体的应用开发平台,有一系列灵活好用的组件和工具,我们联动扣子通过定制插件和工作量让智能体具备了感知,操作设备的能力,实现了工厂的自动巡jvzquC41zkk/kwkqs0io1jwvkerf1@97fe73g
10.音视频费用扣子火山引擎官方文档中心,产品文档、快速入门、用户指南等内容,你关心的都在这里,包含火山引擎主要产品的使用手册、API或SDK手册、常见问题等必备资料,我们会不断优化,为用户带来更好的使用体验jvzquC41yy}/xxqegpmjpn3eqo5eqlx1:6:6:867:7718Hwgfkxfe}B3
11.抖音是由什么引擎提供数据|帆软数字化转型知识库火山引擎的强大之处在于其人工智能和推荐算法。字节跳动通过深度学习、机器学习等技术,对用户行为数据进行建模和分析,从而实现精准的内容推荐。推荐算法是火山引擎的核心,它通过分析用户的历史行为、兴趣爱好、社交关系等多个维度,生成个性化的推荐结果。推荐算法还会不断进行自我优化,通过A/B测试和在线学习,不断提升推荐效jvzquC41yy}/hjstwct/exr1dnuh1jwvkerf1?833690
12.【信达计算机|豆包大模型行业深度】AI投入持续加大,C端、B端两手齐抓字节跳动推出的新一代AI agent开发平台扣子,允许用户快速搭建基于大模型的各种智能体bot,并发布到各个社交平台、通讯软件或部署到网站等其他渠道。目前,扣子专业版集成了1万+插件,可以调用国内流行的大语言模型如豆包、通义千问等。2024年12月18日,在火山引擎FORCE原动力大会上,正式发布了扣子1.5版本。扣子1.5集成了jvzq<84hkpgoen3ukpg/exr0ep5squq14286/98/275eql2kpgtrcw}435<2993ujvsm
13.扣子不甘于人后,搭建自己的企业机器人火山引擎扣子扣子(coze.cn)是新一代 AI 应用开发平台。无论你是否有编程基础,都可以在扣子上快速搭建基于大模型的各类 Bot,并将 Bot 发布到各个社交平台、通讯软件或部署到网站等其他渠道。 火山引擎面向企业和个人用户推出企业级的 AI 应用开发平台,即扣子专业版。扣子专业版在扣子基础版可视化灵活编排 Bot 的能力基础上,承诺jvzquC41dnuh0lxfp0tfv8}w{{687>4ctvodnn4fgvgjn|4362<699;4
14.豆包大模型定价开启“厘时代”火山引擎助推金融行业加速升级5月15日,在火山引擎原动力发布会上,字节跳动豆包大模型家族、火山方舟2.0、AI应用及AI云基础设施等一系列最新产品正式发布。 火山引擎是字节跳动旗下云服务平台,据火山引擎总裁谭待介绍,经过一年时间的迭代和市场验证,字节跳动自研的豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一,目前日均处理1200亿TokejvzquC41ycv/gjxvoqtf{7hqo1g04976278159=38;?:4>3jvor