国产ora来了这家初创公司是何来头澎湃号·媒体澎湃新闻

财联社及科创板日报旗下产品——未来已来,AI前沿,独家、深度、专业!

七火山CTO表示,Sora模型面世后,他与OpenAI的部分工程师在美国进行了会面交流;Sora最大的价值在于,OpenAI用它的尝试突破验证了一个技术路线的可行性,引领了整个业界的技术迭代;七火山背后的战略投资方,也在通过对外投资对自身进行在AI时代的重新定位。

作者 | 敖瑾

AI发展持续加速,Sora模型的出现正在引发文生视频领域的变革,各创业企业都在根据OpenAI发布的技术白皮书,重新调整自己的方向。

5日,文生视频创业公司——七火山发布了其结合Sora路线迭代的Etna文生视频模型,并在发布会现场对生成效果进行了展示。

公司CTO Jason Huang对《科创板日报》记者表示,借鉴Sora技术迭代开发的Etna模型,在性能上有显著提升,“视频时长延长至8-15秒,且每秒帧数高达60帧,保证了视频流畅性;语义理解能力强大,能够更准确地理解和转化文本信息为视频内容;视频清晰度高、图片细节丰富,提升了视频的视觉效果。”

Etna模型发布会现场生成效果展示

Jason Huang进一步对《科创板日报》记者表示,Sora的出现极大提升了文生视频模型的水平,“最大的价值在于,OpenAI用它的尝试突破验证了一个技术路线的可行性,引领了整个业界的技术迭代。它的方向可能不是唯一的,但至少Sora目前的效果完全证实了这个方向的可能性,大家短期内都会转向这个技术方向优化自身的产品。”

▌文生视频领域技术大转向

Jason Huang告诉记者,Sora模型面世后,他与OpenAI的部分工程师在美国进行了会面交流,“在他们授权可讲的范围内做了一些讨论,包括他们自己是怎么看待Sora这个模型的。”据悉,Sora模型的研发经历了近一年时间,过程中也经历了多个不同方向的探索,直到近期才取得了重要突破。

其进一步表示,Sora模型最大的突破在于,使用了DiT的技术框架。而在此之前,市面上的大多数文生视频创业企业,包括明星项目Runway、Pika等,都采用了扩散模型这一技术路线。

“扩散模型的技术路线我们研究了比较长的时间,包括分析了Pika在去年4月发布的产品,以及去年底Stable Diffusion发布的开源项目。事实上,扩散模型一直有一个瓶颈,即视频时长、连贯性很难得到提升,所以现在我们看到的绝大多数文生视频片段就只有3到4秒,分辨率也只能达到512x512,或者再往上一点点,但再往后就无法进一步扩大。”

算法也决定了用何种数据进行模型训练。“如果只使用扩散模型,训练过程就是把图像作为数据集进行训练,但视频到图像之间会有转化过程,在训练过程如何避免信息量的丢失,让模型能学习到数据本身是一个视频而不是单一图像,扩散模型实际上存在局限。”Jason Huang表示,彼时,由于上述两点在技术和方法上都未能取得了突破,业内很少有人敢于大量投入算力,“因为原来的方法是有明确的瓶颈限制的。”

而直到Sora模型的出现,其所采用的DiT的技术路线让上述两点存在已久的局限迎刃而解。“在语义理解上,Sora模型背后由ChatGPT提供强大的语言处理支持,大幅提升了语义理解能力;模型结构方面,它将传统的扩散模型与transformer模型相结合,形成一种既有效又先进的新模型架构;在训练数据方面,Sora采用视频数据而非静态图片作为训练材料,通过patches作为处理方法来优化训练效果。”

Jason Huang将Sora带给他和团队的启发形容为“醍醐灌顶”。他表示,在把七火山的模型从原来单一的扩散模型往与Transformer结合的方向转移后,仅仅两周时间,就看到了显著的成效。“比如我们现在做的视频已经能做到大概10到20秒,以及每秒帧数能达到60帧,这种参数水平放在现行文成视频同类产品中比较,已经可以排在前列了。”但其坦言,目前和Sora比仍存在很大差距,“Sora能做到60秒的时长,且达到4k甚至更高的分辨率,而且场景非常丰富。”

Etna模型生成的Sora同款视频效果

▌上市公司押宝的战略新路线

除了及时调整技术路线,目前,七火山也在紧锣密鼓推进产品的应用落地。Jason Huang对《科创板日报》记者表示,公司从创立开始就着眼于应用创新,“和大厂卷大模型能力不是我们的方向,我们从一开始就在研究,怎么把模型能力变成一个实际能落地的应用。”

据悉,目前,七火山通过Lava平台已与字节跳动、小米、快手建立合作关系,实现短剧内容的角色换脸、对白配音及字幕翻译,推动内容本地化和国际化发展;MiniTV作为分发平台,探索短剧海外发行的多元化模式;其Bromo工具则能够将低分辨率、简单风格的图片,转化为高达10K分辨率的高质量图像,展示了AI技术在艺术创作与表情包转换等方面的潜力。

Jason Huang进一步表示,尽管现阶段七火山以文生视频作为研究和推进的重点,但其将自身定位为一家AI多模态公司,“不局限在某一个应用,而是根据业界的最新进展,与自身业务进行有机结合,调整应用落地。”

《科创板日报》记者注意到,除了七火山本身作为一家刚成长不久的创业公司,在AI2.0极速发展的时期试图建立起自身的商业坐标外,其背后的战略投资方,亦通过对外投资等一系列方式对自身进行重新定位。

七火山目前获得了来自上市公司超讯通信的战略投资,后者由此成为持股30%的单一大股东。超讯通信子公司超讯智能CEO胡柏逸告诉记者,从去年初开始,超讯通信就开始在找AIGC垂类新锐企业进行布局,“当时看了不少公司,包括文生图到文生多模态,还有AI游戏等一系列公司都有接触,到今年确定了对七火山进行战略投资。”

公开资料显示,超讯通信成立于1998年,2016年7月在上交所挂牌上市,据其2022年年报,公司主要业务包括通信技术服务业务、物联网业务以及IDC业务三大板块。

而在5日的战略发布会上,超讯通信董事长梁建华公布了公司未来三年的战略规划,“我们的愿景是建立一个完整的AI生态系统,通过算力、数据与人工智能技术的有机结合,构建独特而强大的超讯通信生态。我们追求的不仅是硬件的积累,更注重软硬件技术的自主创新和安全高效的集成应用。这意味着,在算力领域,我们不满足于简单的购买或租赁服务器,而是致力于技术的深度加持和创新。”

其进一步表示,超讯通信在人工智能方面进行了全方位部署,“重点投资于灵犀妙笔AI等境内外先进技术,同时注重AI安全和装备的配套。”

Jason Huang则表示,与超讯通信的战略合作,未来会类似于当前国产大模型与互联网巨头之间的合作。“肯定不是直奔着超讯通信给我们的财务投资去的,而是双方在理念上达成一致。与此同时,当我们的模型取得突破进展后,并实现与具体的垂类行业应用的结合,就需要我们去进行upscale,即规模需要提升和扩大,这是超讯通信的算力、资金包括其他一些资源,就能助力七火山实现模型规模的快速扩大。”

THE END
0.差异分析+火山图+COX模型构建生存分析之Cox模型简述与参数求解 edgeR需要的数据是reads数,可以设置BCV值,做单样本的差异分析。 edgeR包可以做无重复的差异分析,不过需要认为指定一个dispersion值(设置BCV值),这样得到的结果比较主观,不同的人就可以有不同的结果。通常如果是实验控制的好的人类数据,那么选择BCV=0.4,比较好的模式生物选择BCV=0.1 jvzquC41yy}/lrfpuj{/exr1r1?egl7c7475em
1.联手火山引擎,华硕利用大模型和向量数据库推出AI功能笔记本火山引擎所提供的字节大模型拥有优秀的语言感知能力,能够高效完成各类语言任务,通过自然语言交互在对话互动、信息获取和创作辅助等多种应用中展现出极高效能。目前,字节大模型已广泛应用于字节跳动内部50余条业务线,覆盖20个以上细分行业,尤其在文本分类、总结摘要、信息抽取、角色扮演、文案创作等多个方面表现出优势。 jvzquC41pg}t0|npc0ipo7hp1u~04976/2;.394fgvgjn6npcwzgv{72;682;7xjvor
2.火山翻译年度盘点:年底每天“干活”1.38亿次发现频道日前火山翻译团队发布《请翻译2020》年度盘点,详解过去一年上线的火山翻译Studio、火山同传等新品,以及在训练机器翻译模型过程中遭遇的技术难点和解决方案。2020年最后三天,火山翻译的调用量达日均1.38亿次,日均翻译的字符数超百亿规模。如果把火山翻译每天翻译的字符打印在A4纸上,堆起来的纸张相当于1.3个东方明珠的高度jvzq<84f0{uvvq3ep1tfy}jej1814:541v814:5432e24@568:6/j}r
3.火山方舟大模型服务平台火山引擎官方文档中心,产品文档、快速入门、用户指南等内容,你关心的都在这里,包含火山引擎主要产品的使用手册、API或SDK手册、常见问题等必备资料,我们会不断优化,为用户带来更好的使用体验jvzquC41yy}/xxqegpmjpn3eqo5eqlx1:498;
4.大模型的航海时代,火山引擎拼命造船股票频道在火山引擎位于海淀区大钟寺广场的办公楼见到谭待时,王慧文撤离大模型赛道的消息尚未传出,否则又会为这场专访提供一份堪称变量的背景。 话虽如此,大模型依然是全球资本追逐的宠儿,AI概念股推动纳斯达克在2023年实现了29%的涨幅,中国的下场者也高密度的出现在各家大厂和各所高校的顶尖名册里,但在大规模应用的构想里,所有人都还在等待jvzquC41uvudm7mgzwt/exr14284/9
5.火山方舟来了!字节首次公布大模型进展,要做淘金路上的卖水者自大模型被视为增长新动力(310328),在红海厮杀的云厂商无不争先恐后想要抓住这一机会,尤其后来者,更需要一个急转超车的时机。 但火山仍然迈出了谨慎的一步。6月28日,字节跳动旗下火山引擎发布大模型服务平台“火山方舟”,面向企业提供模型精调、评测、推理等服务。目前,“火山方舟”集成了智谱AI、MiniMax、百川智能jvzquC41vgii0qjzwp4dqv44249.2?24;181;:547:?/j}rn
6.火山引擎发布“火山方舟”,加速大模型应用落地  6月28日,在火山引擎主办、英伟达合作举办的“V-Tech体验创新科技峰会”上,火山引擎发布大模型服务平台“火山方舟”,面向企业提供模型精调、评测、推理等全方位的平台服务(MaaS,即Model-as-a-Service)。目前,“火山方舟”集成了百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI(以拼音jvzq<84yyy4ykwmwcpku0lto1vkdj87245674A42g9=6e9h8g;g56jkcgeh34o5e;g<4;Ag1e0nuou
7.「分布式技术专题」三种常见的数据库查询引擎执行模型该计算模型将关系代数中每一种操作抽象为一个 Operator,将整个 SQL 构建成一个 Operator 树,查询树自顶向下的调用next()接口,数据则自底向上的被拉取处理。 火山模型的这种处理方式也称为拉取执行模型(Pull Based)。 大多数关系型数据库都是使用迭代模型的,如 SQLite、MongoDB、Impala、DB2、SQLServer、GreenplumjvzquC41dnuh0>6evq4dqv437363;<9148933?5
8.火山引擎发布“火山方舟”加速大模型应用落地6月28日,在火山引擎主办、英伟达合作举办的“V-Tech体验创新科技峰会”上,火山引擎发布大模型服务平台“火山方舟”,面向企业提供模型精调、评测、推理等全方位的平台服务(MaaS,即Model-as-a-Service)。目前,“火山方舟”集成了百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI(以拼音首字母jvzq<84hkpgoen3eg0io1qtog1ps|z4fe1814<5814>0v;5452<3:h8:82>74?3ujvsm
9.字节参战!火山引擎明确不做大模型但已服务国内七成大模型厂商【TechWeb】“火山引擎自己是不做大模型的,我们首先服务好国内做大模型的厂商,等他们把大模型做好之后,我们再一起合作开展对外的服务。”火山引擎总裁谭待向TechWeb等表示。 随着ChatGPT的爆火,国内人工智能领域也风起云涌,互联网科技公司纷纷开启大模型军备竞赛。百度、阿里、360等大厂,以及MiniMax、智谱AI等创业公司jvzquC41pg}t0qjzwp4dqv44249.2=23;181:<9463>/j}rn
10.字节发布火山方舟:让大模型服务与应用像打车一样简单火山方舟平台的合作伙伴包括百川智能、出门问问、复旦大学 MOSS、IDEA 研究院、澜舟科技、MiniMax、智谱 AI等多家 AI 科技公司及科研院所。用户可以根据自己的需求,浏览和搜索不同类型和领域的模型,并查看模型的详细介绍和评价,也可以通过火山方舟平台,与服务商进行沟通和协商,定制专属于自己的模型服务方案。jvzquC41yy}/frfpmgpj0lto1pkxu8;5839/j}rn
11.让大模型信得过、用得起,火山方舟开辟了新玩法作为近年来发展速度最快的互联网厂商之一,字节旗下火山引擎虽然看似低调,不过凭借抖音等业务IT资源和基础架构的规模优势,已悄然将业务拓展至外部客户。在大模型领域,与大多数互联网厂商不同,火山引擎采取了“淘金卖水”的商业策略,类似于京东、天猫模式,不仅汇集了一批来自AI创新公司和科研院所的优秀模型,还提供充沛算jvzquC41o0gdh~s0ep5w1Hfe?6786?722(zzrnBctvodnn
12.火山“所想即所⻅,七⽕⼭⽂⽣视频Etna模型发布”,超讯摘要: 超讯通信 X七火山“所想即所⻅,七⽕⼭⽂⽣视频Etna模型发布”,超讯公布未来三年计划,国产Sora 发布会秒杀众多模型,行业大佬齐聚一堂,共议AI发展蓝图。看点: 1. 七火山文生视频模型Etna可稳定生成8-15秒的视频,背后是积累与沉淀。 2. 超讯通信 未来jvzquC41zwkrk~3eqo5659662;=2:87:2;625?7
13.集贤科技:联合博通集成及火山引擎大模型能力打造具备自然交互与集贤科技:联合博通集成及火山引擎大模型能力 打造具备自然交互与教育功能的下一代AI玩具Video Player is loading.00:00/00:00 Loaded: 0% 视频加载失败,请查看其他精彩视频 相关视频 猜你喜欢 00:03:34 法国人脸都绿了!毛子那个外交女发 00:01:05 广交会韩端科技展示开源鸿蒙版人形 00:01:08 中方jvzquC41xkjfq7xkpc4dqv3ep1v0hrscpek04977/29.3A4fgvgjn6npgr€uhy=;27;6:7i0jvsm
14.豆包图像编辑模型3.0上线火山方舟豆包图像编辑模型3.0上线火山方舟发现更多热门视频 天才就是天才 亚马尔中路油炸丸子强突+接费尔明脚后跟妙传抢射破门 不会杀球的张某人2万次播放 张颂文谈辛芷蕾演技变化,赞其演绎人物挣扎如动物嘶吼 电影拆台君3561次播放 太子破僵!福登禁区弧顶贴地斩破门,随后与场边球迷自拍庆祝 不会杀球的张某人9058次播放 勒布jvzquC41xkjfq7xkpc4dp8kkpctdg872473196821fkucrq/kpljht{g92619<80f0nuou