模型:变形的拉链,能测出机器人的“智商”——自变量王潜:改造“精密的废物”,须从“头”开始算法模态复杂度神经网络深度思考模型

新华社北京9月15日电 9月15日,《新华每日电讯》发表题为《模型:变形的拉链,能测出机器人的“智商”——自变量王潜:改造“精密的废物”,须从“头”开始》的报道。

2025世界机器人大会上,自变量机器人公司的轮式双臂机器人“小量”用一双巧手灵活制作香囊,“量子2号”仿人形机器人以7自由度手臂设计实现捏薯片不碎、360°清洁等高难度操作。支撑其复杂灵巧操作的是自变量自研的机器人“大脑”——通用具身大模型WALL-A。“一脑多用”的端到端技术,使机器人实现零样本泛化能力。

什么样的机器人,才不被称作“精密的废物”?

蹒跚学步至今,人形机器人正在取得肉眼可见的进步。然而,真正制约它走进工厂、融入家庭的并非四肢,而是能深刻理解物理世界、自主决策的“更强大脑”。没有大脑驱动的机器人,就好比失去灵魂的一块铁木,只能演示、无法实干。

超越“花拳绣腿”,机器人的再进化也许真的要从“头”开始。

记者:过去一年,人形机器人有了怎样的进化?

王潜:去年夏天,还有很多人形机器人“动弹不了”,到今年,多款机器人已能走路、跑步乃至打拳、踢球,并逐步开始像人一样在广泛、复杂、真实的世界中自主移动、感知、理解、决策并灵巧地操作物体,以完成多样化的任务。驱动这些进化的,是算法的进一步成熟和收敛。

记者:机器人的大脑虽然一直在进化,但技术路线还未“大一统”——有的用的是专用模型,有的用的是通用模型;有的采用分层模型,有的用上了端到端模型。哪种模型将是机器人大脑的“终局”?

王潜:提到大模型,普遍认知中的还是大语言模型、多模态模型,或者视觉语言大模型(VLM)+动作模块。还有一种误解,认为具身智能的基础模型是这些模型的延伸。

事实上,这些模型都属于虚拟世界的基础模型,并不是真正作用于物理世界的基础模型。由于机器人涉及真实世界极为复杂的物理交互,处理的问题与虚拟的数字世界所要解决的问题截然不同,所以机器人真正需要的是物理世界中一个全新的基础模型。

如果对物理世界的某个局部做一个三维重建,看上去或许已达到1:1复刻,但只要有一点点小毛刺那样的瑕疵,在现实中都会造成操作上更大更棘手的问题,也就是说0.1%的谬误也可能会带来10%-20%的差池。

物理世界最核心的难点,是存在大量随机的不可预测事件。哪怕只是一个用手推门的动作,也会因手的接触点位置、接触时长、力的方向和大小、动摩擦因数等参数的差异,产生非常多的随机可能。

记者:可以说,现阶段机器人的泛化能力普遍还不强,比如刚在跑道上学习过跑步,换成草地就跑不起来了。而机器人能够进厂入户干活的前提是具备举一反三的能力,那么,如何能让机器人灵活应对复杂随机甚至是陌生的环境?

王潜:传统的解题思路类似于“搭积木”:视觉识别、推理规划、动作生成各用一个模型,然后层层叠起……看似功能齐全,但信息传递时就像一排人在玩“传话游戏”,不仅效率低下,而且前一层产生的微小差错容易在后续环节积累巨大误差,无法实现深层跨模态理解。

理想的“大脑”,比如人脑,能够让看见、思考、行动一气呵成。因此真正的具身智能模型,应当由一个模型覆盖从信号输入到动作输出的完整过程。处理长序列任务时,机器人无需划分从看到想再到动的界限,而通过一个统一的神经网络,边想边做,还能像人一样举一反三,遇到没见过的情境也能灵活应对。

自变量是用一个通用具身智能模型来解决物理世界的复杂问题。具体来说,是把世界模型和端到端的通用模型放进同一个模型,也就是把视觉、语言、触觉、动作等所有模态信息塞进一个架构里统一处理。这就区别于直接把自动驾驶的模型迁移过来,或给虚拟世界的视觉语言模型加上运动模块的方式。

记者:装上这样的大脑后,机器人能够解决哪些以分层模型或专用模型作为大脑的机器人解决不了的问题?

王潜:比如机器人要完成穿衣服这一指令,如果遇到衣服突然掉落、拉链变形这样的动态变化或陌生状况,传统分层模型需要重新编程,而自变量的端到端模型只需少量样本即可迁移学习。端到端模型能通过“实时感知决策闭环”马上调整策略,而分层系统容易因模块间延迟出现“手足无措”。

再比如,我们让装载端到端模型的机器人“小量”削苹果,它会去厨房岛台寻找水果刀,我们又告诉它这是一个有小孩的家庭,然后看到它从更高处的抽屉开始找起——它在行动前进行了逻辑推理:为防止水果刀被小孩翻到并使其受伤,水果刀会被放进更高的抽屉。

装上通用大脑的机器人,还能拾取地面上的废纸、饮料瓶、塑料袋等各种形状不规则的垃圾,把沙发上随意堆叠的多件衣物放进脏衣篓。

记者:区分一个机器人大脑的强弱,与评价一个人智商的方法和维度相似吗?

王潜:机器人大脑的强弱即模型的优劣,更出色的模型具备更强的泛化能力、推理能力,能处理更复杂的问题。就泛化能力来说,从易到难可分为光照位置的泛化、环境背景的泛化、操作对象的泛化、操作任务的泛化。就任务复杂度来说,又分为操作动作的复杂度、推理及状态估计的复杂度、被操作物体的复杂度等不同维度。

记者:训练一个这样的大脑,关键在于算法还是数据?

王潜:在大约10年前的AI1.0时代,大家认为做AI就是做算法。如今,决定性因素从算法变成了数据。具身智能发展到深水区,核心竞争力就在于数据。

从成本和效率的角度考虑,目前自变量是以真实数据为主、互联网数据为辅。自变量构建了全球最大的具身智能数据集,涵盖数万小时的机器人操作视频、触觉反馈、空间定位等多模态数据。为加快数据积累,自变量自研了物理准确性最高的视频生成大模型来做数据增强,通过切换背景、环境、接触物理过程等途径,将一条真实数据扩展为成百上千的数据,用来快速提升模型的泛化性。我认为数据质量的重要程度高于数据数量,而提升数据质量的一大途径在于扩大数据的多元性。

记者:机器人是软硬件结合的工程。现在是“强本体—弱大脑”的阶段,还是“强大脑—弱本体”的阶段?

王潜:具身智能是显著的“软件定义硬件”的领域,硬件需按照机器人大脑的进化去定义、去适配。

记者:有人调侃:除了跳舞、翻跟头,人形机器人还能干什么?在跑步、跳舞、踢球、格斗中习得的能力,与机器人实际落地所需的能力,有多大的匹配度?

王潜:匹配度不大。通用的机器人能力分为运动、导航、交互、操作四个维度,操作是关系到机器人进厂入户的最关键能力。这也是为什么自动驾驶的模型无法直接迁移到机器人身上,因为自动驾驶的能力难点集中在导航与运动上,而机器人的最大难点在于复杂操作。

但换个视角来看,人形机器人公司要发展,首先要活下来。如果机器人短期内还无法进化为实实在在的生产力,那么训练一些娱乐能力、体育能力,也能给用户提供情绪价值。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

THE END
0.实时数仓模型所以类似订单数的维度,我们会在 DW 层建立一些衍生维度的计算模型,然后这些计算模型输出的其实也是拉链表,记录下一个用户每天这种新老客的变化程度,或者可能是一个优质用户的变化的过程。由于建立拉链表本身也要关联维度,所以可以通过之前分组 key 的方式来保障不乱序,这样还是将其当做一个不变的维度来进行关联。 jvzquC41yy}/lrfpuj{/exr1r1=g:?g2;;>3e=
1.拉链表一般天粒度的拉链表已经能解决大部分的问题了,即拉链表每天只去一个状态,也就是说如果一天状态变更了3次,只取最后一个状态。 如果拉链表中存储最明细的变更记录,拉链表将退化为流水表。 模型结构设计 每天记录需要新增3个字段,用于标注记录的有效状态: start_date:表示该条记录的生命周期开始日期 end_date:表示该jvzquC41yy}/lrfpuj{/exr1r1;8f9k;3;:cfB
2.小型猪腹壁拉链模型的建立摘要:目的 建立小型猪腹壁拉链模型并对其生物学特性进行研究,为教学和科研工作的开展提供便利的研究工具.方法 通过外科手术的方法将定制的生物拉链固定于小型猪体表,建立小型猪腹壁拉链模型,观察小型猪的体征和精神状态,利用全自动血液分析仪及尿液分析仪对其血液和尿液生化指标进行动态检测.结果 模型建立后7~49 d小型jvzquC41f0}bpofpifguc7hqo0io1yjtkqjjejq1|iyzf€}||4623:7237
3.拉链贴图设计图其他模型3D设计设计图库拉链贴图图片,拉链贴图模板下载,拉链贴图 ZBRUSH 表面 凹凸 3DMAX,拉链贴图设计素材,昵图网:图片共享和图片交易中心jvzquC41yy}/pruke0ipo8xjqy545<>5557/j}rn
4.卡通狗头棕白配色提手拉链SU模型下载渲染器:VraySkimp专业减面插件 可快速导入并优化高保真模型 v1.1.7 Profile Builder轮廓放样3 基于剖面构造轮廓的设计软件 v3.3.3 JointPushPull Interactive联合推拉 用于建筑建模的互动插件 v3.5a 声明:模板内容仅供参考,3d溜溜网是正版模型库,所有素材模型作品(含预览图)均受著作权法保护,著作权及相关权 jvzquC41uw44f?;0eqs0utjvej{qa{jncvopp8=Ft\jZ0qyon
5.卡通狗头棕白配色提手拉链SU模型下载渲染器:Vray3d溜溜网(3d66)为您提供卡通狗头棕白配色提手拉链SU模型下载,模型版本:SketchUp 8.0,渲染器:Vray,有无贴图:有贴图,有无灯光:无灯光,压缩包大小:3.62MB,每个SU模手工减面,高速打开SU模型,含贴图材质,渲染即用。jvzquC41o09e8?3eqo5tmnyejwv`tnqcvkuo1AIt\f_/j}rn
6.数据仓库拉链表怎么做|帆软数字化转型知识库在数据仓库中,创建拉链表的关键步骤包括:确定数据模型、设计表结构、定义版本字段、编写ETL程序、进行数据加载和管理数据历史。其中,定义版本字段至关重要,因为它直接关系到如何有效地追踪数据的变化历史。通过增加有效起始日期和结束日期字段,可以精准地记录每一条数据的生命周期。这种方式不仅能够反映数据的当前状态,还可jvzquC41yy}/hjstwct/exr1dnuh1jwvkerf1<6;;8<0
7.综述:RNA的起源:双链核酸(ds拉链模型显示,最简单的寡聚单元是具有未配对自由末端的双链 RNA(茎),可通过磷酸桥连接形成茎环结构,即原始发夹基序(Original Hairpin Motif,OHM)。利用合适的 D - 核糖核苷二聚体和匹配序列,两条单链有望形成完全配对的 RNA 双链体。 十三、RNA 的前生物复制jvzquC41yy}/gknqvtgeg7hqo1tfy|k14286/;4424;14;=394;629;40jzn
8.数据仓库前置知识技术缓冲层(ITL),贴源抽取,只增加需要的技术字段(ETL date),其他字段保持与源系统一致,该层数据用于给贴源模型层供数,增加缓冲层的目的是为了实现贴源模型层数据处理缓冲,避免计算过程积压在ETL过程。 file 如上图,如果没有增加缓冲层,贴源模型层如果做拉链表,那么就只能在ETL阶段实现,这样对ETL步骤压力较大,因jvzquC41yy}/lrfpuj{/exr1r1j3glfh:fi3h;
9.带拉链封口的3D白帽模型.生殖库存例证.插画包括有构成,概念插画 关于 背景中凸出的拉链封口前后视运动衫3d渲染白帽模型. 时装男装模板,设计演示版. 无人体的套气. 插画 包括有 构成, 概念性, 复杂 - 321458158jvzquC41ep4etnfouvong7hqo1j.f6nocik44:97:3;9
10.系列|数仓实践之『拉链表』拉链表是一种数据模型,主要是针对数据仓拉链表是一种数据模型,主要是针对数据仓库设计中表存储数据的方式而定义的;顾名思义,所谓拉链表,就是记录历史,记录一个事务从开始一直到当前状态的所有变化的信息。 拉链表可以避免按每一天存储所有记录造成的海量存储问题,同时也是处理缓慢变化数据(SCD2)的一种常见方式。 jvzquC41zwkrk~3eqo56;B=329>6;86592769@<
11.3DMax怎么制作拉链常见问题解答3D模型 SU模型 灵感· 案例 贴图材质 CAD VR全景 AI绘画 更多 溜溜问答 > 模型制作 > 3DMax怎么制作拉链 3DMax怎么制作拉链浏览量:5953DMax制作拉链 3DMax拉链制作 3DMax拉链制作模型 3DMax教程制作拉链 3DMax拉链制作教程 3DMax 拉链 拉链3DMax 3DMax拉链 jvzquC41yy}/5m;80eun1jsuygxta{jncvopp8wgnczjqwd4237787mvon
12.见所未见的72张照片,让你大开眼界像心脏模型的冰冻石头 像PS在水上的拉链船 只有一根手指长度的侏儒猴 真实的“胖成球” 旧金山的雾浪 扇贝也是有眼睛的 抹香鲸睡觉时像“巨石阵” 鲸鱼的心脏 幼年时期的箭鱼 火箭发射的一瞬间 造型奇特的冰山 口罩的妙用 战斗机在突破音障的瞬间 反射照片 两辆破旧的道奇汽车 淡水鳗鱼 鳄龟 太空中看到的北极光 jvzquC41yy}/5?5fqe4dp8ftvkimg86836?14Bd335:39=7320nuou
13.zippermodel是什么意思zippermodel的用法翻译读音英汉 汉语 更多 zipper model英 美 释义 更多 拉链模型 以上内容独家创作,受著作权保护,侵权必究 海词词典,十七年品牌把海词放在桌面上,查词最方便 触屏版| 电脑版 ©2003 - 2025 海词词典(Dict.cn)立即下载 立即下载 jvzq<845i0jje}3ep1y/rquAs?€jryjt'46nqmjn
14.拉链表PeterZhaoChina拉链表 在数据仓库的数据模型设计过程中,经常会遇到这样的需求: 数据量比较大; 表中的部分字段会被update,如用户的地址,产品的描述信息,订单的状态等等; 需要查看某一个时间点或者时间段的历史快照信息,比如,查看某一个订单在历史某一个时间点的状态,jvzquC41yy}/ewgnqiy/exr1rgzftƒmc1r57:>84594ivvq
15.数据仓库知识点总结(数仓分层建模维度建模等)​ 主要是模型方面的建设,同一个用户,在同一个模型中,可能存在重复的记录,如何识别两个ID是同一个用户,做到所有用户只有唯一的ID标识。 4.2 缓慢变化维与拉链表 说到缓慢变化维,就需要说明一下什么是维度。维度与事实是在Kimball《维度建模权威指南》里定义的,维度指的是上下文,而事实指的是度量。请见下图: jvzquC41dnuh0lxfp0tfv8qgcggtqw4ctvodnn4fgvgjn|4342=49B<9
16.拉链的组成结构,选购和测试指标(5)中芯线(filler cord)由多股纤维线加工而成,用于尼龙拉链牙链生产的绳状物。 (6)牙链(chain)指连续排列的链牙。 (7)牙链带(one side zipper chain)牙链固定在布带上称牙链带。 (8)链带(zipper chain)由两边牙链带啮合而成链带。 (9)上止(top stop)固定于牙链带上,限止牙链拉合时拉头滑出牙jvzquC41o0}bpp65364dqv4fqe5xgkfrr1zprrh143:95;960jznn
17.包装袋模型图片免费下载包装袋模型素材包装袋模型模板千图网为您找到983张包装袋模型相关素材,千图网还提供包装袋模型图片,包装袋模型素材, 包装袋模型模板等免费下载服务,千图网是国内专业创意营销服务交易平台,一站式解决企业营销数字化、协同化,实现营销转化效果增长!jvzquC41yy}/7Auke0ipo8ywrkgo1kfq|j{bppickouykwl0jvsm
18.GolangMap内部实现原理解析本文详细探讨了Golang中Map的内部实现,包括内存模型(hmap、bmap、mapextra)、设计原理(如hash值使用、桶细节、扩容策略)以及源码实现。Map的内存模型由哈希表组成,使用拉链法解决冲突。通过哈希函数,key的低8位决定桶位置,高8位用于在桶内快速定位。当装载因子超过6.5时,Map会进行扩容。删除操作仅将key的tohash置空jvzquC41dnuh0lxfp0tfv8vsa5?4:;<8;1gsvrhng1jfvjnnu1734><4:86
19.私域电商模型解读:链动2+1私域电商模型:链动2+1 链动2+1模式:实体企业的业绩倍增秘籍! 你是否有过这样的疑惑:对于互联网模式和系统,虽然想要做出效果,却又担心无从下手?其实,裂变传播并没有想象中那么复杂!让我们通过本文,一起揭开链动2+1模式的神秘面纱,助你轻松落地裂变营销! 链动2+1模式:快速破解业绩增长困局 链动2+1是一种创jvzquC41o0726?<0eqs0r{tfwez0f;=839=667mvo
20.一流拉链都有哪些品牌2025拉链一线品牌名单→买购APP前十强榜单说明:2025年Maigoo发起了拉链品牌网友投票,经过统计得票情况并结合AI人工智能、大数据、云计算、专业测评数据统计等方法最终得出的拉链前十名的品牌是:YKK、伟星SAB、SBS、开易KEE、福兴拉链3F ZIPPER、华圣达HSD、三力拉链、驰马CMZ、YCC、和合拉链。上述拉链jvzquC41yy}/ojniqq4dqv4dguz03:5580nuou