人工智能机器人领域正在经历一场前所未有的“光子争夺战”灵菲配资,各大科技巨头正在疯狂收集现实世界的视觉数据来训练AI机器人。
据硬AI,摩根士丹利在最新研报中表示,随着AI机器人和具身人工智能的发展,特斯拉、Meta和Figure AI等大规模收集视觉数据来训练视觉语言行动(VLA)模型。
具体来看,特斯拉转向“纯视觉”训练方法,Meta通过智能眼镜收集日常活动数据,而Brookfield与Figure AI合作在庞大的房地产组合中部署数据收集。
这一趋势对投资者意味着,视觉数据成为AI训练的新“金矿”,拥有数据收集能力的公司将在AI机器人竞赛中占据优势地位。
摩根士丹利用"肥金枪鱼"比喻来解释视觉数据的价值:2019年一条612磅的蓝鳍金枪鱼在东京拍卖会上售价310万美元,但如果没有捕捞工具,这条鱼的价值为零。同样,如果没有处理能力(yottaflops级算力,1 yottaflop = 1万亿teraflops),世界的视觉数据价值也为零。但一旦具备了收集和处理能力,这些数据就变得极其珍贵。
特斯拉的战略转型:从遥控操作到纯视觉训练大摩表示,特斯拉在Optimus机器人训练方面正在经历重大战略转变。
据Business Insider报道,特斯拉内部消息人士透露灵菲配资,公司已将Optimus机器人训练转向“纯视觉”方法,放弃了传统的遥控操作、动作捕捉服装和VR技术,转而记录工人执行任务的视频作为训练数据。
2025年5月,特斯拉前Optimus负责人在X平台发布了一系列视频片段,展示Optimus执行据称从人类视频中学习的自主任务。这些视频最初采用第一人称视角(摄像头安装在人类演示者身上),但最终目标是扩展到由“随机摄像头”以及互联网上的内容捕获的第三人称视角。
这一战略转变凸显了视觉数据在AI机器人训练中的核心价值。正如大摩报告所述:“当你驾驶特斯拉时,你不仅仅是在物理空间中行驶,你还在玩一个视频游戏……将数据输入模拟世界以训练特斯拉最新的FSD模型。”
Meta的智能眼镜:将日常生活转化为训练数据摩根士丹利互联网团队认为,Meta的可穿戴设备虽然是"长期看涨期权",在未来几年内不太可能影响财务数据,但其战略意义不容小觑。Meta正在推进其多年愿景,将领先的大模型和代理能力整合到下一代可穿戴设备中。
大摩报告指出:
当你佩戴Meta眼镜时,你正在教授模型如何弹钢琴、织毛衣、倒咖啡或倒垃圾。
想象一下,如果2年内有2000万台这样的设备投入运营——这几乎是道路上特斯拉车辆数量的两倍——每个Meta眼镜用户都可能在元宇宙中训练一个在数十亿场景中迭代的人形化身。
Brookfield与Figure AI:房地产帝国的数据收集网络摩根士丹利另类投资团队将Brookfield视为执行大规模AI基础设施解决方案的领导者。Brookfield与Figure AI的合作被视为在快速发展的人形机器人领域创建专业知识的重要步骤。
Brookfield的全球庞大足迹使其成为帮助Figure AI构建最大预训练数据的独特合作伙伴。Brookfield是最大的房地产所有者之一,拥有超过10万个住宅单元、超过5亿平方英尺的商业办公空间和1.6亿平方英尺的物流办公空间。
该合作将允许Figure AI积累关键的AI训练数据,教授人形机器人如何在各种以人为中心的空间中移动、感知和行动。数据收集工作已经在Brookfield环境中展开,预计该项目将在未来几个月内扩大规模。
本文来自微信公众号“硬AI”,关注更多AI前沿资讯请移步这里
风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。全金网配资提示:文章来自网络,不代表本站观点。