尤其在国内厂商这种几乎1个月一次小迭代,3个月一次大迭代面前,技术谁敢说绝对领先,过几天就有人能模仿出来。
正如比尔·盖茨在1995年的《未来之路》所言,“我们总是高估了未来两年的变化,却总是低估了未来十年内的变革。”
适合人形机器人的高精度电机与常用电机的结构、材料不同,标准部件难以集成到人形机器人上,许多新方案需要重新设计。但特斯拉也不知道什么样的方案,才能做到真正领先,这就导致后面的降本增效无法进行。
2024年,马斯克已经发觉,一步到位造出像人一般行动的机器人基本不可能,4月后只能进行一些工程上的妥协,让团队尝试边做边迭代。
例如在人形机器人手指上,完全的仿生仿人难以实现,团队在2年内尝试了驱动电机和绳驱和外部驱动的方式,但目前这套方案依然正在迭代。
今年5月,马斯克声称今年内会将Optimus手部自由度提升到22个,向人手靠近。据相关人称,因为寿命问题局限很大,这套方案马斯克的满意度依然不高。有分析人士认为,马斯克将过大精力投向于此,以至于特斯拉承诺的新车型一度延期。
▍通用性的边界
除了加强对核心零部件研发,人形机器人产业突破的另一技术支柱还在于人工智能。
机器人算法在原先许多分析师认为是特斯拉最有希望领先,并且能从汽车领域复用的技术,但实际情况却是,这套框架进入没有数据Scaling Laws的真实世界,缺乏可靠性。
特斯拉最早的做法是把汽车上的FSD中的机器视觉神经网络移植到Optimus上。希望像教汽车开车那样,让Optimus认识现实世界并作出适当的反应,让它从人类的动作中学习并进步。
但由于人类每人每天平均会接触600多个物体,如果把人换成人工智能模型,则其模型训练至少需要处理3500万种可能的场景。而现实是,当前并没有哪一家企业或研究机构拥有能够覆盖如此多场景的人工智能模型。
自动驾驶是要求汽车在一个2D世界里避免碰撞任何物体,但机器人的任务是在3D世界里主动碰撞、接触无穷多的事物。
人形机器人要尽可能模拟人在各类场景下‘感知-认知-决策-执行’的过程,但现阶段人形机器人在复杂场景下,机器视觉、激光雷达等产品容易失败,人工智能还‘不够智能’。
任务的训练学习时间和成本过大,马斯克不得不为此继续招募了大批数据标注人员和训练师。
但有分析师调研表明,到今年年中,Optimus在长度超过500米的行走测试中通过率只有不到60%。Optimus人形机器人还达不到可以上产线工作的状态,目前只能用来采集数据、测试不同的设计方案。
这使得部分接触过特斯拉的投资人对此信心没有想象中的那么足。
特斯拉机器人团队面前的挑战是,目前他们只能采取,可能针对特定的工作场景,比如拧螺丝,专门训练模型,让人形机器人先进入场景并发挥一部分作用,再找到更合适的机会突破瓶颈。
至于这种妥协的结果马斯克能不能接受,还不得而知。
▍结语与未来
特斯拉Optimus未来投入特斯拉工厂的进度、重要主机厂产业化进程、智能化迭代都是人们关注的核心影响因素。
在最新的人形机器人Optimus亮相中,马斯克似乎在规划另一个美好的蓝图,他预言,Optimus不仅能够胜任家务、儿童看护、宠物陪伴等日常任务,还可以在活动现场化身服务生,为嘉宾提供饮品、表演舞蹈。
但从发布会现场的走路姿势看,用户期望值过高,技术和应用场景却未完全成熟,Optimus不仅行走步态比竞争对手好不了太多,所展现的语言模型和动作模型融合技术也存在一定准确性和时延问题。
双手强大的操作能力也被猜测在如此昏暗的环境中不太可能实现,很大概率给人调酒、倒酒,送物品等都是基于遥操作实现。