
自由度也不一样,这使得对数据和模型的要求有了一个很大的挑战。比如视频语言模型,需要的是文本和图片数据,但到机器人这里,需要的数据更加多元。 其实在说机器人之前,我们可以先说一下自动驾驶,它可以被认为是介于语言模型和具身模型之间的一个领域。
转载请务必注明出处: 责任编辑:建嘉 文章内容举报
585[메일] social@ytn.co.kr
窗 石野认为,对于机器人来说,它需要的模型和VLA的差别在于动作和语言、视觉是同步输出的。(04:54) 澎湃科技:你觉得VLA已经是上一代的技术了? &
当前文章:http://jseqp.guandianke.cn/47pi7xa/omcd8.ppt
发布时间:09:46:12