“当视觉数据跟触觉数据加在一起,要考虑的有效数据元素过多,模型体量增大,难度也必然提升。”他山科技CEO、联合创始人马扬举例,他山科技正在研究机器人剥小龙虾任务,这种看似非常简单的精细动作,实则需要大量的训练和学习。“我们目前在武汉招募了十几个人的团队做小龙虾项目,计划今年底完成模型训练,并推进小批量试验。”
硬件方面,具身智能本体端部署的大模型,对算力水平要求高,专用芯片仍不够成熟。“需要加速发展低功耗、高性能且专用于具身智能大模型的芯片;同时将大参数模型轻量化、小型化,并保证在执行任务时性能不会大幅下降。”一位高校具身智能专家提出。
算法层面,业界仍难以训练出强泛化能力的大模型。中国信息通信研究院人工智能所安全与具身智能部副主任张蔚敏介绍,在3D场景中的情景问答(SQA3D)任务中,当前最先进的模型准确率已提升至55%~60%区间,但仍远低于人类的90.06%,这表明算法成熟度不够高。
此外,目前探讨的具身智能多为单体智能,在实际应用中,多台机器人协同工作的群体智能,亦是行业需要攻克的课题。
不可否认,具身智能产业飞速发展,泛化能力正越来越强大。“部分场景乐观估计三五年就能在技术上实现突破。”赵明国表示。
分级分类加快落地
加速实现通用智能,仅靠实验室环境无法模拟复杂场景的动态不确定性,需要在真实落地场景中暴露问题并找到解决方案。“具身智能需要一个标准分层,有标准就可以实现技术对齐,加速产品落地。”瑞银证券中国工业分析师王斐丽说。
目前,国内一些行业机构效仿智能驾驶分级标准,提出了具身智能相关分级框架,以加快技术进步和场景落地。
|