机器人具身感知的过程包括四步:感受信息,信息理解,下游任务

编辑：创创来源：哈尔滨工业大学社会计算与信息检索研究中心时间：2024/12/16

具身智能是指像人一样能与环境交互感知，自主规划、决策、行动、执行能力的机器人或仿真人，又可称之为“具身智能机器人”。

它的实现包含了人工智能L域内诸多的技术，例如计算机视觉、自然语言处理、机器人学等。

总的来说，具身智能机器人先要能够听懂人类语言；其次分解任务，规划子任务，移动中识别物体，与环境交互，终完成相应任务。

具身智能有望打开 AI 新空间，引L人工智能下一站浪潮。

实现具身智能需要多个学科的交叉能力。当前具身智能产业链中包括数字基础设施、机器人制造、机器视觉、多模态大模型的厂商等相关环节投资机会值得重点关注。

机器人制造：为具身智能提供了机械的身体和基本的运动控制。

深度学习：该学科中的神经网络仍然是具身智能中主要的工具。为具身智能提供推理能力；强化学习，从环境反馈中，帮助具身智能调优模型。

多模态：计算机视觉，为具身智能提供处理视觉信号能力；语音与自然语言处理，为具身智能提供理解与对话能力，实现与人类交互。

计算机图形学：其开发的物理仿真环境给具身智能提供了真实物理世界的替代，大大加快了学习的速度并降低了成本。

认识科学：帮助具身智能理解人类，构建认识与价值。

人形机器人感知模块是人形机器人实现具身智能的基础，主要包括视觉、位觉、触觉和力觉等传感器，其功能如下：

视觉感知：通过摄像头、RGBD相机、激光雷达等设备获取环境信息，用于定位、避障和物体识别。

位觉感知：通过IMU等设备获取机器人的姿态信息，如角速度、加速度等，用于机器人姿态控制和位置定位。

触觉感知：通过触觉传感器获取接触力信息，用于灵巧手抓取和碰撞检测等。

力觉感知：通过力矩传感器获取关节执行器承受的力矩信息，用于实现柔顺控制。

感知模块中的各种传感器遍布机器人全身，并通过软硬件算法实现数据融合，为交互模块和运控模块提供实时准确的信息反馈，从而实现智能感知、决策和控制。在人形机器人中，感知模块的优化对于提G机器人的智能水平具有重要意义

机器人分类