人工智能(AI)最终也将回归于“人”:“具身智能”为AI下一浪潮,赋能人形机器人从想象走入现实。“具身智能”赋能机器人等载体,使其具备自主感知、自主决策、自主执行、自主学习的能力。有别于现阶段机器人只能机械执行有限操作,机器人与环境交互感知的能力正是“具身智能”的精髓所在。目前,特斯拉Optimus、波士顿动力Atlas、小米CyberOne等科技巨头布局人形机器人,AI具身智能持续迭代赋能,人形机器人行业有望迎来加速发展。据高工机器人产业研究所预计,2026年全球人形机器人在服务机器人中的渗透率有望达到3.5%,市场规模超20亿美元,到2030年,全球市场规模有望突破200亿美元。
(1)3D视觉:3D视觉为具身智能之眼,精准、灵活的3D视觉是机器人运动与交互的前提。视觉感知是人形机器人最重要的外部感知能力之一,对人形机器人的运动行走以及决策反应起着关键性的作用。机器人低速移动、处理复杂多样的工作以及人交互的工作需求对视觉传感器的变焦能力、分辨率提出考验。目前3D成像方案主要有立体视觉、结构光、激光三角测量以及ToF(Timeofflight)。目前特斯拉使用的方案为使用多个摄像头的立体视觉方案;波士顿动力Atlas则使用了ToF方案。
(2)线束与连接器:线束与连接器为人形机器人的神经与血管,随机器人的运动而动,对线束提出抗扭转应力、高速率、连接器小型化等要求。特斯拉Optimus的运动规划和动力系统借鉴了电动汽车设计,新能源汽车连接器和工业机器人连接方案可给予人形机器人线束启发。新能源汽车无人驾驶方案外接多个摄像头及激光雷达等传感器,对线束提出了高速传输的需求;而工业机器人装配复杂、敏感传感器数量多、柔性化作业的特点则对线束连接器提出了小型化、高速率、模块化、高集成的需求。
(3)传感器:传感器主要负责内外部环境信息的监控交互,按信息源自可分为内部传感器与外部传感器。内部传感器主要负责收集自身运动、位置信息(如关节的线位移、角位移等几何量,速度、角速度、加速度等),以此来实现更精确可靠的智能控制。而相比别的机械设备,机器人与外部环境的交互性更强,因此其需要利用外部传感器实时监测周围环境参数,辅助完成目标识别、决策判断等过程。
(4)电机驱动:机器人关节处需多个电机驱动,电机驱动芯片配套需求提升。电机驱动系统是将电能转化为动能的物理系统,主要由负载、控制装置及电机等部分构成,电机驱动芯片是电机驱动系统的大脑。在人形机器人中,电机需求广泛分布。以特斯拉Optimus为例,其主体部分使用28个电机执行器,用以完成抬手,屈膝等动作。根据特斯拉2022AIDAY,Optimus上的执行器共有6种类型,不一样的扭矩、输出力和质量性能参数各异。同时,其手部有12个电机执行器(每只手6个),用于完成细小物体的抓取。
人工智能(AI)最终也将回归于“人”:“具身智能”为 AI下一潮,赋能人形机器人从想象走入现实。黄仁勋在 ITF World 2023 的演讲中,提出 AI 下一轮发展的新趋势为“具身智能”,能够理解、推理并与物理世界交互。“具身智能”赋能于机器人等载体,使其具备自主感知、自主决策、自主执行、自主学习的能力。有别于现阶段机器人只能机械执行有限操作,机器人与环境交互感知的能力正是“具身智能”的精髓所在。如果说 ChatGPT 为代表的大模型开启了通用 AI 新时代,那么多模态、具身、主动交互式的人形机器人则是这一时代的必由之路,人形机器人有望成为 AI 终端的最终形态。
科技巨头入局,Al+人形机器人初露头角,蓝海空间无限可能。特斯拉Optimus、波士顿动力 Atlas、小来 CyberOne 等科技巨头布局人形机器人,A具身智能持续迭代赋能,人形机器人行业有望迎来加速发展。据高工机器人产业研究所预计,2026 年全球人形机器人在服务机器人中的渗透率有望达到 3.5%,市场规模超20 亿美元,到 2030 年,全球市场规模有望突破 200 亿美元。
1.2.1.特斯拉 Optimus: 站在造车积淀上造机器人,单价2 万美元打造未来爆款
“车人同源”,沿袭特斯拉汽车最强大脑和动力核心。马斯克曾表示,“当有一天我们解决了汽车的无人驾驶问题 (即现实世界的 AI 问题) 后,就可以将 A技术推广到人形机器人身上。这将比汽车具有更广闻的应用前景。”特斯拉机器人沿袭了电动汽车的设计经验,并具备一双拥有 11 个自由度的“灵巧手”。特斯拉对于机器人的定位,已从“替代人工进行重复或危险工作”,向“为千家万户提供更复杂的服务工作”转变。
超算大脑: Optimus 的大脑使用了 Dojo D1 超级计算芯片,视觉感知系统主要基于特斯拉 FSD 的计算机模组和方案,面部配备 8 个汽车同款 Autopilot 摄像头,最远监测距离可达 250 米。
灵巧手脚:Optimus 的“手”拥有 6 个执行器,11 个自由度,支持自适应抓取,手心采用防滑材料,可抓起 20 磅重量,非常适合于精密小零件的抓取:手腕由两根执行器控制,能让手腕转动,做水平的动作: 腿部也是采用了两根执行器,脚掌可以上下翻及调整掌面。这使得 Optimus 的手脚具有了模仿人类的灵活度。
安全心脏: Optimus 时能耗 100w,慢走时能耗 500w。借鉴汽车电池系统,Optimus 躯千处搭载了 2.3kWh、52V,并高度集成了充电管理、传感器、冷却系统的电池系统,具备保护自身和周围人安全的能力。
两年间进展迅速,Optimus 目标承担更复杂的任务。2021 年 Optimus 作为 概念首次被提出,两年后的 2023 年 5 月 16 日,在特斯拉举行的股东大会的展示 短片中,Optimus 的行走运动已经较为流畅,更具备了一系列全新技能:Optimus 能够直接进行电机转矩控制,可将力道控制至不打碎鸡蛋。此外,Optimus 还可进行 集体行走,端到端操控,环境探索与记忆等功能,并能通过 AI 算法精准识别人类 抓取物品动作并复制到机器人身上。
2 万美元打造爆款,展望机器人蓝海市场。Optimus 在 2022 Tesla AI Day 上, 马斯克曾预计 Optimus 将在 3 至 5 年内开始量产,单价将低于 2 万美元,市场需 求预计达到数百万台。在更长远的展望中,马斯克预测未来也许每一个人都会配备 一台机器人,人形机器人市场需求将达到 100 亿至 200 亿台。
1.2.2. 波士顿动力 Atlas:机器人中的“跑酷达人”,身价过高限制应用场景
波士顿动力 Atlas 以其卓越的运动性能而闻名,高造价限制商用场景。Atlas 机器人包含 28 个液压驱动器来提供动力,速度能达到 1.5m/s,并且使用 3D 打印 技术来制造身体,使得其重量大幅减轻。同时 Atlas 搭配 TOF 深度相机来扫描周 围环境,同时通过 MPC 模型来预测其运动,从而做出最佳选择。然而,Atlas 造 价达 200 万美元,其居高不下的成本大大限制了 Atlas 的商用化进程。
1.2.3. 小米 CyberOne:小米科技生态新符号,打造注重情绪的机器人
Cyberone:注重人的情绪感知,造价 60-70 万元。从智能手机到可穿戴设 备、智能家居、智能电动汽车以及仿生机器人,小米正围绕人的生活和工作在构 建不断延展的科技生态。小米 CyberOne 拥有空间感知、认知能力,其搭载自研 Mi-Sense 深度视觉模组,结合 AI 交互算法,使其不仅拥有完整的三维空间感知 能力,更可以在一定程度上完成人物身份识别、手势识别、表情识别,做到了不仅看得到也能 看得懂。同时 CyberOne 支持 21 个自由度,速度达到 3.6km/h,并能实现各自由 度 0.5 毫秒级别的实时响应,模拟人的各项动作。其搭载的自研 MiAl 环境语意识 别引擎和 MiAl 语音情绪识别引擎,可以在一定程度上完成 85 种环境音识别和 6 大类 45 种人 类情绪识别。CyberOne 造价在 60-70 万元,尚没办法实现量产。
3D视觉为具身智能之眼,精准、灵活的 3D视觉是机器人运动与交互的前提。视觉感知是人形机器人最重要的外部感知能力之一,对人形机器人的运动行走以及决策反应起着关键性的作用。机器人低速移动、处理复杂多样的工作以及人交互的工作需求对视觉传感器的变焦能力、分辨率提出考验。由于机器人处于移动状态,视觉传感器一定要具有较强的变焦能力,同时,机器人还需要具备识别人脸甚至表情的能力,对分辨率提出了更高的要求。目前 3D 成像方案主要有立体视觉、结构光、激光三角测量以及 ToF (Time of flight)。特斯拉目前使用的方案为使用多个摄像头的立体视觉方案: 波士顿动力 Atlas 则使用了 TF 方案。
(1) 特斯拉 Optimus: 全面沿袭无人驾驶方案设计,使用了 8 颗自动驾驶摄像头。
(2) 波士顿动力 Atlas: 使用了 TF 方案,TOF 相机以每秒 15 的速度生成环境点云。使用多平面分割算法从点云中提取平面,并输入到映射系统中进行建模,机器人则根据建模结果进行运动规划。
(3) 小米 CvberOne: 搭载 Mi-Sense 深度视觉模组,由小米和欧菲光协同开发完成。欧菲光自研的机器视觉深度相机模块由 iToF 模组、RGB 模组、可选IMU 模块组成,产品测量范围内精度达 1%。
在机器人视觉领域,公司产品经验比较丰富、核心技术完备。公司已针对服务机 器人和工业机器人等不一样的种类机器人推出了 3D 视觉感知方案,并推出 Astra G/T 等应用于 AIoT 服务机器人领域的 3D 视觉传感器产品系列,与普渡科技、云迹科 技、擎朗智能等服务机器人客户达成合作。公司技术路线覆盖单目结构光、双目 视觉、ToF、LiDAR,技术能力覆盖机器人视觉芯片、智能视觉算法、模组及方案 以及规模化量产等能力,在全球率先完成具身智能机器人视觉的核心技术布局, 逐步的提升机器人视觉感知领域的竞争力。
机器视觉领域技术积累深厚,自研视觉算法库与可配置视觉系统共同赋能机 器人视觉感知。凌云光深耕机器视觉行业近 20 年,是少数拥有底层视觉算法完全 自主开发能力的公司,其立体视觉领域可配置视觉系统基于自研算法库 VisionWare 及其衍生系列软件,可实现点云数据处理与建模,这一技术可应用于 数字形象构建和移动机器人自主导航等情景。而在机器人领域,波士顿动力的 Atlas 机器人运用了点云视觉感知技术,可以帮助其有效感知环境、生成与规划行 动路径。凌云光已具备成熟的点云处理底层算法库和立体视觉领域可配置视觉系 统,未来在移动机器人领域应用前景广阔。
国防用光电测控仪器专业制造商,参股公司长光辰芯和禹衡光学分别覆盖CIS 与光栅编码器领域。奥普光电多年深耕光机电一体化产品,光电测控领域优势强大,基本的产品包括光电测控仪器、光学材料和医疗器械。长光辰芯专注高性能 CMOS 图像传感器的设计研发,具备业界领先的 CIS 核心技术与产品。禹衡光学是国内光栅传感器领域的领先企业,主流产品光栅编码器是伺服系统和自动化领域的关键部件。
奥普光电参股公司长光辰芯技术积累深厚、行业地位领先、客户资源优质,深度参与CIS 国产替代。长光辰芯的 CIS 产品大范围的应用于3D 激光扫描测量、轮廓分析和机器视觉领域,2022 年在工业 CIS 应用市场中市占率排名全球第四,国内排名第一,积累了特励达、Vieworks、海康机器人、华容科技等国内外知名优质客户。同时,长光辰芯凭借技术优势不断突破 CIS 关键技术难关,深度参与 CIS领域的国产替代,不仅研制了全球迄今为止分辨率最高的 1.5亿 APS 像素 CIS芯片,2021 年发布的 8K 超高清图像传感芯片产品更是打破了我国超高清成像芯片及系统对国外进口的长期依赖。
奥普光电子公司禹衡光学深耕光栅编码器,在机器人领域应用前景广阔。禹衡光学的主流产品光栅编码器大范围的应用于自动化领域,同时还是机器人伺服电机中的关键零部件。目前,禹衡光学在工业机器人伺服领域市占率达到 40%,智能协作机器人编码器领域市占率为 10%,在机器人赛道优势极大。此外,伺服关节是人形机器人的核心组成部分,每一类伺服关节都需要通过编码器来感知环境、精确测量运动轨迹、控制关节运动。禹衡光学光栅编码器在人形机器人领域存在广阔的应用前景。
线束与连接器为人形机器人的神经与血管,随机器人的运动而动,对线束提 出抗扭转应力、高速率、连接器小型化等要求。特斯拉 Optimus 借鉴了电动汽车 设计,新能源汽车连接器和工业机器人连接方案有望给予人形机器人技术启发。 新能源汽车无人驾驶方案外接多个摄像头及激光雷达等传感器,对线束提出了高 速传输的需求;而工业机器人装配复杂、敏感传感器数量多、柔性化作业的特点 则对线束连接器提出了小型化、高速率、模块化、高集成的需求。人形机器人的 运动规划也离不开摄像头等外接传感器,且人形机器人空间较汽车更小,柔性化 作业程度高,预计也将对线束及连接器提出高速率、小型化、抗应力等要求。
瑞可达:汽车连接露小巨人,T 公司合作伙伴。瑞可达具备光、电、微波、高速数据、流体连接器产品研制和生产能力,主要下游领域覆盖新能源汽车、储能、通讯、工业。公司2016 年与美国丁公司建立合作伙伴关系,在新能源汽车和储能领域都与美国丁公司保持着良好的合作。新能源汽车是公司最主要的下游领域,至2022年2月,公司已为美国T公司旗下主要电动轿车、电动 SUV、电动卡车及充电设施产品系列提供近 100 余款产品,并有数十款产品在持续开发中。在工业领域,公司在机器人领域有特种连接器和线束产品的布局,涉及工业机器人、医疗设施等细致划分领域。特斯拉Optimus 人形机器人承袭造车路线,新能源汽车产业链供应商亦有望优先进入机器人供应链。
维峰电子:专精工业控制精密板端连接器,产品可用于人形机器人。公司的精密连接器产品可大范围的使用在工业控制与自动化设备、新能源汽车“三电”系统等应用场景。公司的工业控制板对板连接器可应用于伺服电机,汇川技术为公司的主要客户。此外,公司的IO系列、WD系列、WF系列新产品可用于人形机器人、工业机器人等自动化、智能制造设备的机械臂和控制柜上。在工业机器人领域,公司已有产品应用于库卡机器人相关项目。在研发储备方面,公司亦有多款产品可应用于库卡相关项目。
机器人根据所达成目标的不同,配置的传感器类型和规格也不完全一样,根据 信息源自一般可分为内部传感器和外部传感器。内部传感器,主要用来采集机器 人内部的信息,如关节运动的位置、速度、加速度等;外部传感器,主要用来测 量机器人旁边的环境参数,通常跟机器人的目标识别、作业安全等因素有关。
公司作为国内传感器领域的有突出贡献的公司,长期专注于各类应变式传感器的研制工作,并依托其在传感器领域的优势,提供仪表仪器的系统集成以及干粉砂浆等第三方服务。公司的核心产品为应变式(力矩)传感器,“应变式”是对其工作原理的描述:将工程构件受力后的形变转化为可测量的电阻变化。应变式力(力矩)传感器是机器人中的核心部件,在机器人关节模组等重要环节具有广泛应用。其可以对机器人手臂上的力进行监控,根据数据分析,对机器人后续行为做出指导,能够将扭力的物理变化转换成精确的电信号,具有精度高,频响快,可靠性好等优点。按照测量维度,力传感器能分为一至六维力传感器。六维力传感器维度最高,其反馈的信息也最为全面,但由于其难度最大,其最早应用于航空航天市场,后逐步应用于工业机器人以及对传感性能要求更高的协作机器人领域。
IMU(inertialmeasurement unit),即惯性测量单元,其内部主要由三个单轴的加速度计和三个单轴的陀螺仪组成,前者用以检测物体在载体坐标系统中独立三轴的加速度信号,而后者检测载体相对于导航坐标系的角速度信号。
公司专注于半导体芯片、功率半导体器件和集成电路封装测试,目前已拥有从产品设计到最终产品研制、制造的整套解决方案,产品大范围的应用在航空航天、汽车、IT、工业家电以及大型设备的电源装置等领域。随着我们国家半导体行业规模的迅速扩张,MEMS 传感器行业也将迎来广阔发展空间。公司紧跟市场步伐,积极布局 MEMS 传感器领域,形成了以 MEMS 加速度计为核心的产品组合,并参 股子公司明皜传感(21.63%),其负责 MEMS 惯性传感器及 IMU 的研发设计, 有望成为机器人传感器稀缺性标的。
机器人市场正慢慢的变成为 MEMS 传感器的主要应用市场。在工业机器人领域,方位测量、力度与扭矩测量、线路轨迹规划、图像检测和轮廓识别等常见应用场景,不能离开 MEMS 传感器的加持。
惯性《加速度) 传感器应用广泛,公司业务主要集中于消费电子领域。惯性传感器大多数都用在检测和测量加速度、倾斜、冲击、振动、旋转和多自由度(DoF)运动,因此下游主要覆盖各类人与物体的运动场景。公司惯性业务大多分布在在消费电子领域,因此对成本、功耗、尺寸等要求比较高。依据公司 21 年年报,公司早在 2015 年就推出了使用 TSV 通孔制造工艺的单芯片集成三轴加速度计,至 21年仍是全球最小尺寸,且公司将持续进行芯片设计迭代,推出更小尺寸的加速度传感器。公司惯性传感器在 2020 年进行了晶圆端供应链的调整,已完成在新工厂的工艺导入,正进一步改善工艺并提升良率。2023 年,公司将持续进行陀螺等惯性传感器的研究开发工作,并对车用惯性导航模组 IMU 进行研究开发工作。
海量/完整电子版/报告下载方式:公众号《人工智能学派》返回搜狐,查看更加多