机器人视觉产业技术中台建设项目可行性研究报告

  ,契合公司当下的业务布局及中长期发展规划,有利于提升公司在机器人视觉技术上的研发创造新兴事物的能力,推动机器人视觉产业发展。

  公司针对当前AI大模型、具身智能机器人等科技发展的新趋势,面向机器人视觉细分产业,立足于公司在3D视觉感知技术和产品上的积累与优势,致力于搭建机器人视觉产业的技术中台,为全产业下游客户提供全方位能力平台及系列化产品方案,基本情况如下:

  (1)机器人视觉传感器。旨在为机器人赋予精密的“机器人之眼”,让机器人在各类环境下都能够“看到世界”。将针对各行各业的机器人视觉需求,研发高集成度、低成本、高性能的机器人视觉传感器产品系列,包括单目结构光、iToF、dToF、双目视觉、激光雷达等;同时,为降低下游用户的使用门槛,在机器人视觉的基础上,同步搭配IMU、GPS、RTK等传感器,研发多模态感知融合技术,以满足机器人室内外各类场景感知的要求,最终将形成多模态视觉感知产品方案。

  (2)AI视觉感知和多模态交互大模型。旨在为机器人赋予智能化的“机器人之眼”让机器人在“看到世界”的基础上进一步“看懂世界”。一方面针对当前机器人视觉复杂场景应用痛点问题,研发抗强光、大HDR、抗雨雾、抗高温高湿工业级等智能视觉算法,以实现机器人视觉传感器在室内外复杂场景下的大范围、高精度、高可靠性等性能。

  另一方面,将研发多模态视觉大模型(机器人视觉GPT,Robot vision GPT),同时利用机器人视觉GPT技术应用于机器人自主移动/驾驶的全套算法(避障、导航、定位、建图、识别),实现各类视觉算法的智能化。通过大模型及智能算法的研发,结合机器人视觉传感器,将形成自主移动定位导航和避障产品方案。

  (3)机器人OS与云端数字孪生软件平台。旨在为机器人构建系统化的视觉任务执行与训练学习能力,让机器人可以在一定程度上完成与真实或仿真世界的沟通交互。公司将研发端方的机器人视觉SDK、固件以及机器人OS(Operating System, 操作系统),以及云端数字孪生软件平台。其中,机器人OS研究主要包含传感器驱动、传感器融合、业务组件开发、操作系统优化等内容,实现机器人的视觉识别、交互、执行等核心功能;

  云端数字孪生软件平台将通过搭建以机器人视觉为核心的数字孪生环境,以实现机器人视觉系统的仿真设计与预训练迭代。此外,还将打通端方与云上的信息交互,实现真实世界与孪生环境的系统闭环,例如由机器人本体采集真实数据,通过数字孪生完成训练学习与模型更新,利用软件平成机器人OTA升级,从而为机器人视觉赋予持续的自我学习与智能升级能力。通过端方系统、云上平台的搭建,结合传感器、结构件、控制器件等,最终将形成机器人整机系统方案。

  (4)量产测试与数字工厂。旨在实现机器人视觉从方案设计到量产落地,重点研究机器人视觉的量产、测试与数字化工厂建设。以公司现在存在量产能力为依托,研究机器人视觉传感器及整机量产过程中的关键技术。

  包括研究系统标定技术、开发生产流程与工艺,开发自动化测试技术,构建可靠性标准,搭建自动化生产管理系统等内容;在上述研究的基础上搭建传感器以及机器人整机自动化生产和检测系统,建立数字化工厂,以形成机器人视觉传感器的大批量制造能力及机器人整机的多机种、小批量制造能力。

  当下,大模型技术发展推动了机器人往具身智能机器人方向演进与变革,具身智能机器人也有望成为AI终极形态。具身智能机器人由于其类人化,将逐步替代人类完成由低级到高级的工作任务,让人类从重复、繁琐的工作中解放出来,将对数亿工人以及对应的数万亿市场产生深远的影响。

  同时,具身智能机器人能更高效、准确地达成目标,以节约时间和资源,所引领的机器人技术革命将带来非常大的技术红利,极大地解放生产力,同时也会创造新的经济增长点,推动社会持续健康发展与进步。具身智能机器人将沿“大脑先行、感知突破、身体完善”的方向迭代发展,在通用大模型、多模态大模型等“大脑”技术蒸蒸日上的同时,代表了“机器人之眼”的机器人视觉技术亟需突破、将迎来历史发展机遇。

  通过实施本项目,公司将搭建机器人视觉产业技术中台,基于“全栈式研发技术能力+全领域技术路线D 视觉感知技术体系,持续开展机器人视觉传感器、AI视觉感知和多模态交互大模型、机器人 OS 与云端数字孪生软件平台、以及量产测试与数字工厂等课题研发和技术攻关,进一步深化 3D 视觉感知技术发展,紧抓具身智能历史发展机遇,推动我们国家人工智能科技创新和机器人产业高质量发展。

  类似 ChatGPT 的通用大模型赋予具身智能机器人像人类一样的思考、推理与表达能力,但仅有“大脑”是远远不够的,需要像人类一样具备三大核心能力:用于思考和推理的“大脑”、用于感知世界的“感觉”、用于与世界交互的“身体和手脚”。这其中视觉感知占比超过了所有感知信息中的 70%,是机器人最重要的感知能力。

  具身智能机器人应用场景具备复杂、变化、多样化等特点,对机器人视觉提出了极高的要求,例如高温环境下需要适应温度变化、在光照变化场景下需要稳定输出数据、多视觉传感器之间需要高度同步与配准、在遭遇打击跌落时可以及时恢复视觉能力、在雪雾雨等恶劣天气下具备高可靠性等。

  此外,具身智能机器人所需要的“眼睛”是3D化、小型化、低成本、高性能且高度集成化的,这导致传统 2D、模块化、大体积的机器视觉设备难以被嵌入到具身智能机器人上作为“机器人之眼”。因此,机器人视觉底层核心技术亟需得到持续研发创新,研发 3D 化、高度集成化、场景复杂化的机器人视觉技术将极大促进具身智能机器人在感知技术层面的发展。

  通过本项目的实施,公司将基于结构光、双目、iToF、dToF 等机器人视觉领域的先进技术路线,突破机器人视觉技术发展瓶颈,扩大公司市场份额,并有效推动我国机器人产业发展。

  (3)打造机器人视觉产业技术中台是抢占具身智能机器人产业发展先机的关键策略

  具身智能机器人未来将作为一种日常工具,应用于千行百业,实现对人的替代,机器人的种类和需求量都将非常庞大。与手机、电脑等消费电子设备不同,由于行业的差别,未来机器人种类繁多、形态各异,如果各行各业都从 0 到 1 研发机器人/机器人视觉等核心技术,投入产出比较低,且会造成研发资源的浪费与研发效率的降低。

  因此,为千行百业、形态各异的机器人搭建一个机器人视觉产业技术中台,构建全方位能力平台,为不同行业机器人提供对应的软、硬件整套产品方案,是一种极具性价比、抢先占领行业先机的关键策略。

  本项目将打造公司机器人视觉产业技术中台,持续围绕具身智能机器人应用场景进行视觉技术研发。通过本项目的建设,将有利于推动公司 3D 视觉感知技术的发展和转化应用,抢占具身智能机器人产业发展先机。

  (4)打造机器人视觉产业技术中台将提升公司在机器人视觉技术上的核心竞争力

  公司是国内行业领先的 3D 视觉感知整体技术方案提供商之一,自成立以来保持对技术研发和市场开拓的高投入。但是,随着人工智能技术的不断突破,具身智能时代的来临,机器人产业形态的变化,下游应用场景日趋多样化,公司亟需对机器人视觉核心技术进行突破,为不同应用场景提供个性化的软、硬件整套解决方案,并不断收集客户使用数据,优化模型,提升产品性能,深耕机器人市场。

  本项目将立足于公司“全栈式技术研发能力+全领域技术路线D 视觉感知技术体系,构建面向具身智能机器人的机器人视觉产业技术中台,攻克机器人视觉传感器技术、AI 视觉感知和多模态交互大模型技术、机器人 OS 与云端数字孪生软件平台技术、以及量产测量与数字化工厂等核心技术,为开发者、机器人行业客户、中小创业公司以及传统行业客户提供一系列产品方案,包括多模态视觉感知方案、自主移动定位导航和避障方案、机器人整机系统方案等,为各行各业机器人提供视觉底层技术支撑,推动人工智能科学技术创新和机器人产业高质量发展。

  因此,本项目的顺利实施将有助于公司丰富产品矩阵,开拓新的应用场景,巩固公司在 3D 视觉感知行业中的领先地位,提升公司核心竞争力。

  机器人集现代制造技术、新型材料技术和信息控制技术为一体,是智能制造的代表性产品,也是衡量一个国家科技创新和制造业水平的重要标志,是未来 3D 视觉感知技术重要的应用领域。为更好推动机器人产业高质量发展,我国相应出台了一系列政策鼓励和促进机器人以及机器人视觉产业的发展。

  《中国制造 2025》及《机器人产业高质量发展规划(2016-2020 年)》等文件提出要重点发展机器人、无人机等高性能设备,积极鼓励中国企业进行技术及产业创新。2019 年 10 月,国家发改委发布的《产业结构调整指导目录(2019 年本)》鼓励智能制造关键技术装备,智能制造工厂、园区改造,智能机器人等产业发展。2021 年 12 月,工信部等 15 部门联合发布的《“十四五”机器人产业发展规划》提出,要加快研制三维视觉传感器和多线激光雷达等产品,满足机器人智能化发展需求。2023

  年 6 月,北京市人民政府办公厅印发的《北京市机器人产业创新发展行动方案(2023—2025 年)》明确提出到 2025 年,北京市机器人产业创新能力大幅提升,培育 100 种高技术高附加值机器人产品、100 种具有全国推广价值的应用场景,万人机器人拥有量达到世界领先水平,形成创新要素集聚、创新创业活跃的发展生态。

  因此,国家出台的多项鼓励政策对机器人以及机器人视觉产业发展的有力支持,为本项目的实施创造了良好的外部条件。

  近年来,公司凭借坚实的 3D 视觉感知技术,不断围绕服务机器人、工业机器人、ROS 教育机器人等不同种类机器人,为客户推出了丰富且全面的机器人视觉感知产品方案,提供单目结构光、双目结构光、激光雷达、iToF 全技术路线D 视觉传感器,帮助机器人实现建图、定位、避障、识别等功能。

  在机器人领域,公司已与云迹科技、擎朗智能、普渡科技、高仙机器人等多家服务机器人客户实现了业务合作,覆盖了智能工厂、仓储物流、建筑自动化、智能巡检、割草机、酒店配送、楼宇配送、商用清洁、ROS 教育等应用场景。

  因此,公司在机器人领域所具备的产品布局及广阔的客户资源将为本项目的实施提供保障。

  3D 视觉感知技术属于跨学科技术,涉及光、机、电、芯片、算法等多个专业。公司是国内率先开展 3D 视觉感知技术系统性研发,自主研发一系列深度引擎数字芯片及多种专用感光模拟芯片并实现 3D 视觉传感器产业化应用的少数企业之一,是市场上为数不多能够提供全套自主知识产权 3D 视觉感知产品的企业,也是全球少数几家全面布局六大 3D 视觉感知技术的公司,行业地位突出。

  为满足不同应用场景的需求,公司构建了“全栈式研发技术能力+全领域技术路线D 视觉感知技术体系,通过对系统设计、芯片设计、算法研发、光学系统、软件开发、量产技术等核心技术的深入研究,开发出结构光、iToF、双目视觉传感器、dToF 单线激光雷达等设备,同时布局了面阵 dToF、面阵 Lidar 等前沿技术,形成了坚实的技术壁垒。截至 2023 年 5 月末,公司已拥有本项目机器人视觉产业技术中台相关专利 626 项,其中发明专利 259 项,实用新型专利 256 项,外观专利 111 项。

  人才基础是企业能够保持长期生存与发展,获得长期竞争优势的重要保障。公司自成立以来,一直高度重视人才的引进和培养,为吸引优秀人才、稳固并激励核心人员,建立了严谨的选人用人机制、研发人才培养机制、股权激励机制和员工购房免息借款等机制。

  在人员积累方面,公司集聚海内外尖端人才,打造了由芯片、算法、光学、软件、机电设计等专业背景人才组成的 3D 视觉感知研发技术队伍。截至 2022 年末,公司拥有国家级人才、广东省珠江人才、各类深圳市高层次人才;研发人员共 592 名,其中博士及硕士研究生占比达 39%;

  此外,公司创始人黄源浩博士是国家级人才计划专家、国际知名光学测量专家,在 2022 年荣评“2021 年深圳十大杰出青年”,曾参与麻省理工学院 SMART 研究中心 3D 光学系统组等著名课题,并在 Optics Letters 等著名期刊发表论文 20 余篇,在 3D 视觉感知产业领域具有深刻洞察。

  机器人视觉产业技术中台建设项目的实施主体为奥比中光科技集团股份有限公司,项目总投资额为 66,155.27 万元,实施周期为 4 年,实施地点位于广东省。

  截至公告日,机器人视觉产业技术中台建设项目备案手续正在准备中,尚且还没有取得环评批复,相关土地使用权正在获取中。返回搜狐,查看更加多

相关新闻