大湾区科学论坛|深圳大学教授黄惠:智能图形感知解决机器人“卡脖子”问题

南方财经全媒体见习记者马嘉璐 南沙报道


机器人智能化的进一步发展被真实三维动态环境能力的不足所制约。”5月20日,国家科技创新领军人才、深圳大学计算机与软件学院院长黄惠在大湾区科学论坛“众里寻她”女科学家分论坛上介绍了她在智能图形感知方面取得的研究成果,利用无人机对三维空间进行全自动自主探索,用更小的数据量规模实现更高精度的建模。目前,这项成果处于国际领先地位,可在数字孪生、智能机器人制造等领域广泛应用。



大湾区科学论坛丨深圳大学教授黄惠:智能图形感知解决机器人“卡脖子”问题

更小的数据规模、更高的精度


中科院物理所曾科普了数字孪生的定义:数字孪生,英文名叫Digital Twin(数字双胞胎),也被称为数字映射、数字镜像。数字孪生是在某一设备或系统基础上创建一个数字化的“副本”,简单说就是将现实世界的实体物体转化为数字化的虚拟体验。


2023年初,中国信通院发布的《数字孪生城市产业图谱研究报告(2022)》观察到,我国数字孪生产业发展阶段正处于增长期,数字孪生城市建设市场活跃,市场主体不断扩大。数字孪生可以极大提升“元宇宙”的构建效率和真实体感,是“元宇宙”的重要组成部分,随着“元宇宙”概念的火热,数字孪生这一前沿技术也越来越被人们熟知。


以前,数据孪生需要用大量的人力和物力来收集数据,接着通过大量的计算来建立模型。黄惠指出,数据采集成本高昂、时效性低,三维建模的对象非结构化、无关联,正是当前数字孪生难以实现智能化、模块化、轻量化、结构化、通用化的痛点所在。


针对上述问题,近十年来,黄惠聚焦“智能图形和感知计算”攻克难点,主导提出优视精准摄影测量技术,通过便携无人机全自动采集达毫米级高清分辨率的城市三维快照,整个过程从端到端连续规划、众包协同,用最少视角争取最大覆盖,将大规模城市场景数据量缩减200倍,同时保证低于0.6米的几何细节损失度,使数据采集的设备投入能够缩减70%。实现多元信息的精准映射和良性代谢。这种技术已经在贴近式高精度城市三维航测的单个项目上被广泛应用,覆盖面积在全球范围内保持国际领先地位。


以对深圳市约2200平方公里的范围进行建模为例,在实际中,建模面临着空域协调难,高度限制多,天气影响频繁,数据质量差,采集时间长的挑战。如果用传统的建模方式,需要用2年时间采集6000万张图片的数据,建立60TB体量的模型,总成本达1.5亿。无法实现城市孪生三维基础的实时更新,因为采集方式的周期长且频率低。经过优视精准摄影测量技术的优化,则可以在不降低精度的前提下,在8个月内用2000万张照片数据建立6TB的小模型,总成本降至6000万,降幅达60%。


数字孪生在群体智能、无人驾驶、智慧城市、国土安全、工业制造等领域中都有着重要的价值和意义。”黄惠表示,优视精准摄影测量技术利用无人机对三维空间进行全自动自主探索,并实现云上计算,大大降低城市三维重建的成本和门槛,将来可广泛应用于高精度智能驾驶地图构建、实景三维导航、高精度城市管理信息平台等领域。


三维感知能力缺失“卡住机器人脖子”


《数字孪生城市产业图谱研究报告(2022)》提出,近年来人工智能技术逐渐应用于建模领域,图片建模、视频建模成为未来发展趋势。据黄惠表示,应用人工智能辅助机器人研究或许可提升数据分析效率,并助于找到更高效的三维建模方案。她透露,她和她的团队正在研究结合智能图形和人工智能的方法,以进一步推进智能机器人的研究。


一个智能图形感知的挑战在于缺乏可用于大规模训练的数据,与ChatGPT相比。黄惠介绍道,ChatGPT所使用的原始数据基本上都经过了人工的筛选、标注,是“干净”的,但这一点延伸到三维空间,难度会大幅增加。一件物品可以被拍摄1000次,但所有这1000张照片都可能无法完整准确地描述这件物品。重新表述如下:这意味着当训练人工智能模型处理小范围三维空间数据时,将需要处理大量的数据量。


机器人智能化被卡住了脖子,是因为缺乏真实三维动态环境能力。”为什么这么难?黄惠用常见的扫地机器人来类比解释:要让扫地机器人在平面上移动、感知并躲避障碍物、防止自己被卡住,现在并不容易。与它相比,智能图形感知要能够在三维空间内判断物体的形状,进而判断出物体的功能、动静关系,赋予机器人可以更高级感知的具身智能,能够真正地直面和改变真实的三维复杂动态环境,像人一样“看见即理解、所见即所得”,作出决策和行动。


经过二十余年基础研究的沉淀,黄惠带领团队尝试拉通了环境感知、几何建模、语义理解、自主决策的整个链条。但与ChatGPT这样在自然语言理解方面取得显著进步的人工智能技术相比,仍然有很多关键科学问题没有得到解决,“还有很长的路要走”。


更多内容请下载21财经APP



机器人作为未来发展的重要领域,一直以来都受到广泛关注。但是在实际应用中,机器人常常存在着卡脖子等问题,导致工作效率低下。在第十届大湾区科学论坛上,深圳大学教授黄惠提出了智能图形感知来解决机器人“卡脖子”问题。
一、机器人“卡脖子”问题背景
机器人在工业生产、医疗、物流等领域发挥着重要作用,但是在复杂环境下操作时,经常会因为无法识别障碍物而卡住,无法自主转向。这就导致了机器人在实际应用中无法达到预期效果,甚至会出现意外安全事故。
二、智能图形感知是解决之道
为了解决这个问题,黄惠教授提出采用智能图形感知技术,使机器人具有识别物品和障碍物的能力,从而轻松自主完成复杂操作。通过感知图像中的物体,机器人能够更好地理解环境,并且避免撞到或碰到障碍物。
三、图像特征提取为基础
在探讨智能图形感知技术时,黄惠教授提到了图像特征提取技术。这项技术是通过算法将图像中的信息提取出来,从而实现信息的分类和识别。特征提取技术可以准确的识别图像中的物品,为机器人的智能运作提供了前提条件。
四、图像分割技术应用
图像分割是一种基于像素级别的图像处理技术,用于将图像分割成不同的区域,从而实现对物体的有效识别。在机器人智能图形感知中,图像分割技术同样可以提高识别精度,帮助机器人更好地识别和分辨物品。
五、智能算法在实际应用中的作用
在日常应用中,智能算法是机器人完成复杂任务的关键。智能算法可以对机器人感知到的物品进行优先级排序和自主判断,从而帮助机器人完成精细的操作。如此一来,机器人的工作效率和安全性都将得到提升。
六、机器人“卡脖子”问题解决带来的良好影响
随着机器人智能图形感知技术的应用,机器人\"卡脖子\"问题得到一一解决。机器人的工作效率将得到提高,应用范围也将随之扩大。此外,智能图形感知技术的应用也将推动机器人等智能设备发展,为未来的智慧城市建设提供有力支撑。
七、结语
机器人在工业、物流、医疗等多个领域有着广泛的应用前景,但是机器人“卡脖子”问题一直存在。智能图形感知技术的应用为机器人的智能化发展带来了新的突破,进一步释放了机器人的潜力。期待未来机器人技术的更广泛应用。