为了加快在一流大学和一流学科建设的进程中对一流人才的培养,9月26日下午,诚岷教育打造的高端学术讲座“通海讲堂”在奉贤校区图文信息中心通海厅正式开讲,信息学院教授唐漾担任主讲嘉宾。唐漾教授是德国洪堡基金入选者、国家级高层次人才、科技部中青年科技创新领军人才、国家级海外高层次人才引进计划青年项目和大连市优秀学术带头人等计划入选者, ESI全球高被引科学家,其主要研究领域包含人工智能与工业智能。在上述领域,唐漾教授取得了丰硕的研究成果,在Automatica、IEEE汇刊、ICCV/CVPR/NeurIPS CCF-A类会议上发表论文130余篇,申请/公开/授权专利20余件,担任8本IEEE期刊编辑,目前承担科技部重点研发计划项目、国家自然科学基金重点项目和重大项目课题,并获得了2019年度大连市自然科学奖一等奖(第一完成人)等诸多科研奖励。
在本期“通海讲堂”中,唐漾教授以“基于深度学习的智能无人系统感知与决策”为题,将所研究的智能无人系统与当下热门的深度学习相结合,从钱锋院士长期从事的工业智能领域展开,分别介绍了在感知任务精确性和迁移性,决策任务的实时性和最优性,控制任务的协同性和自主性等各个领域取得的系列成果。
唐漾教授首先指出,人工智能的发展和算法、算力、数据息息相关。随着这几年算法的革新,算力的突破和数据的激增三个维度的协同突破,才有了如今人工智能的繁荣,比如从去年年底到今年年初所备受关注的ChatGPT也是围绕这一领域。据唐漾介绍,将人工智能与实际相结合需要一个本体,比如食堂里的机器人和当下热门的无人驾驶。在有了一个本体之后,才会令人工智能与我们的生活更加紧密。
随后,唐漾向同学们介绍了其在计算机图像深度估计领域取得的研究成果。唐漾首先强调了深度估计的关键地位以及其在各种应用中的不可或缺性:“从人的五官来说,最能获取大量信息的就是视觉,视觉占人类获得信息的85%以上,所以通过视觉来感知场景是一个非常重要的课题,因此深度估计对实时性和精准性有着极高的要求,在众多领域中扮演着关键角色。”随后,他介绍了深度估计主要的挑战是如何在不依赖多个视角或传感器的情况下,仅仅依靠单幅图像来估计场景中的深度信息。唐漾致力于探究单目视觉深度估计的潜力,并根据各种不同场景中的适用性和实时性需求,引入了多模态感知,通过整合来自不同传感器或数据源的信息,提高了深度估计的准确性和鲁棒性。
其次,唐漾介绍了其在自主决策领域取得的研究成果。“感知场景是什么样子之后,我们需要做出合理决策,比如车子要往什么地方开,机械臂要抓什么东西。”唐漾以基于强化学习的无人机激进飞行的实例,介绍了无人机在进行场景感知之后如何进行自身的定位并制定对应决策进行飞行,并展示了完成的无人机飞行试验。
最后,唐漾认为提升无人机的自适应能力,需要在机械机构设计、算法设计等多个层面同时开展,来实现控制决策一体化,从而扩大无人机的应用范围,并展示了无人机在多目标、窄目标等复杂环境中进行自主形态切换取得的研究成果,并详细介绍了其中的难点以及创新点。
在互动环节中,唐漾教授细致解答了现场同学们关于“深度估计与传统距离探测相比的优势之处”“如何理解单帧图像的像素级深度是一个病态的问题”以及“云端处理双目细节的未来前景”等方面的提问,本次讲座在同学们热烈的掌声中圆满结束。