人工智能慢慢的变成了引领新一轮科技革命和产业变革的重要驱动力,正在深刻改变着人们的生产、生活和学习方式。面对迅速崛起的人工智能浪潮,如何巩固我国在AI领域的发展优势,促进人工智能不断壮大,成为了一项紧迫的任务。
早在2017年,我国就制定了《新一代AI发展规划》,明确了到2023年,人工智能理论和技术应用总体要达到世界领先水平,成为全世界主要AI创新中心的目标。2022年8月,科技部等六个部门联合印发了《关于加快场景创新以推动人工智能高水平应用促进经济高水平发展的指导意见》。紧接着,科技部又发布了《关于支持建设新一代人工智能示范应用场景的通知》。从国家层面到地方政府,一系列政策和举措相继出台,建立了全面的政策支持体系,以推动AI领域的创新模式和新路径的探索。
数年来,中国在AI领域取得了显著的学术研究成果,各大国际会议上的发表数量也迅速增长。近年来,“大模型”概念逐渐升温,基于大数据的算法在自然语言处理、图像处理等多个领域得到普遍应用,改变了我们对计算机性能的看法。在众多科研机构中,北京大学智能学院的机器感知与智能实验室表现出色,其学术成果得到了学术界的高度认可。该实验室的研究工作不仅令人印象非常深刻,还与当前AI领域引发的产业变革趋势紧密关联。我们采访到了该实验室的成员乔汝坤,他向我们介绍了他的研究项目。
“我们实验室的整体研究是围绕着三维场景重建展开的。这是AI领域下的一个很重要的基础问题,在当今产业界也有着很广泛的应用。”乔汝坤向我们介绍道。乔汝坤本科毕业于北京大学信息科学与技术学院,而后取得本校的直博保研名额进入智能学院进行进一步深造。博士期间,乔汝坤一直关注于三维场景重建领域,在此方向上做出了很多研究贡献。
“在当前的AI领域,大模型如GPT-3、BERT等已经取得了显著的成就,但这些模型在实际应用中仍然面临一些问题,例如需要大量的计算资源、难以泛化到不相同的领域等。而自适应算法或许就是解决这一问题的良方。”有关时下火热的大模型,乔汝坤也提出了他的见解。“现在适用于计算机视觉领域的大模型也出现了不少,除了大家比较熟悉的AI绘画、识图等,在一些基础问题如图像分割,也出现了大模型的算法。但对我们实验室所关注的,涉及到三维空间的重建问题,尤其是带有运动物体的三维重建问题,大模型目前还面临一些挑战。”乔汝坤认为,大模型是AI领域中很值得肯定的一种解决实际问题的方式,但这也不是一个万能通解,对于具体的不同问题会需要有不同的解决方案,才可以更好的满足实际生产生活实践中的需求。
乔汝坤的研究重点在于根据不同的数据和任务自动调整模型的行为,以提高模型的适应性和性能。他的研究基于单目结构光系统,这是一种非常普遍的三维深度传感器。目前市面上的很多现有的这类传感器在进行三维重建时,大多缺乏时间维度信息的利用。而乔汝坤提出了一种新的学习方法。这种学习方法利用投影光图案随物体运动而发生的变化,协助算法完成高精度的三维重建。这种变化信息是首次在该方法中被明确地提出,定义并应用到运动场景的三维重建问题中的,乔汝坤将这种光度信息命名为“模式流”(Pattern Flow)。该方法的主要贡献在于它能够灵活应对不同情境,为基于深度学习算法的大模型应用提供更多的可行性和可持续性。
目前,乔汝坤已经在该领域发表了两篇国际会议论文。这些学术成果不仅在学术界引起广泛关注,还为自适应算法在深度学习相关应用中处理问题提供了有力的理论支持和实际经验。“我们的研究大多分布在在三维重建领域,这是计算机视觉领域的一个重要方向。尽管大家目前更熟悉自然语言处理方面的大模型应用,但我相信视觉领域的大模型应用也已经在发展中,很快将会有相关这类的产品问世。”乔汝坤对视觉领域的大模型应用充满信心,同时他也认为将自适应性原则引入到三维重建问题中,可以明显提高现有算法的精度,为后续应用提供更高质量的三维数据支持。
乔汝坤等人的研究工作为当前AI领域的逐步发展和创新提供了有益的参考,同时也与产业变革趋势相契合,将大模型的应用推向新的高度。他们的工作不仅对北京大学的计算机视觉领域研究具备极其重大意义,还对整个AI领域的未来产生了积极的影响。我们期待着看到他们未来更多的研究成果,以及他们对产业变革的贡献。