[English Version]

可视计算是一个统称,涵盖所有处理图像和三维模型的计算机科学学科,例如计算机图形学、图像处理、可视化、计算机视觉、虚拟现实、增强现实、视频处理以及计算视觉学。 可视计算还包括模式识别、人机交互、机器学习和数字图书馆等方面的内容。 其核心挑战在于视觉信息(主要是图像和视频)的获取、处理、分析和渲染。 应用领域包括工业质量控制、医学图像处理与可视化、测绘、机器人技术、多媒体系统、虚拟遗产、电影电视特效以及游戏学。 可视计算还涉及数字艺术和数字媒体研究。(来源:维基百科

南京理工大学可视计算团队的研究领域主要涉及计算机视觉计算机图形学图像处理虚拟现实增强现实等领域,同时也包括模式识别机器学习等方面的内容。 这些不同方向均聚焦于视觉信息(主要包括点云、网格、图像和视频)的处理:获取、处理、表示、分析、理解与渲染。 在研究中,我们将可视计算视为一个闭环:分析方法(即计算机视觉)从视觉数据(如图像、三维形状)中提取丰富的场景模型,而合成方法(即计算机图形学)将这些模型转换回可观测的视觉数据。 这个闭环的两侧相互促进:对视觉数据的分析有助于构建和学习更好的合成方法(如生成对抗网络),而这些合成模型的输出又有助于构建和学习更好的分析方法(如用于计算机视觉的合成训练数据)。

我们目前的研究重点主要聚焦于:1)三维视觉,2)三维建模与数据合成,3)视觉信息质量评价,4)虚拟现实与增强现实。 其他方面的工作还包括:1)AIGC中的安全与隐私,2)图像理解与处理。

三维视觉

三维视觉是计算机视觉的一个子领域,专注于使机器能够从视觉数据中感知、理解和重建世界的三维结构。 其核心研究涵盖了从二维输入(如单幅或多视角图像、视频或深度传感器)到三维表示(包括点云、网格、体素场以及神经辐射场等神经隐式表示)的完整流程。 该领域借助深度学习、可微渲染和基础模型来弥合二维感知与物理三维现实之间的鸿沟。 通过对几何、纹理和空间关系进行建模,三维视觉将二维视觉信号与现实世界的空间理解相连接,支持在复杂环境中实现精准的感知与交互。 三维视觉的应用领域包括自动驾驶、机器人技术、增强现实、医学影像和虚拟现实等领域。 目前我们在三维视觉方向主要聚焦于三维理解三维重建的相关研究工作。

点云分割
点云采样
点云压缩
点云识别
点云分类
三维重建
细小物体重建

三维建模与数据合成

三维建模与数据合成专注于数字化的几何形状、外观和动态场景的表示,以及生成逼真且多样化的视觉内容。 三维建模的研究传统上涵盖几何处理——如点云去噪、采样和表面重建——以将原始传感器数据转换为拓扑一致的网格或体素网格。当前三维建模的重点已转向神经表示,利用神经辐射场(NeRF)和三维高斯溅射(3DGS)将复杂场景编码为连续函数,以实现照片级逼真的合成。 数据合成旨在通过程序化生成、生成式模型和可微渲染来生成高质量的合成图像、纹理、材质以及完整的三维资产。 目前我们在三维建模与数据合成方向主要聚焦于三维模型处理三维内容生成多光谱图像合成的相关研究工作。

点云去噪
网格去噪
三维高斯泼溅
神经辐射场
点云生成
网格生成
红外图像合成
可见光图像合成

视觉信息质量评价

视觉信息质量评价致力于设计客观和主观的度量指标,用以量化数字内容的感知保真度、几何保真度、结构完整性以及物理真实感。 该领域架起了机器感知与人类视觉之间的桥梁,为自动驾驶、三维重建和沉浸式媒体等领域的采集、传输与重建系统优化提供了理论指导和量化工具。 目前我们在视觉信息质量评估方向主要聚焦于点云质量评价AIGC质量评价多光谱合成图像质量评价的相关研究工作。

点云质量评价
红外图像质量评价
AIGC质量评价

虚拟与增强现实

虚拟现实
虚拟现实
虚拟现实
增强现实
增强现实
增强现实

AIGC安全与隐私

三维高斯泼溅
神经辐射场

图像理解与处理

小目标检测
缺陷检测