详细介绍
- 视觉信息感知主要围绕人类视觉特性,通过心理物理测试等实验手段发现潜在的感知机制,并通过算法实现仿生感知和类脑计算,如探究内隐外显编码对感知行为的影响、提取图像或视频中的视觉关系对,包括数据或任务驱动的显著性预测、语义引导搜索建模、视觉关系预测等研究工作。已发表多篇顶级会议期刊论文,如IEEE TPAMI 2021、JoV 2020、IEEE TCSVT 2019等。
详细介绍
- 视觉信息处理主要关注信息的本质特性,从图像的空间、光谱特性与视频的运动信息等层面出发,分析其底层优化空间并设计算法完成视觉信息的恢复。主要针对图像视频的超分辨率重建,插帧,去噪去模糊与端到端压缩等应用展开工作,并已发表多篇会议期刊论文,如TPAMI 2021、TIP 2020/2022、AAAI 2020等。
详细介绍
- 视觉信息压缩主要通过去除数字信号中的冗余信息从而达到压缩信号的目的,如去除空间冗余、时间冗余、统计冗余以及人眼的视觉系统冗余。研究工作围绕使压缩后的视频信号在相同的质量下获得更高的压缩比为目的开展,主要包括传统的视频编解码优化,基于深度学习、强化学习的视频编解码技术。已发表多篇顶级会议期刊论文,如TIP 2019/2020/2021,并向国内外视频编码标准组织提交了上百份技术提案。
详细介绍
- 视觉信息理解,主要是对图像、视频、VR、UAV、遥感影像等多种视觉数据数据进行分析理解,从而获取感兴趣的信息的过程,例如获取图像中目标的位置、显著性,对视频中感兴趣的目标进行跟踪等。已经开展的研究包括:视频显著性预测、遥感影像卫星视频跟踪、可见光-热红外多模态行人检测等。目前已在TIP、TCSVT、CVPR 2020/2022等期刊会议上发表多篇论文。
详细介绍
- 视觉信息挖掘主要围绕从大量多媒体数据中通过算法搜索隐藏于其中信息的过程,如根据用户-物品交互信息发现用户的偏好,根据短视频的流行度历史数据分析预测将来的数据等,包括推荐系统,流行度分析等应用展开研究工作。已发表多篇顶级会议期刊论文,如WWW 2022、TKDE 2022、TMM 2021等。