博士生 · VIPL 实验室 · 中国科学院计算技术研究所

Zuyan Zhao 赵祖妍

我关注世界模型、图像生成与通用视觉感知,当前重点研究基于扩散模型的 foundation-adapter 系统,以及具有物理一致性的生成式世界模型。

研究方向
世界模型、扩散模型、视觉感知
导师
陈熙霖
地点
中国北京

研究

构建能够感知、生成并理解运动规律的模型。

统一视觉感知

探索可扩展到多任务、多视觉域的 foundation-adapter 感知框架。

世界模型

研究更符合运动、碰撞、摩擦、自由落体等物理规律的视频生成模型。

扩散模型训练

设计提升早期语义轮廓形成速度与模型收敛效率的训练策略。

动态

近期更新

UniPercept 为 CVPR 2026 一作论文。

获得中国科学院大学三好学生与一等学业奖学金。

进入中国科学院计算技术研究所攻读博士学位。

论文

代表工作

UniPercept 多任务视觉感知结果示意图

CVPR 2026 · 一作

UniPercept: A Unified Diffusion Model for Generalizable Visual Perception

UniPercept 提出了一个用于通用且可扩展视觉感知的 foundation-adapter 框架:共享的扩散基础模型学习跨视觉域的通用感知表征,轻量级任务适配器捕捉每类感知任务的独特特征。

该系统目前支持 14 类视觉感知任务,并能够以较低计算与数据成本高效适配新任务。

项目

科研项目

进行中

物理一致的世界模型

围绕物理一致的生成式世界模型开展研究,探索利用视频生成学习真实世界中的时空演化规律,提升模型对运动、碰撞、摩擦、自由落体等牛顿物理规律的遵循能力。

  • 设计动作特定的不变量指标,评估速度、加速度、动量、能量和轨迹合理性。
  • 接入 SAM2 提取视频物体轨迹,对比视觉追踪轨迹与物理状态轨迹误差。

教育

教育背景

中国科学院计算技术研究所

计算机科学与技术博士在读,VIPL 实验室。GPA: 3.87 / 4.00。

东南大学

计算机科学与技术学士。GPA: 3.76 / 4.00,综合排名 6 / 113。

荣誉

获奖经历

中国科学院大学三好学生;一等学业奖学金。

中国大学生程序设计竞赛女生赛,金奖。

挑战杯揭榜挂帅,铜奖。

江苏省程序设计竞赛,银奖。

全国大学生数学竞赛二等奖;江苏省高等数学竞赛二等奖。