博士生 · VIPL 实验室 · 中国科学院计算技术研究所

Zuyan Zhao 赵祖妍

我关注世界模型、图像生成与通用视觉感知，当前重点研究基于扩散模型的 foundation-adapter 系统，以及具有物理一致性的生成式世界模型。

邮箱 UniPercept GitHub

研究方向: 世界模型、扩散模型、视觉感知
导师: 陈熙霖
地点: 中国北京

研究

构建能够感知、生成并理解运动规律的模型。

统一视觉感知

探索可扩展到多任务、多视觉域的 foundation-adapter 感知框架。

世界模型

研究更符合运动、碰撞、摩擦、自由落体等物理规律的视频生成模型。

扩散模型训练

设计提升早期语义轮廓形成速度与模型收敛效率的训练策略。

动态

近期更新

2026

UniPercept 为 CVPR 2026 一作论文。

2025

获得中国科学院大学三好学生与一等学业奖学金。

2024.09

进入中国科学院计算技术研究所攻读博士学位。

论文

代表工作

CVPR 2026 · 一作

UniPercept: A Unified Diffusion Model for Generalizable Visual Perception

UniPercept 提出了一个用于通用且可扩展视觉感知的 foundation-adapter 框架：共享的扩散基础模型学习跨视觉域的通用感知表征，轻量级任务适配器捕捉每类感知任务的独特特征。

该系统目前支持 14 类视觉感知任务，并能够以较低计算与数据成本高效适配新任务。

项目主页

项目

科研项目

进行中

物理一致的世界模型

围绕物理一致的生成式世界模型开展研究，探索利用视频生成学习真实世界中的时空演化规律，提升模型对运动、碰撞、摩擦、自由落体等牛顿物理规律的遵循能力。

设计动作特定的不变量指标，评估速度、加速度、动量、能量和轨迹合理性。
接入 SAM2 提取视频物体轨迹，对比视觉追踪轨迹与物理状态轨迹误差。

教育

教育背景

2024.09 - 至今

中国科学院计算技术研究所

计算机科学与技术博士在读，VIPL 实验室。GPA: 3.87 / 4.00。

2020.09 - 2024.07

东南大学

计算机科学与技术学士。GPA: 3.76 / 4.00，综合排名 6 / 113。

荣誉

获奖经历

2025

中国科学院大学三好学生；一等学业奖学金。

2023

中国大学生程序设计竞赛女生赛，金奖。

2023

挑战杯揭榜挂帅，铜奖。

2023

江苏省程序设计竞赛，银奖。

2021

全国大学生数学竞赛二等奖；江苏省高等数学竞赛二等奖。