Chaoyou Fu

Researcher & Assistant Professor & PhD Supervisor
Nanjing University

Google Scholar | GitHub
Email: alt text

Biography

傅朝友，南京大学智能科学与技术学院研究员、助理教授、博导，入选中国科协“青年人才托举工程”。2022年博士毕业于中科院自动化所模式识别实验室。研究方向为多模态内容分析，谷歌学术引用1万余次，2篇一作单篇引用过千次，7篇一作单篇引用过百次，开源项目累计获得2万余次GitHub Stars。代表性工作包括VITA多模态大模型系列（VITA-1.0/-1.5、VITA-Audio），MME多模态评测基准系列（MME、Video-MME/-v2）和Awesome-MLLM等。担任Pattern Recognition/IEEE T-BIOM期刊编委、ICLR/ICML会议领域主席、CSIG青工委委员、CCF-AI/-CV专委会执行委员。曾获小米青年学者-科技创新奖、华为紫金学者、世界人工智能大会云帆奖、中科院院长特别奖、IEEE Biometrics Council Best Doctoral Dissertation Award、北京市优博、中科院优博、CVPR 2023杰出审稿人。

alt text

Selected Publications

Video-MME-v2: Towards the Next Stage in Benchmarks for Comprehensive Video Understanding
Chaoyou Fu [Project Leader], Haozhi Yuan, Yuhao Dong, Yi-Fan Zhang, et al
arXiv 2026, Project

Omni-Diffusion: Unified Multimodal Understanding and Generation with Masked Discrete Diffusion
Lijiang Li, Zuwei Long, Yunhang Shen, Heting Gao, Haoyu Cao, Xing Sun, Caifeng Shan, Ran He, Chaoyou Fu [Corresponding Author]
ICML 2026, Project

VITA-E: Natural Embodied Interaction with Concurrent Seeing, Hearing, Speaking, and Acting
Xiaoyu Liu, Chaoyou Fu [Corresponding Author], Chi Yan, Chu Wu, et al
arXiv 2025, Project

VITA-Audio: Fast Interleaved Cross-Modal Token Generation for Efficient Large Speech-Language Model
Zuwei Long, Yunhang Shen, Chaoyou Fu [Corresponding Author], Heting Gao, et al
NeurIPS 2025, Code

VITA-1.5: Towards GPT-4o Level Real-Time Vision and Speech Interaction
Chaoyou Fu [Project Leader], Haojia Lin, Xiong Wang, Yi-Fan Zhang, et al
NeurIPS 2025 [Spotlight], Code [2k+ Stars 🌟]

VITA: Towards Open-Source Interactive Omni Multimodal LLM
Chaoyou Fu [Project Leader], Haojia Lin, Zuwei Long, Yunhang Shen, et al
arXiv 2024, Project

MME-Survey: A Comprehensive Survey on Evaluation of Multimodal LLMs
Chaoyou Fu [Project Leader], Yi-Fan Zhang, Shukang Yin, Bo Li, et al
arXiv 2024, Project

Video-MME: The First-Ever Comprehensive Evaluation Benchmark of Multi-modal LLMs in Video Analysis
Chaoyou Fu [Project Leader], Yuhan Dai, Yongdong Luo, Lei Li, Shuhuai Ren, Renrui Zhang, et al
CVPR 2025, Project

MME: A Comprehensive Evaluation Benchmark for Multimodal Large Language Models
Chaoyou Fu [Project Leader], Peixian Chen, Yunhang Shen, Yulei Qin, Mengdan Zhang, Xu Lin, et al
NeurIPS DB 2025 [Spotlight], Leaderboard [with 50+ MLLMs 🌟], Citation

A Survey on Multimodal Large Language Models
Shukang Yin, Chaoyou Fu [Project Leader], Sirui Zhao, Ke Li, Xing Sun, Tong Xu, and Enhong Chen
National Science Review 2024, Project [10k+ Stars 🌟], Citation

Woodpecker: Hallucination Correction for Multimodal Large Language Models
Shukang Yin, Chaoyou Fu [Project Leader], Sirui Zhao, Tong Xu, et al
arXiv 2023, Code [500+ Stars 🌟]

APE: Aligning and Prompting Everything All at Once for Universal Visual Perception
Yunhang Shen, Chaoyou Fu, Peixian Chen, Mengdan Zhang, Ke Li, Xing Sun, Yunsheng Wu, et al
CVPR 2024, Code [500+ Stars 🌟]

DVG-Face: Dual Variational Generation for Heterogeneous Face Recognition
Chaoyou Fu, Xiang Wu, Yibo Hu, Huaibo Huang, and Ran He
TPAMI 2022, Code

CM-NAS: Cross-Modality Neural Architecture Search for Visible-Infrared Person Re-Identification
Chaoyou Fu, Yibo Hu, Xiang Wu, Hailin Shi, Tao Mei, and Ran He
ICCV 2021, Code

Academic Services

Area Chair: ICLR, ICML
Associate Editor: Pattern Recognition, IEEE T-BIOM
Conference Reviewer: NeurIPS, ICLR, CVPR, ICCV, ECCV, AAAI, ACM MM, IJCAI
Journal Reviewer: IEEE TPAMI, IJCV, IEEE TIP

Honors and Awards

[2026.04] NSR 2025年度优秀论文（信息科学1/3）
[2025.07] 世界人工智能大会（WAIC）云帆奖·明日之星
[2025.04] 南京大学紫金学者
[2025.03] 第十届中国科协青年人才托举工程
[2024.11] 小米青年学者-科技创新奖
[2023.12] 北京市优秀博士学位论文
[2023.08] 中国科学院优秀博士学位论文
[2023.07] IEEE Biometrics Council Best Doctoral Dissertation Award
[2023.07] CVPR 2023 Outstanding Reviewer (232/7000+)
[2022.07] 中国科学院院长特别奖
[2022.07] 北京市优秀毕业生
[2021.12] 2022年“腾讯技术大咖”计划-T10
[2021.12] 2022年“阿里星”计划-P7
[2021.12] 博士研究生国家奖学金
[2021.11] 宝钢奖学金优秀学生奖
[2019.12] 硕士研究生国家奖学金
[2017.06] 安徽省优秀毕业生
[2015.11] 本科生国家奖学金
[2015.08] “飞思卡尔”杯全国大学生智能汽车竞赛全国总决赛二等奖