Harry Yang

Give a talk at CMA, HKUST-GZ.

Give a talk at Vibe Coding Hong Kong.

Group gathering at ICLR 2025, Singapore.

AMC BBQ Gathering at Sai Kung

Host "Cosmos Mapping: Unlimited Exploration" Exhibition at NYC

Panel talk at Siggraph asia BOF

Hosted Job Talk by Xiangcheng Kong (Zhejiang TV)

Panel talk at Desci Hong Kong 2026

New Release

SlidesAI

AI PPT and Poster generator.
Turn papers into presentations and posters instantly.

Open Source →

New Release

WanFM

Video interpolation model.
Smooth, high-quality frame interpolation with Wan.

Open Source →

New Release

Wan 2.2 FT and Inference Guide

Comprehensive guide for Wan 2.2 LoRA Training.

View Guide →

Funding

Major Grants

• 2026 HKUST-UStA Global Knowledge Network Awards/Joint Seed Funding
• HKMA GenAI Sandbox (Phase 2)
• GRF/ECS 2025-26
• HKSTP Incubation
• HKUST TSSSU-O
• HKUST-POSTECH Joint Research Seed Grant
• HSBC Sign Language seed grant
• Binance/YZi Labs MVB 7 & 9 Incubation

Teaching

Spring 2026

AMCC 5170: Interactive Visual Art with Generative Models

View Syllabus →

AMCC 6500G: Special Topics on Video Generation

View Syllabus →

Fall 2025

AMCC 5160: AI-Driven Animation and Video Generation.

View Syllabus →

Selected Research

CVPR 2026

Learning Latent Proxies for Controllable Single-Image Relighting

Haoze Zheng, Zihao Wang, Xianfeng Wu, Yajing Bai, Yexin Liu, Yun Li, Xiaogang Xu, Harry Yang

Slides (auto generated using SlidesAI)

CVPR 2026

Group Editing: Edit Multiple Images in One Go

Yue Ma, Xinyu Wang, Qianli Ma, Qinghe Wang, Mingzhe Zheng, Xiangpeng Yang, Hao Li, Chongbo Zhao, Jixuan Ying, Harry Yang, Hongyu Liu, Qifeng Chen

CVPR 2026 (Findings)

DenDiff: Density-Guided Diffusion for Quantity-Aware Image Synthesis

Bo Gao, Haoyu Liang, Harry Yang, Ser-Nam Lim

CVPR 2026 (Findings)

OpenSubject: Leveraging Video-Derived Identity and Diversity Priors for Subject-driven Image Generation and Manipulation

Yexin Liu, Manyuan Zhang, Yueze Wang, Hongyu Li, Dian Zheng, Weiming Zhang, Changsheng Lu, Xunliang Cai, Yan Feng, Peng Pei, Harry Yang

CVPR 2026 (Findings)

TalkVid: A Large-Scale Diversified Dataset for Audio-Driven Talking Head Synthesis

Shunian Chen, Hejin Huang, Yexin Liu, Zihan Ye, Pengcheng Chen, Chenghao Zhu, Michael Guan, Rongsheng Wang, Junying Chen, Jianye Hou, Bo Li, Guanbin Li, Ser-Nam Lim, Harry Yang, Benyou Wang

ICLR 2026

AC-Foley: Reference-Audio-Guided Video-to-Audio Synthesis with Acoustic Transfer

Pengjun Fang, Yingqing He, Yazhou Xing, Qifeng Chen, Ser-Nam Lim, Harry Yang

OpenReview

ICLR 2026

EditAnyShape: Shape-Aware Image Editing via Trajectory-Guided Region Control

Zeqian Long, Mingzhe Zheng, Kunyu Feng, Xinhua Zhang, Hongyu Liu, Harry Yang, Linfeng Zhang, Qifeng Chen, Yue Ma

arXiv

ICLR 2026

Deforming Videos to Masks: Flow Matching for Referring Video Segmentation

Zanyi Wang, Dengyang Jiang, Liuzhuozheng Li, Sizhe Dang, Chengzu Li, Harry Yang, Guang Dai, Mengmeng Wang, Jingdong Wang

arXiv

Technical Report

INT4 Quantization for FlashAttention

Yaofu Liu, Harry Yang

Blog Slides

arXiv 2026

Thinking in Loops: Scaling Visual ARC with Looped Transformers

Wen-Jie Shu, Xuerui Qiu, Rui-Jie Zhu, Harold Haodong Chen, Yexin Liu, Harry Yang

Blog arXiv Slides

Journal of Technology in Behavioral Science

Reducing depressive symptoms through AI-guided narrative self-films: Results from a randomized controlled trial

Elvin Yao, Harry Yang

Slides

arXiv 2025

AlignVid: Training-Free Attention Scaling for Semantic Fidelity in Text-Guided Image-to-Video Generation

Yexin Liu, Wen-Jie Shu, Zile Huang, Haoze Zheng, Yueze Wang, Manyuan Zhang, Ser-Nam Lim, Harry Yang

arXiv Slides

arXiv 2025

Distribution Matching Distillation Meets Reinforcement Learning

Dengyang Jiang, Dongyang Liu, Zanyi Wang, Qilong Wu, Liuzhuozheng Li, Hengzhuang Li, Xin Jin, David Liu, Zhen Li, Bo Zhang, Mengmeng Wang, Steven Hoi, Peng Gao, Harry Yang

arXiv Slides

AAAI 2026 (Poster)

Next Patch Prediction for AutoRegressive Visual Generation

Yatian Pang, Peng Jin, Shuo Yang, Bin Lin, Bin Zhu, Zhenyu Tang, Liuhan Chen, Francis E. H. Tay, Ser-Nam Lim, Harry Yang, Li Yuan

arXiv

COLM 2025

Meta-Learning for Speeding Up Large Model Inference in Decentralized Environments

Yuzhe Yang, Yipeng Du, Ahmad Farhan, Claudio Angione, Yue Zhao, Harry Yang, Fielding Johnston, James Buban, Patrick Colangelo

arXiv

NeurIPS 2025

Hierarchical Fine-Grained Preference Optimization for Physically Plausible Video Generation

Harold Haodong Chen, Haojian Huang, Qifeng Chen, Harry Yang, Ser-Nam Lim

arXiv

NeurIPS 2025

When Semantics Mislead Vision: Mitigating Hallucinations in MLLMs

Yan Shu, Hangui Lin, Yexin Liu, Yan Zhang, Gangyan Zeng, Yan Li, Yu Zhou, Ser-Nam Lim, Harry Yang, Nicu Sebe

arXiv

NeurIPS 2025 NextVid Workshop (Oral)

VideoGen-of-Thought: Step-by-Step Generation of Multi-Shot Videos

Mingzhe Zheng, Yongqi Xu, Haojian Huang, Xuran Ma, Yexin Liu, Wenjie Shu, Yatian Pang, Feilong Tang, Qifeng Chen, Harry Yang, Ser-Nam Lim

Project Page

ICCV 2025

DreamDance: Animating Human Images by Enriching 3D Geometry Cues

Yatian Pang, Bin Zhu, Bin Lin, Mingzhe Zheng, Francis E. H. Tay, Ser-Nam Lim, Harry Yang, Li Yuan

arXiv

ICCV 2025

Model Reveals What to Cache: Profiling-Based Feature Reuse

Xuran Ma, Yexin Liu, Yaofu Liu, Xianfeng Wu, Mingzhe Zheng, Zihao Wang, Ser-Nam Lim, Harry Yang

arXiv

CVPR 2025

Unveiling the Ignorance of MLLMs: Seeing Clearly, Answering Incorrectly

Yexin Liu, Zhengyang Liang, Yueze Wang, Xianfeng Wu, Feilong Tang, Muyang He, Jian Li, Zheng Liu, Harry Yang, Ser-Nam Lim, Bo Zhao

arXiv

ICLR 2025

Intervening Anchor Token: Decoding Strategy in Alleviating Hallucinations

Feilong Tang, Zile Huang, Chengzhi Liu, Qiang Sun, Harry Yang, Ser-Nam Lim

OpenReview

ICLR 2023

Make-A-Video: Text-to-Video Generation without Text-Video Data

Uriel Singer, Adam Polyak, Thomas Hayes, Xi Yin, Jie An, Songyang Zhang, Qiyuan Hu, Harry Yang, Oron Ashual, Oran Gafni, Devi Parikh, Sonal Gupta, Yaniv Taigman

Project Page

ECCV 2022

Long Video Generation with Time-Agnostic VQGAN and Time-Sensitive Transformer

Songwei Ge, Thomas Hayes, Harry Yang, Xi Yin, Guan Pang, David Jacobs, Jia-Bin Huang, Devi Parikh

arXiv

CVPR 2017

High-Resolution Image Inpainting using Multi-Scale Neural Patch Synthesis

Chao Yang, Xin Lu, Zhe Lin, Eli Shechtman, Oliver Wang, Hao Li

arXiv

Highlights

Selected Research

Latest News

Opportunities

The Lab

Current Students

Alumni & Interns