Publications

Most recent publications on Google Scholar.
* denotes co-first authors

2025

ViDove: A Translation Agent System with Multimodal Context and Memory-Augmented Reasoning
Yichen Lu*, Wei Dai*, Jiaen Liu*, Ching Wing Kwok*, Zongheng Wu*, Xudong Xiao, Ao Sun, Sheng Fu, Jianyuan Zhan, Yian Wang, Takatomo Saito, Sicheng Lai
[arxiv] [github]

Not Published

SpeechGPT 2.0-preview
Hanfu Chen, Ke Chen, Qinyuan Cheng, Mingshu Chen, Ruifan Deng, Liwei Fan, Zhaoye Fei, QingHui Gao, Yitian Gong, Ching Wing Kwok, Kexin Huang, Yaozhou Jiang, Xingyu Lu, Shimin Li, Zhengyuan Lin, Ruixiao Li, Qian Tu, Jin Wang, Yang Wang, Siyin Wang, Zhe Xu, Chenchen Yang, Donghua Yu, Yuqian Yao, Yucheng Yuan, Chufan Yu, Dong Zhang, YiWei Zhao, Yuqian Zhang, Jun Zhan, Xin Zhang, Xingjian Zhao, Chengyang Zhu
[article] [github] [website] [huggingface]