Shang-Wen Daniel Li's picture

15 29

Shang-Wen Daniel Li

swdanielli

·

https://swdanielli.github.io

AI & ML interests

Large foundation models, vision and language multimodal, and pretraining and self-supervised training

Recent Activity

upvoted a collection about 1 hour ago

authored a paper 10 days ago

TV2TV: A Unified Framework for Interleaved Language and Video Generation

liked a model 15 days ago

facebook/metaclip-2-worldwide-s16-384

View all activity

Organizations

Papers 20

arxiv:2512.05103

arxiv:2507.22062

arxiv:2502.09604

arxiv:2410.17251

models 1

swdanielli/Qwen2-VL-2B-Instruct-SFT

datasets 0

None public yet