InTime:INterpret Tongue In MEdia


Slogan:文附图,一图胜千言;景嵌字,数字藏万象。

研究方向为计算机视觉、多模态人工智能、自然语言处理、深度学习与
大模型等,专注于:

  • 可视语言处理、提取与理解(Visual Tongue,含文字、图形、脑电、
    手势、唇动等)
  • 多模态大模型与内容生成等
  • 自监督、增量与对抗学习等
最新消息:

【博士招生】 招生25级硕博连读或申请考核制博士生1名;
【学硕招生】 25年推免拟招生26级学术型硕士生2名;
【东北师大硕士招生】 拟招生东北师范大学25级硕士生;
【本科实习】欢迎南开大学津南校区本科生进组实习!

2024年12月10日,祝贺申化文、吕嘉昊、张言的多语言VIE、任意阅读顺序文字Spotting、视频TextVQA,张傲婷的增量检测、多标签类增量5项工作被AAAI 2025接收!

2024年09月26日,祝贺曾维超可视文字编辑工作被NeurIPS 2024接收!Spotlight类型报告。

2024年07月15日,祝贺曾港艳CLIP4SceneTextRetrieval、吴岱卿2项多模态情感分析工作共3篇论文被ACM MM 2024接收!

2024年07月04日,祝贺李祯航可视文字生成工作被ECAI 2024录用!