InTime:INterpret Text In MEdia

InTime:文附图,一图胜千言;景嵌字,数字藏万象。

研究方向为计算机视觉、多模态人工智能、深度学习与人工智能安全,专注于:

  • 可视文字处理、提取与理解(Visual Text,含场景/文档图像文字等)

  • 多模态大模型与内容生成等

  • 自监督、增量与对抗学习等

招生:2025年硕转博1名,感兴趣者提前联系yzhouhit@163.com。

张宜飞论文被TMM 2024录用!

周宇老师参加CSIG文档图像分析与识别专委会2023年学术年会并作报告。

方波论文被ICCV 2023录用!

杨东宝、秦绪功、曾港艳、舒言论文被ACM MM 2023录用!

申化文论文被IJCAI 2023录用!

杨东宝论文被AAAI 2023录用!