InTime:INterpret Text In MEdia
InTime:文附图,一图胜千言;景嵌字,数字藏万象。
研究方向为计算机视觉、多模态人工智能、深度学习与人工智能安全,专注于:
可视文字处理、提取与理解(Visual Text,含场景/文档图像文字等)
多模态大模型与内容生成等
自监督、增量与对抗学习等
张宜飞论文被TMM 2024录用!
周宇老师参加CSIG文档图像分析与识别专委会2023年学术年会并作报告。
方波论文被ICCV 2023录用!
杨东宝、秦绪功、曾港艳、舒言论文被ACM MM 2023录用!
申化文论文被IJCAI 2023录用!
杨东宝论文被AAAI 2023录用!