InTimeLab

InTime：INterpret Tongue In Media and Embodiment

研究方向为计算机视觉、多模态人工智能、具身智能、自
然语言处理、大模型与深度学习等，具体主题包括：

可视语言处理、提取与理解
含文字&图形&公式&表格&表单&图表&流程图&思
维导图&地图&线路图&CAD图&乐谱等暨OCR、脑电
、唇动、手势&手语、动作&行为、情感&情绪等
具身与图形用户界面智能体
多模态大模型与内容生成等
深度学习与人工智能安全等

最新消息：
26年03月27日，实验室"面向真机交互的GUI Agent环境搭建与模型优化"项目入选CAAI-腾讯犀牛鸟研究计划！
26年03月24日，祝贺杨东宝老师获聘南开大学软件学院副教授！
26年02月27日，周宇老师担任ACM MM 2026 Area Chair。
26年02月21日，祝贺李庚洛文档解析&端到端翻译、曾翊晨音视频导航、刘亿超GUI定位、陈泽宇多语言场景文本生成共5项工作被CVPR 2026接收！
26年01月31日，实验室2026“见贤思齐”交流活动顺利开展！毕业生曾港艳、乔峙、罗德昭、舒言与部分高年级同学分享科研、工作、生活经验。
26年01月26日，祝贺吴岱卿多模态视觉情感分析评估、音频理解2项工作被ICLR 2026接收！
25年12月15日，祝贺叶启朗入选2025年中国科协青年科技人才培育工程博士生专项计划！
25年11月11日，祝贺张宜飞、李未顺利通过博士学位论文答辩！
25年11月08日，祝贺魏谨场景文本分割、叶启朗音视频大模型幻觉&行为识别、何莲具身可供性共4项工作被AAAI 2026接收！
25年11月05日，祝贺吴岱卿情感分析工作被PR接收！
25年10月16日，周宇老师参加PRCV 2025会议，并做“多模态文档大模型幻觉问题及缓解方法研究”报告。
25年09月19日，祝贺舒言多模态文档大模型幻觉缓解工作被NeurIPS 2025接收！
25年09月16日，周宇老师参加ICDAR 2025国际会议，并与上海交大沈为教授共同在Tutorial环节做"How to Train a Multi-modal Large Document Understanding Model?"报告；与中科大谢洪涛教授、北科大殷绪成教授、南理工曾港艳老师联合组织的Workshop on Visual Text Generation and Text Image Processing成功举办；实验室博士生李增、吕嘉昊参会并分享3项工作。
25年07月11日，祝贺赵方敏文档图像畸变校正工作被ECAI 2025接收！
25年07月05日，祝贺张言视频TextVQA、赵方敏文档图像恢复2项工作被ACM MM 2025接收！
25年06月22日，周宇老师参加2025第二届全国民族古籍文献智能分析学术会议，并做“可视文本智能技术”报告。
25年06月07日，周宇老师参加视觉与学习青年学者研讨会（VALSE）2025-深度连续学习研讨会，并做“增量目标检测：关键挑战与技术进展”报告。
25年06月07日，祝贺张德民（本科二年级）的指定区域检测、李增的手写公式识别和场景文本识别2项工作共3篇论文被ICDAR 2025接收！
25年05月17日，周宇老师参加2025多语言多民族文档智能技术及应用系列论坛，并做“可视文本智能技术”报告。
25年05月15日，祝贺曾维超、谢恩泽顺利通过硕士学位论文答辩！
25年05月09日，周宇老师参加2025中国图象图形大会（CCIG）文字识别与文档智能论坛，并做“可视文本智能技术”报告。
25年05月01日，祝贺吕嘉昊的基于文本块的场景文本检测识别工作被TOMM接收！
25年05月01日，祝贺吴岱卿的多模态大模型情感感知能力评估、李庚洛的中文场景文本检索新基准工作被ICML 2025接收！
25年04月29日，祝贺李未的基于视频生成的数据受限行为理解、曹天骄的统一与长尾场景文本检测数据集工作被IJCAI 2025接收！
25年04月22日，李庚洛、申化文参加的InTimeLab与腾讯HYOCR联队获ICDAR 2025 Competition on End-to-End Document Image Machine Translation Towards Complex Layouts (DIMT 2025 Challenge) OCR-free DIMT (Track 1) Translation-Small 冠军！
25年03月30日，InTimeLab承办的“2025年CSIG文档图像分析与识别专委会多模态大模型与可视文本智能（OCR）学术论坛”顺利召开！论坛邀请刘成林、金连文、谢洪涛、刘禹良、杨春、方山城等专家到南开大学分享研究成果，共有150余位老师、同学及企业同行参会！
25年03月29日，祝贺杨晓萌和乔峙的场景文本识别工作IPAD暨PIMNet++被IJCV接收！
25年03月15日，ICDAR 2025 Workshop on Visual Text Generation and Text Image Processing Call for Papers: https://icdar-vtg-tip.github.io。
25年03月14日，周宇老师担任ACM MM 2025 Area Chair。
25年02月27日，祝贺张宜飞自监督文本识别工作被CVPR 2025接收！
24年12月10日，祝贺申化文/吕嘉昊/张言的多语言VIE/任意阅读顺序文字Spotting/视频TextVQA、张傲婷的增量检测/多标签类增量共5项工作被AAAI 2025接收！
24年09月26日，祝贺曾维超可视文字编辑工作被NeurIPS 2024接收！Spotlight类型报告。

周宇 (Yu ZHOU)