InTime:INterpret Tongue In MEdia


Slogan:文附图,一图胜千言;景嵌字,数字藏万象。

研究方向为计算机视觉、多模态人工智能、自然语言处理、
大模型、具身智能与深度学习等,具体主题包括:

  • 可视语言处理、提取与理解(含文字&图形&公式&
    表格&表单&图表&流程图&思维导图&地图&线路图
    &CAD图等暨OCR、脑电、唇动、手势&手语、动作
    &行为、情感&情绪等)
  • 多模态大模型与内容生成等
  • 增量、自监督与对抗学习等
  • 图形用户界面与具身智能体
最新消息:

25年05月17日,周宇老师参加2025多语言多民族文档智能技术及应用系列论坛,并做“可视文本智能技术”报告。
25年05月15日,祝贺曾维超、谢恩泽顺利通过硕士学位论文答辩!
25年05月09日,周宇老师参加2025中国图象图形大会(CCIG)文字识别与文档智能论坛,并做“可视文本智能技术”报告。
25年05月01日,祝贺吕嘉昊的基于文本块的场景文本检测识别工作被TOMM接收!
25年05月01日,祝贺吴岱卿的多模态大模型情感感知能力评估、李庚洛的中文场景文本检索新基准工作被ICML 2025接收!
25年04月29日,祝贺李未的基于视频生成的数据受限行为理解、曹天骄的统一与长尾场景文本检测数据集工作被IJCAI 2025接收!
25年04月22日,李庚洛、申化文参加的InTimeLab与腾讯HYOCR联队获ICDAR 2025 Competition on End-to-End Document Image Machine Translation Towards Complex Layouts (DIMT 2025 Challenge) OCR-free DIMT (Track 1) Translation-Small 冠军
25年03月30日,InTimeLab承办的“2025年CSIG文档图像分析与识别专委会多模态大模型与可视文本智能(OCR)学术论坛”顺利召开!论坛邀请刘成林、金连文、谢洪涛、刘禹良、杨春、方山城等专家到南开大学分享研究成果,共有150余位老师、同学及企业同行参会!
25年03月29日,祝贺杨晓萌和乔峙的场景文本识别工作IPAD暨PIMNet++被IJCV接收!
25年03月15日,ICDAR 2025 Workshop on Visual Text Generation and Text Image Processing Call for Papers: https://icdar-vtg-tip.github.io
25年03月14日,周宇老师担任ACM MM 2025 Area Chair
25年02月27日,祝贺张宜飞自监督文本识别工作被CVPR 2025接收!
24年12月10日,祝贺申化文/吕嘉昊/张言的多语言VIE/任意阅读顺序文字Spotting/视频TextVQA、张傲婷的增量检测/多标签类增量共5项工作被AAAI 2025接收!
24年09月26日,祝贺曾维超可视文字编辑工作被NeurIPS 2024接收!Spotlight类型报告。
24年07月15日,祝贺曾港艳CLIP场景文本检索、吴岱卿2项多模态情感分析共3项工作被ACM MM 2024接收!