新一代通用视觉技术体系正式公布核心任务覆盖更加全面到位

来源：IT之家　2021-11-18 16:45:00

IT之家 11 月 18 日消息，昨日，上海人工智能实验室联合商汤科技 SenseTime、香港中文大学、上海交通大学共同发布新一代通用视觉技术体系“书生”(INTERN)。

该体系旨在系统化解决当下人工智能视觉领域中存在的任务通用、场景泛化和数据效率等一系列瓶颈问题。

目前，技术报告《INTERN: A New Learning Paradigm Towards General Vision》已在 arXiv 发布，基于“书生”的 OpenGVLab 也将在明年年初正式开源，向学术界和产业界公开预训练模型及其使用范式、数据系统和评测基准等。

根据相关技术报告，一个“书生”基模型即可全面覆盖分类、目标检测、语义分割、深度估计四大视觉核心任务。

上海人工智能实验室表示，相较于当前最强开源模型(OpenAI 于 2021 年发布的 CLIP)，“书生”在准确率和数据使用效率上均取得大幅提升。

推荐DIY文章

新一代通用视觉技术体系正式公布 核心任务覆盖更加全面到位