Skip to content

Latest commit

 

History

History
183 lines (121 loc) · 11.5 KB

README_zh-CN.md

File metadata and controls

183 lines (121 loc) · 11.5 KB

English | 简体中文

🥳 🚀 欢迎来到 OpenMMLab Playground , 一个用于收集和展示 OpenMMLab 相关前沿和有趣应用的项目,旨在为社区搭建分享创新技术方案、玩转 OpenMMLab 的平台。

🥳 🚀 AI 领域日新月异,OpenMMLab 作为深度学习领域头部社区始终秉持着拥抱变化、拥抱社区的理念,致力于不断推动 AI 技术的发展和创新。 秉承着开放、透明、合作的原则,我们鼓励社区成员参与到项目中来。我们相信,基于 OpenMMLab 提供的丰富算法能力和强大技术社区,每一位开发者都可以参与到 AI 技术的边界探索和应用实践中来。

🥳 🚀 希望 OpenMMLab Playground 可以成为广大社区成员的开源自留地,共同分享、碰撞灵感,AI 新乐园,有你也有我!


更新

🥳 🚀 我们新增了一个基于 DetGPT 项目,其是一个无需训练的仿真版本,可以进行推理式目标检测。具体见 DetGPT

项目列表

示例 说明
MMDet-SAM 目标检测检测相关模型 + SAM。将闭集目标检测、开放词汇目标检测、 Grounding 目标检测和 SAM 结合探索实例分割新玩法
DetGPT 视觉语言多模态 + Grounding。将视觉语言多模态如 MiniGPT-4 和 Grounding 结合探索推理式目标检测新方向
MMRotate-SAM 旋转框检测相关模型 + SAM。 将 SAM 和弱监督即水平框检测联合实现旋转框检测,从此省掉累人的旋转框标注
Open-Pose-Detection 开放目标检测 + mmpose。探索开放目标检测和各类姿态估计算法结合实现万物皆可摆 Pose
Open-Tracking 开放目标检测 + tracking。探索开放目标检测和视频任务相结合,轻松实现开放类别的视频跟踪和分割
MMOCR-SAM 端到端文字检测识别 + SAM,将每一个字符都进行分割。使用基于 Gradio 的 Web UI 探索有趣的 OCR 下游任务,包括文本擦除、文本编辑
MMEditing-SAM 将 SAM 和图像生成结合起来从而对图像进行任意位置的编辑修改
Label-Studio-SAM 将 Label-Studio 和 SAM 结合实现半自动化标注

下面详细说明。

项目展示

✨ MMDet-SAM

提供了和 MMDet 相关的结合 SAM 的应用。具体特性包括:

  1. 支持 MMDet 中包括的所有检测模型 (Closed-Set),典型的如 Faster R-CNN 和 DINO 等串联 SAM 模型进行自动检测和实例分割标注
  2. 支持 Open-Vocabulary 检测模型,典型的如 Detic 串联 SAM 模型进行自动检测和实例分割标注
  3. 支持 Grounding Object Detection 模型,典型的如 Grounding DINO 和 GLIP 串联 SAM 模型进行自动检测和实例分割标注
  4. 所有模型均支持分布式检测和分割评估和自动 COCO JSON 导出,方便用户对自定义数据进行评估

详情见 README

✨ Det-GPT

基于 DetGPT 原理,提供了一个无需训练的仿真版本:

  1. 提供了 DetGPT 原理说明
  2. 基于 MiniGPT-4 简单探索了使用无需专门微调的多模态算法进行推理式目标检测的可能性
  3. 基于 ChatGPT3 实现了推理式目标检测,Grounding 检测算法支持 Grounding DINO 和 GLIP

详情见 README

✨ MMRotate-SAM

提供了和 MMRotate 相关的结合 SAM 的应用。具体特性包括:

  1. 支持 SAM 的 Zero-shot Oriented Object Detection
  2. 对单张图片进行 SAM 的 Zero-shot Oriented Object Detection 推理

详情见 README

✨ Open-Pose-Detection

提供了和 MMPose 相关的结合开放检测的应用。具体特性包括:

  1. 支持单张图片或者文件夹的开放检测和姿态估计模型推理
  2. 即将支持输入不同的 text prompt 实现对图片中不同类别物体的姿态检测

详情见 README

✨ Open-Tracking

提供了基于开放目标检测,并利用运动信息(卡尔曼滤波器)来进行多目标跟踪。

详情见 README

✨ MMOCR-SAM

该仓库搬运自 OCR-SAM。我们将 MMOCR 与 SAM 结合,并提供了以下功能。

  1. 支持端到端的文字检测识别,并可以将每一个文本字符都进行分割。
  2. 提供基于 diffusion 模型以及 Gradio 的 Web UI,可以探索有趣的 OCR 下游任务,包括文本擦除、文本编辑等。

详情见 README

✨ MMEditing-SAM

提供了和 MMEditing 相关的结合 SAM 的应用。具体特性包括:

  1. 使用 MMEDiting 的接口生成图片。
  2. 结合 SAM 生成的 mask 与 MMEditing 的图像编辑能力创造新的图片。

详情见 README

✨ Label-Studio-SAM

提供了和 Label Studio 相关的结合 SAM 的应用。具体特性包括:

  1. Point2Label:支持在 Label-Studio 通过点击物体区域的一点来触发 SAM 生成物体的掩码和水平边界框标注生成。
  2. Bbox2Label:支持在 Label-Studio 通过标注物体的边界框来触发 SAM 生成物体掩码和水平边界框标注生成。
  3. Refine: 支持在 Label-Studio 上对 SAM 生成的标注进行修正。

详情见 README

❤️ 欢迎加入 OpenMMLab 社区

扫描下方的二维码可关注 OpenMMLab 团队的 知乎官方账号,扫描下方微信二维码添加喵喵好友,进入微信交流社群。【加好友申请格式:研究方向+地区+学校/公司+姓名】

我们会在 OpenMMLab 社区为大家

  • 📢 分享 AI 框架的前沿核心技术
  • 💻 解读 PyTorch 常用模块源码
  • 📰 发布 OpenMMLab 的相关新闻
  • 🚀 介绍 OpenMMLab 开发的前沿算法
  • 🏃 获取更高效的问题答疑和意见反馈
  • 🔥 提供与各行各业开发者充分交流的平台

干货满满 📘,等你来撩 💗,OpenMMLab 社区期待您的加入 👬