Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

目标检测只能返回坐标,可以返回识别出的对象的内容嘛 #156

Open
cyqresig opened this issue Dec 20, 2023 · 6 comments

Comments

@cyqresig
Copy link

cyqresig commented Dec 20, 2023

网易点选汉字

如上图,请问现在最新的 1.4.0 版本,看文档介绍,目标检测只能返回坐标,
有没有办法将识别出的对象的内容也返回出来?(比如文字或图形符号)

poses = det.detection(image)

print(poses)

[[0, 345, 30, 376], [28, 346, 59, 378], [57, 345, 88, 375], [2, 181, 67, 250], [121, 163, 188, 229], [223, 119, 291, 187]]

以上为尝试 API 的返回结果,目前识别成功后,只能返回坐标

@BadDeveloper2022
Copy link

同问
@kerlomz

@alair074
Copy link

+1

@chengxiang123aa
Copy link

您好,请问有解决方案吗?

@zixing131
Copy link

先识别出对象,再切图进行文字识别

@chengxiang123aa
Copy link

先识别出对象,再切图进行文字识别

你好,我尝试过,我觉得ddddocr的目标检测做的很好,位置信息识别很准,但是识别的文字效果太差,根据位置信息切分出来的图片基本不能识别正确。不知道你有没有什么比较好的解决方案,还是说得自己去训练推理模型呢。

@zixing131
Copy link

先识别出对象,再切图进行文字识别

你好,我尝试过,我觉得ddddocr的目标检测做的很好,位置信息识别很准,但是识别的文字效果太差,根据位置信息切分出来的图片基本不能识别正确。不知道你有没有什么比较好的解决方案,还是说得自己去训练推理模型呢。

你这个文字被旋转变形了,可以自己预处理一下文字然后自己训练或者尝试直接对比文字图像,用图像对比的算法

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

5 participants