Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

关于icdar13数据集label转换问题 #86

Open
weiren1998 opened this issue Dec 6, 2021 · 0 comments
Open

关于icdar13数据集label转换问题 #86

weiren1998 opened this issue Dec 6, 2021 · 0 comments

Comments

@weiren1998
Copy link

作者您好,首先非常感谢您的开源工作,目前正在尝试复现您的结果,但是中间出现了一些关于数据集的问题,还望解答,谢谢。

  1. 在转换icdar13的GT文件转为json的过程中,是需要把icdar13中的task2.1和task2.2的数据同时转换到json的annotations中吗?
  2. 在转换icdar13中GT文件过程中,请问您一共定义了多少类?因为我看到您给的demo里,只有“text”,“0-9”,“a-z”,"A-Z"。但是自己在处理txt数据时发现,icdar13task2.2中training的GT.txt中,标注了例如“!”,“<”等符号,请问一下这些类别需要转化到json中用于训练吗?
  3. 在转换icdar13中GT文件过程中,请问一下针对于task2.1中的单词的segmentation您是如何定义的?同样的,task2.2中字符的segmentation您是如何定义的?(前者是bbox的四个顶点坐标吗?后者也是四个顶点坐标吗?)
    (ps. 如果方便的话可以将您数据转化的脚本分享一下么?)

再次感谢,期待您的回复

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant