Skip to content

基于百度ERNIE和Pycorrector的文本编辑和批改的软件

Notifications You must be signed in to change notification settings

fiyen/PaddlePaddle-DocCRT

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

PaddlePaddle-DocCRT: 可视化文档纠错工具

本项目推出一个可视化的文档纠错工具,该工具可以实现简单的文档编辑和查错纠错功能。该项目github链接为https://github.com/fiyen/PaddlePaddle-DocCRT 欢迎多多fork。

注:此项目文档编辑部分参考了项目Doc,文档纠错部分使用了超过fork数超过2k的PyCorrector

2021/12/3: 新增截图识别文字功能 (由shaoshenchen贡献)

2022/05/9: python 版本要求: 3.7 (3.9会报错)

使用教程

下载安装

通过git命令下载该项目,并解压。

!git clone https://github.com/fiyen/PaddlePaddle-DocCRT.git

运行

由于该项目需要调用PySide2实现界面操作,无法在线运行,感兴趣的话可以下载下来运行。

#使用以下命令运行
!cd PaddlePaddle-DocCRT
!python main.py

运行成功后,将进入以下界面:

可以直接点击/双击空白处进行文档编辑,效果如下:

也可以直接复制粘贴(ctrl+v)相关内容。在编辑结束后,点击左上角功能栏“批”按键进行文本自动修改,第一次点击可能时间较长。

批改结束后,软件判断错误的地方会被标红:

在标红的地方鼠标右击,会弹出功能窗口,除了“忽略此错误”和“撤销此更改”外,剩余部分为待选更正项,点击即可进行更正。

更正完成后,点击右上角功能栏的“定”按钮,即可接受已经进行的更改,将被标错误的文字恢复正常格式。

处理纠错功能之外,工具还具备常见的一些文字编辑功能,如设置字体,大小,斜体,粗体,字体颜色以及背景颜色等。

此外,工具支持了截图文本识别的功能,操作如下:

首先,用windows截图快捷命令Alt + A进行截图;待截图完成后,点击右上角"截"功能按钮,等待识别完成;完成后,使用Ctrl + V快捷键将内容粘贴到文本栏即可。

总结和展望

本项目是一个简单的工具实例demo,具体功能欢迎fork项目进行了解。以后将增加的内容包括:

  1. 增加txt文档导入,导出
  2. 增加word文档导入,导出
  3. 增加批改模型选择(目前固定为ErnieModel)

欢迎感兴趣的开发者更改和完善并提交pr,谢谢谢谢!

About

基于百度ERNIE和Pycorrector的文本编辑和批改的软件

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published