tesseract

A small lightweight HTTP server that converts photos, images and scanned documents to text using optical character recognition by utilizing the power of Google Tesseract.

api docker typescript ocr docker-compose containers rest-api docker-image container image-processing tesseract http-server hacktoberfest tesseract-server

Updated May 30, 2024
TypeScript

goksenpasli / GpScanner

Star

Twain Scanner Application

pdf scanner wpf tesseract udf eyp win10 twain tarayici win7 win11

Updated May 29, 2024
C#

CCExtractor / ccextractor

Star

CCExtractor - Official version maintained by the core team

c rust image ocr video image-processing tesseract subtitles tesseract-ocr dvb teletext hacktoberfest cea-608 cea-708 hacktoberfest2021

Updated May 29, 2024
C

Akylas / OSS-DocumentScanner

Sponsor

Star

Android document document scanning app

android pdf opencv scanner image-processing tesseract document document-scanner document-scanner-app document-scanning document-scan document-scan-to-text zxingcpp

Updated May 31, 2024
C++

hamidurrk / epaper-scraper

Star

Web scraper for extracting data from online newspapers

python tesseract asynchronous-programming sqlite3 lxml webscraping cuda-toolkit selenium-python beautifulsoup4 dataminig

Updated May 29, 2024
Python

Franky1 / Tesseract-OCR-5-Docker

Star

Docker Image with latest Tesseract OCR Version 5.x.x built from sources

docker ocr tesseract tesseract-ocr tesseract-5

Updated May 29, 2024
Python

jankstar / pydocu

Star

fastapi server for classification of documents and extraction of data

transformers tesseract torch data-extraction document-classification parsing-library bert fastapi

Updated May 28, 2024
Python

SkeathyTomas / genshin_artifact_auxiliary

Star

A Genshin Impact artifact rater sticking upon artifacts inside the game window. 刻晴办公桌 | 原神 | 圣遗物评分。集成在游戏窗口之上的原神圣遗物导出、评分工具，无需游戏内外来回切换对比，游戏中快速计算与查阅结果。

python ocr tesseract paddleocr genshin-impact pyside6 rapidocr

Updated May 28, 2024
Python

SubhamTyagi / android-ocr

Star

Tesseract based OCR for android

android ocr foss tesseract reader fdroid image-reader ocr-android ocr-recognition ocr-text-reader math-ocr

Updated May 28, 2024
Java

tesseract-ocr / tesseract

Star

Tesseract Open Source OCR Engine (main repository)

machine-learning ocr tesseract lstm tesseract-ocr hacktoberfest ocr-engine

Updated May 28, 2024
C++

sivakumar-mahalingam / fastmrz

Star

⚡Extracting the Machine Readable Zone (MRZ) from passport or any document images.

python opencv ocr tesseract passport text-recognition tesseract-ocr mrz opencv-python identity-document mrz-scanner passport-mrz

Updated May 27, 2024
Python

shelfio / aws-lambda-tesseract

Star

6 MB Tesseract (with English training data) to fit inside AWS Lambda

nodejs ocr aws-lambda serverless npm-package tesseract node-module optical-character-recognition

Updated May 29, 2024
Shell

GerHobbelt / mupdf

Star

mupdf mirror/clone + extra work done / extra tooling. Geared for use with Qiqqa.

pdf ocr tesseract mupdf qiqqa

Updated May 26, 2024
C++

stscoundrel / old-danish-dictionary-builder

Star

Build "Dictionary of the Old Danish Language" into easier-to-use data formats

kotlin python typescript spring-boot tesseract medieval-studies danish-language medieval-languages old-danish otto-kalkar

Updated May 26, 2024
Python

danpla / dpscreenocr

Star

Program to recognize text on screen

ocr tesseract tesseract-ocr

Updated May 30, 2024
C++

GerHobbelt / qiqqa-open-source

Star

The open-sourced version of the award-winning Qiqqa research management tool for Windows (a bleeding edge dev fork) ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ☞☞☞ File any issues you find in the main repo issue tracker at https://github.com/jimmejardine/qiqqa-open-source/issues

metadata pdf tesseract citations mupdf document-classification meta-analysis document-management qiqqa

Updated May 25, 2024
TeX

ocrmypdf / OCRmyPDF

Star

OCRmyPDF adds an OCR text layer to scanned PDF files, allowing them to be searched

python pdf ocr image-processing tesseract

Updated May 25, 2024
Python

Improve this page

Add a description, image, and links to the tesseract topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the tesseract topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

tesseract

Here are 1,085 public repositories matching this topic...

scribeocr / scribeocr

pymupdf / PyMuPDF

koreader / koreader-base

hertzg / tesseract-server

goksenpasli / GpScanner

CCExtractor / ccextractor

Akylas / OSS-DocumentScanner

hamidurrk / epaper-scraper

Franky1 / Tesseract-OCR-5-Docker

jankstar / pydocu

SkeathyTomas / genshin_artifact_auxiliary

SubhamTyagi / android-ocr

tesseract-ocr / tesseract

sivakumar-mahalingam / fastmrz

shelfio / aws-lambda-tesseract

GerHobbelt / mupdf

stscoundrel / old-danish-dictionary-builder

danpla / dpscreenocr

GerHobbelt / qiqqa-open-source

ocrmypdf / OCRmyPDF

Improve this page

Add this topic to your repo