Text to Sentence Tokenizer

Description

This is a simple tool for splitting a document into sentences.

Steps to start

Enable Virtual Environment

virtualenv venv

source venv/bin/activate
Install dependencies

pip install -r requirements.txt
Run the tool

uvicorn main:app --reload --port 8080
Open the browser and go to http://localhost:8080/tokenizer

You are good to go!

Prerequisites

If you are using Windows
- Install Tesseract OCR from https://github.com/UB-Mannheim/tesseract/wiki
- Install Python 3.10.4 or above from https://www.python.org/downloads/
If you are using Linux
- Install Python 3.10.4 or above from https://www.python.org/downloads/
- Modify tesseract install location inside ./src/tesseract.py

Maintainer

Name: Sagnik Das

Email: [email protected]

Suggestions are welcome

For suggestions and contributions, please visit here

If you like my work, please star it on here

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
src		src
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
main.py		main.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Text to Sentence Tokenizer

Description

Steps to start

Prerequisites

Maintainer

Suggestions are welcome

About

Releases 1

Packages

Languages

License

sagnik-sudo/Text-to-Sentence-Tokenizer

Folders and files

Latest commit

History

Repository files navigation

Text to Sentence Tokenizer

Description

Steps to start

Prerequisites

Maintainer

Suggestions are welcome

About

Topics

Resources

License

Stars

Watchers

Forks

Releases 1

Packages 0

Languages

Packages