Skip to content

AndreyTulyakov/TextStageProcessor

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Text Stage Processor

Open source project for text mining process exploration.

Требования:

  1. Операционная система: Windows, Linux, MacOS.
  2. Язык программирования: Python 3
  3. Входные файлы: каталог или отдельные текстовые файлы с расширением .txt в кодировке UTF-8 содержащие текст на русском языке.
  4. Выходные файлы: формат TXT и CSV (помещаются в специальный каталог для выходных файлов)
  5. Библиотеки: фреймворк Anakonda 3, pymorphy2
  6. Алгоритмы ТextМining должны быть реализованы кодом.
  7. Программная реализация алгоритмов тестируется

Установка на Window

Наиболее простой вариант:

  • Если в системе имеется Python3, то удалить его. (Если вы не собираетесь его использовать далее)
  • Установить пакет Anakonda 3. (https://www.continuum.io/downloads)
  • Установить библиотеку pymorphy2 с помощью команды: python -m pip install pymorphy2

В случае использования чистого языка Python 3 необходимо установить библиотеки:

  • matplotlib
  • pymorphy2
  • numpy
  • pyqt5
  • lapack
  • scipy
  • sclearn
  • pandas

По вопросам

Andrew Tulyakov ([email protected])

Разработано с участием:

Дмитрий Кузнецов ([email protected]) Николай Сябро ([email protected])

Releases

No releases published

Packages

No packages published

Languages