Skip to content

Bot para recopilar las intervenciones publicadas en la web de La Moncloa

Notifications You must be signed in to change notification settings

francesc-h/MonBot

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 

Repository files navigation

MonBot

Bot para recopilar las intervenciones publicadas en la página web de La Moncloa de los diferentes presidentes del gobierno. Esta es una herramienta educativa enfocada hacia el NLP y otros proyectos de Machine Learning.

Úsese con responsabilidad. El autor no se responsabiliza del uso indebido que los usuarios finales hagan de esta herramienta

Instrucciones de uso

Crear un directorio con el conjunto de intervenciones encontradas para el período especificado.

monbot.py -s yyyymm -e yyyymm

Argumentos:

  • -s: fecha inicial
  • -e: fecha final
  • -fn: archivo donde se guardará la información de cada intervención. Por defecto apunta a info.json

Si solo se especifica la fecha inicial se descargaran solamente las intervenciones pertenecientes a ese yyyymm

El texto de cada intervención se alamacenará en un archivo .txt dentro del directorio ./archivos. La información de cada intervención se alamacenará en un archivo .json donde constará para cada una de ellas:

{"titulo", "lugar", "fecha", "id"}

El atributo id corresponde al nombre del fichero de dicha intervención.

Instalación

pip install -r requirements.txt

Para que selenium funcione correctamente es necesario disponer del binario del driver de Firefox. Puedes encontrar más información en: selenium-python.readthedocs.io y en stackoverflow.com

About

Bot para recopilar las intervenciones publicadas en la web de La Moncloa

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages