🏅 Proyecto PLN

A partir del índice de categorías de noticias del periódico digital de El País (https://elpais.com/estaticos/mapa-web/) se descargan mediante técnicas de web scraping un conjunto de noticias de distinto tipo.

Una vez realizada una extracción de casi 3 mil artículos, se aplican diferentes preprocesados y clasificadores para la realización del proyecto. Finalmente, se muestran los resultados de cada método y se determina cuál de ellos tienen mejor rendimiento para este problema seleccionando así un pre-procesado, una extracción de características y un clasificador

*Otra opción para la extracción del conjunto de datos podría haber sido usar el servicio de feeds RSS (https://servicios.elpais.com/rss/).

🗂 Orden de los documentos

Cada uno de los documentos necesarios para la realización del proyecto se encuentran en la parte superior del repositorio. En estas encontraremos 5 archivos:

README.md con la información necesaria.
Una la base de datos, articulos.csv.
Webscraping_Miniproyecto_PLN.ipynb, archivo para la extración del conjunto de datos.
Miniproyecto_PLN_final.ipynb, donde podremos encontrar la segunda parte del proyecto, donde se aplican los preprocesados, clasificadores y resultados del proyecto.
Carpeta "html" que contiene las dos partes del proyecto en formato html.

👫👭 Equipazo:

Este proyecto ha sido realizado por:

Moisés Barrios Torres
Cecilia Diana Albelda
Irina Filimonova Sevcenco
Elena Marrero Castellano

📄 Licencia

Este repositorio está bajo la Licencia (GNU General Public License v3.0) - mira el archivo LICENSE.md para detalles.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

html

html

LICENSE

LICENSE

Miniproyecto_PLN_final.ipynb

Miniproyecto_PLN_final.ipynb

README.md

README.md

Webscraping_Miniproyecto_PLN.ipynb

Webscraping_Miniproyecto_PLN.ipynb

articulos.csv

articulos.csv

Repository files navigation

🏅 Proyecto PLN

🗂 Orden de los documentos

👫👭 Equipazo:

📄 Licencia

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
html		html
LICENSE		LICENSE
Miniproyecto_PLN_final.ipynb		Miniproyecto_PLN_final.ipynb
README.md		README.md
Webscraping_Miniproyecto_PLN.ipynb		Webscraping_Miniproyecto_PLN.ipynb
articulos.csv		articulos.csv

License

elenamarreroo/Proyecto-PLN

Folders and files

Latest commit

History

Repository files navigation

🏅 Proyecto PLN

🗂 Orden de los documentos

👫👭 Equipazo:

📄 Licencia

About

Topics

Resources

License

Stars

Watchers

Forks

Languages