Skip to content

bernatsort/Structured_Perceptron_NLP

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

14 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Part Of Speech usando un Perceptrón Estructurado

Construir un perceptrón estructurado y entrenarlo para hacer una predicción de Part Of Speech usando el dataset CoNLL-2003. Es un dataset que contiene secuencias de frases en ingles extraídas de libros y la entidad de cada palabra (nombre, vervo, determinante, etc.) correspondiente al POS.

Objetivos:

1. Entrenar un perceptrón estructurado para predecir Part Of Speech usando el dataset ConLL.

Además, responder a las siguientes preguntas:

  • 1.1. ¿Cuántos features tiene el feature mapper? ¿Qué representan?
  • 1.2. En una secuencia de entrenamiento, ¿cuántos tipos de features encontramos en una secuencia? ¿Qué nos indican?
  • 1.3. Cuando construimos el SP, ¿cuántos estados posibles tiene y por qué?
  • 1.4. Cuando construimos el SP, ¿cuántos parámetros tiene y por qué?

2. Comparar los resultados con el HMM entrenado con el mismo dataset usado en la sesión 2 en clase.

3. Comprovar si el perceptrón estructurado clasifica correctamente una palabra que no ha visto en el entrenamiento.

About

Part Of Speech usando un Perceptrón Estructurado

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published