Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Crear nuevo notebook de analytics de series: generación de features #2

Open
abenassi opened this issue Dec 3, 2018 · 0 comments
Open

Comments

@abenassi
Copy link
Member

abenassi commented Dec 3, 2018

En el notebook series-generacion-features-usuarios.ipynb buscamos generar una tabla reproducible de características de los usuarios de la API de series (definidos por 1 usuario = 1 IP).

La idea es interpretar el análisis del notebook exploratorio en busca de features útiles para describir a los usuarios de la API, e implementarlas de forma tal que la generación de cada una esté encapsulada en una función que pueda ser ejecutada independientemente contra el input original, y agregue una nueva columna, con una nueva característica.

  • La función debe documentar en su docstring la "definición" del indicador / característica que se calcula.
  • Los nombres de las funciones tienen que seguir una consistencia entre ellas (van a ser muchas) y arrancar con un prefijo que permita identificarlas como "esta es una función que genera una feature / indicador / característica del usuario" (después más adelante vamos a usar esto para documentar automáticamente aparte todos los indicadores generados
  • Todas las funciones deben aplicarse al final del notebook contra el input, generando un dataframe con todas las features, que se guarda en CSV
  • No se debe guardar ningún CSV en Github que tenga una IP hay que anonimizarlas de entrada cuando se toma el input, si es que no están ya anonimizadas.
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

2 participants