PROJETO
OBJETIVO
TIPO DE DADOS
TIPO MACHINE LEARNING
Recomendador de vídeos do youtube
Entender Ciência de dados na prática
Time Series
Supervisionado
LinkedIn : https://www.linkedin.com/in/claudineien/
PROJETO | OBJETIVO | TIPO DE DADOS | TIPO MACHINE LEARNING |
---|---|---|---|
Recomendador de vídeos do youtube | Entender Ciência de dados na prática | Time Series | Supervisionado |
LinkedIn : https://www.linkedin.com/in/claudineien/ |
Vamos aprender a fazer download dos dados de vídeos do youtube utilizando a biblioteca youtube_dl que é muito boa por trazer as informações em formato de dicionário do python, e este formato agiliza todo e qualquer processo de preparação dos dados para o modelo machine learning.
Precisamos aplicar o labelling para treinar o modelo machine learning, que é classificar manualmente se o vídeo é o que possivelmente vamos assistir ou não. Para isto será necessário converter o tipo de dado objeto com conteúdo de data para o tipo data e encontrar a quantidade de dias de publicação do vídeo.
Os tratamentos dos dados serão respectivamente realizados com a biblioteca pandas e numpy ambas muito boas para tratamento do dataset.
Disponibilizaremos o dataset trabalhado em um arquivo .csv para aplicar labelling, que ajudará na predição do algoritmo machine learning.
Inconsistências na biblioteca youtube_dl registradas no github :
- ytsearchdateall only returns the first page (20 videos) of results
- How can we use extract_info from youtube-dl to extract 50, 60, 70 or more videos ?
Fontes de estudo :
- Curso Solução Completa de Data Science - Instrutor Mario Filho-Kagle Gran Master
- numpy
- pandas.pydata.org
- youtube_dl README.md
- reddit - YouTube
- yt-search
- youtube-dl embedded