Skip to content

Latest commit

 

History

History
64 lines (61 loc) · 3.63 KB

1-dataset-collect-clean.md

File metadata and controls

64 lines (61 loc) · 3.63 KB
PROJETO OBJETIVO TIPO DE DADOS TIPO MACHINE LEARNING
Recomendador de vídeos do youtube Entender Ciência de dados na prática Time Series Supervisionado
LinkedIn : https://www.linkedin.com/in/claudineien/

COLETAR DATASET DE VÍDEOS DO YOUTUBE

Para obtermos os mesmos resultados e facilitar o nosso entendimento em cada técnica executada, baixar os arquivos :

Vamos aprender a fazer download dos dados de vídeos do youtube utilizando a biblioteca youtube_dl que é muito boa por trazer as informações em formato de dicionário do python, e este formato agiliza todo e qualquer processo de preparação dos dados para o modelo machine learning.

Precisamos aplicar o labelling para treinar o modelo machine learning, que é classificar manualmente se o vídeo é o que possivelmente vamos assistir ou não. Para isto será necessário converter o tipo de dado objeto com conteúdo de data para o tipo data e encontrar a quantidade de dias de publicação do vídeo.

Os tratamentos dos dados serão respectivamente realizados com a biblioteca pandas e numpy ambas muito boas para tratamento do dataset.

Disponibilizaremos o dataset trabalhado em um arquivo .csv para aplicar labelling, que ajudará na predição do algoritmo machine learning.



Inconsistências na biblioteca youtube_dl registradas no github :



Fontes de estudo :