Skip to content

Prog-LucasAlves/AED_Consumidor_Gov_Br

Repository files navigation

The San Juan Mountains are beautiful! Análise de Dados das reclamações feitas no site Consumidor.gov.br

Tecnologias utilizadas Tecnologias utilizadas

  1. Python
  • Dados extraidos nesse link

  • Dados de 01/2021 ate o mês 04/2024 - Atualizado dia 30/05/2024

💬 Sobre o Serviço

  • O Consumidor.gov.br é um serviço público que permite a interlocução direta entre consumidores e empresas para solução de conflitos de consumo pela internet. Consumidor.gov.br

Etapas de Limpeza realizadas Etapas de Limpeza realizadas

Considerações:

  • Após a união do arquivos CSVs, o DataFrame ficou com 4567162 registros e 19 colunas.
  • Foi verificado que o DataFrame havia 2.85% de valores ausentes(Em 4 colunas do DataFrame).
Coluna Valores Ausentes % de Valores Ausentes
Nota do Consumidor 2386319 52.25
Tempo Resposta 83675 1.83
Sexo 297 0.01
Avaliação Reclamação 5 0.00

Etapas:

  1. Imputação/Remoção dos valores ausentes

    1. Coluna 'Nota do Consumidor' -> Será imputado valores utilizando o método de preenchimento progressivo (forward fill) para os valores NaN.
    2. Coluna 'Tempo Resposta' -> será imputado o valor 0(Zero) para os valores NaN - Pois são reclamações que não foram respondidas.
    3. Coluna 'Sexo' -> será imputado o valor 'O'(Outros) para os valores NaN.
    4. Coluna 'Avaliação Reclamação' -> Os dados ausentes seram removidos.
  2. linhas Duplicadas

    1. Foram eliminadas do Dataframe as linhas duplicadas(17174).
  • Após as transformações realizadas o DataSet ficou com 4549960 registros e 19 colunas.

Perguntas a serem respondidas Perguntas a serem respondidas

  1. As reclamações estão aumentando ou diminuindo
  2. Quais Segmentos de Mercado com menor indice(%) de respostas por reclamações.

Deploy dos dados Deploy dos dados

Site

Planejamento Planejamento

  • Coleta dos dados
  • Limpeza e Transformação dos dados
  • Deploy Streamlit

Sugestão Sugestão/Feedback

Sugestão

CI CI

Linter Security Data Clear

P Pacotes Python utilizados

Pandas

Releases

No releases published

Packages

No packages published