Essa é a segunda parte do desafio Data Science na Prática que publico aqui pelo blog e também pelo YouTube. Se você ainda não viu a primeira parte, assista! Ela é importante para continuar com essa parte da videoaula.

Link para o Data Science na Prática – Parte 01: “Iniciando em coleta e tratamento de dados com Python

Com edições semanais, essa série é voltada para quem já tem alguma vivência com Business Intelligence e Data Analytics e o primeiro desafio foi feito para quem quer iniciar com a linguagem python.

Continuando com tratamento de dados em Python via Jupyter Notebook

Para essa videoaula, aprendemos a remover as duplicações em cadastros que foram encontrados na base de dados. Continuamos com o tratamento de dados passando por:

  • renomear colunas com .rename();
  • agrupar dados com .groupby();
  • gerar novos dataframes a partir de um existente;
  • aplicar cálculos com valores de duas listas de um mesmo dataframe, gerando uma terceira lista;
  • juntar dataframes diferentes em um único com .merge();

Por fim, geramos o primeiro gráfico com o módulo matplotlib do Python e fizemos algumas alterações em tamanho do gráfico.

Acompanhe a videoaula no YouTube e aqui no blog Celso Cestaro! Se gostou do conteúdo, compartilhe. Estarei por aqui para tirar suas dúvidas portanto, pratique!

Notebook (script) do desafio Data Science na Prática 01

O link abaixo contém o script que usamos durante a videoaula. Para baixá-lo, basta preencher o formulário com nome e e-mail e será enviado.

Se certifique de que não tenha entrado como spam, ok?

Ah… e não se esqueça de comentar e compartilhar. Até o próximo post!