![](https://celsocestaro.com.br/wp-content/uploads/2020/07/Simples-Tutorial-de-Maquiagem-Miniatura-do-YouTube.jpg)
Essa é a segunda parte do desafio Data Science na Prática que publico aqui pelo blog e também pelo YouTube. Se você ainda não viu a primeira parte, assista! Ela é importante para continuar com essa parte da videoaula.
Link para o Data Science na Prática – Parte 01: “Iniciando em coleta e tratamento de dados com Python“
Com edições semanais, essa série é voltada para quem já tem alguma vivência com Business Intelligence e Data Analytics e o primeiro desafio foi feito para quem quer iniciar com a linguagem python.
Continuando com tratamento de dados em Python via Jupyter Notebook
Para essa videoaula, aprendemos a remover as duplicações em cadastros que foram encontrados na base de dados. Continuamos com o tratamento de dados passando por:
- renomear colunas com .rename();
- agrupar dados com .groupby();
- gerar novos dataframes a partir de um existente;
- aplicar cálculos com valores de duas listas de um mesmo dataframe, gerando uma terceira lista;
- juntar dataframes diferentes em um único com .merge();
Por fim, geramos o primeiro gráfico com o módulo matplotlib do Python e fizemos algumas alterações em tamanho do gráfico.
Acompanhe a videoaula no YouTube e aqui no blog Celso Cestaro! Se gostou do conteúdo, compartilhe. Estarei por aqui para tirar suas dúvidas portanto, pratique!
Notebook (script) do desafio Data Science na Prática 01
O link abaixo contém o script que usamos durante a videoaula. Para baixá-lo, basta preencher o formulário com nome e e-mail e será enviado.
Se certifique de que não tenha entrado como spam, ok?
Ah… e não se esqueça de comentar e compartilhar. Até o próximo post!