Algoritmos de machine learning substituem a interpretação humana e nunca falham! Inteligência Artificial (IA) ameaça o emprego das pessoas! Vamos desvendar esses e outros mitos sobre análise de dados?
Quando o assunto é tecnologia, quanto maior o hype, maiores os equívocos! Em análise de dados, isso também é verdade!
Data Analytics, um dos assuntos mais quentes em tecnologia da informação hoje em dia, pode gerar ganhos significativos aos negócios porém, percepções errôneas podem atrapalhar a implementação de recursos analíticos. deixando de trazer benefícios ao contexto de negócio.
À medida que as empresas criam ou expandem sua atuação com data science para fazer com que a análise estratégica de dados aconteça, algumas dúvidas aparecem. Nesse post, vamos procurar desvendar alguns dos principais mitos sobre análise de dados.
Data Science e Data Analytics requerem altos investimentos!
Parece que toda implementação de tecnologia em negócios precisa passar antes por um filtro de solidez financeira. “Quanto vai custar?” é uma das primeiras perguntas que os gerentes de TI e diretores das empresas têm quando propõem o lançamento de um projeto ou a implantação de uma nova ferramenta.
Alguns assumem que a análise de dados é, por natureza, um investimento muito alto e, portanto, limitada a empresas com budgets enormes ou com muitos recursos internos.
Mas sabemos que nem todos os esforços em análise de dados exigem um grande investimento. Hoje em dia existem várias sites onde achar fontes de dados abertos e outras ferramentas open-source disponíveis no mercado que podem ajudá-lo a começar com a análise de dados.
Para tanto, é necessário ter clareza do problema que está tentando resolver. Isso definirá a forma como armazenar os dados e a tecnologia que será usada.
Colocando na ponta do lápis, a aplicação de data science e data analytics tende a balança do P&L (profit and loss) para o lado da sua implementação, uma vez que gera inúmeros benefícios para a empresa em sua adoção.
Data Analytics só pode ser realizada com soluções Big Data
Para muitos, a explicação sobre o que é big data e analytics estão sempre relacionadas, indicando que as empresas precisam coletar enormes volumes de dados (um dos “Vs” tão conhecidos dos profissionais da área) antes de realizar análises. Mas como podemos gerar insights de negócios e melhorar a tomada de decisões? Será que é mesmo só com análise de dados em uma estrutura big data?
Certamente os benefícios do big data analytics são enormes e as empresas com os recursos certos podem, de fato, obter vantagem competitiva aproveitando o armazenamento de dados e todo o seu potencial.
Mas a ideia de que soluções big data são obrigatórias para a análise de dados não é verdadeira!
Muitas vezes as pessoas tentam coletar o máximo de dados possível e ao ouvir “big data” ficam tão empolgados que cometem o erro de pensar: “quanto mais dados, melhor! Deixa que a máquina resolva tudo!”
Os tomadores de decisão em uma empresa precisam dos dados certos, aqueles que atendem a um propósito em específico.
Isso significa que em vez de se concentrar em mais dados, os profissionais de dados e business intelligence nas empresas devem considerar os usuários de negócios para determinar quais dados precisam coletar, como são armazenados e apresentados.
Fornecer acesso todas as informações com excesso de dados nos mais variados formatos pode simplesmente “sucumbir” a adoção de um sistema e colocar por água abaixo todo o valor que se poderia tirar com a análise daqueles dados.
É necessário descobrir o que é importante para os tomadores de decisão e como você pode apresentar essas informações da forma mais simples possível. Aqui no blog, no post 6 formas práticas de aplicar visualização de dados em uma empresa falei um pouco sobre essa questão na ótica da visualização de dados.
Algoritmos de machine learning substituem a interpretação humana!
A tecnologia é construída por pessoas, portanto, eliminar todo a interpretação humana é quase impossível! Alguns acham que machine learning, inteligência artificial e análise de dados vão eliminar o fator humano e, com isso, muitos estão com seus cargos comprometidos.
Seria bom se isso fosse verdade! Mas na realidade, algoritmos e análises de dados são ajustados usando “dados de treinamento” e reproduzem quaisquer características que esses dados tenham.
Em alguns casos a aplicação do algoritmo de machine learning indicará por si mesma o que a sua análise de dados precisa responder, mas na maioria dos casos, a justa e útil para o seu negócio não será aquela que o algoritmo trouxe. Afinal, não é só porque o algoritmo respondeu de uma forma que aquele “insight” seja o mais adequado para o seu objetivo de negócio.
Algoritmos de machine learning nunca falham!
As pessoas tendem a confiar demais em modelos e algoritmos estatísticos!
À medida que criam projetos de como iniciar a análise de dados, cada vez mais apoiam a tomada de decisões em modelos sofisticados de Data Science.
Como as pessoas não entendem como os modelos e algoritmos foram desenvolvidos tendem a confiar cegamente neles. Os usuários não sentem que têm o conhecimento necessário para “contestar” os modelos, portanto devem confiar nas “pessoas inteligentes” que os criaram.
Nos últimos anos, ouvimos que a inteligência artificial (IA) vai ter autonomia nos próximos anos, mas ainda há muito a ser descoberto antes que possamos confiar descaradamente nos algoritmos de machine learning e nos resultados apresentados.
Até lá, precisamos sempre ter um olhar crítico e questionar: “como posso avaliar resultados dos algoritmos de machine learning?”. Pedir para as pessoas que constroem algoritmos e modelos para explicar como as respostas foram alcançadas.
Veja bem: não estou dizendo que não podemos confiar nos resultados, mas precisamos de transparência para podermos confiar e continuar com nossas análises de dados rumo à tomada de decisão.
Data Science é uma arte misteriosa!
Esse tema tem gerado atenção, expectativa e curiosidade nos últimos anos e às vezes gera confusão sobre: “o que é Data Science”.
De maneira bem simples, ciência de dados envolve o uso de algoritmos para encontrar padrões nos dados em séries históricas, fazendo projeções estatísticas sobre o futuro.
Data Science parece uma arte misteriosa porque esses algoritmos são capazes de analisar muito mais variáveis e maiores conjuntos de dados do que a mente humana pode compreender.
Com o aumento da capacidade de processamento de dados realizado em memória nos últimos anos, agora podemos resolver rapidamente problemas que seriam impraticáveis há 10 anos atrás.
A ciência de dados é a evolução natural das técnicas de inferência estatística que são bem entendidas há décadas.
Não há mistério para a ciência de dados, uma vez que você entende a matemática.
Para fazer mais com Data Science, você precisa de mais profissionais!
Os cientistas de dados estão entre os profissionais mais requisitados de todos os profissionais de tecnologia atualmente. Você já deve ter lido essa frase em mais ou menos um milhão de artigos.
Talvez as empresas consigam conviver com menos profissionais desses se fizessem o que é mais importante para a gestão de dados: adequar os processos nos quais os profissionais de toda a empresa trabalham e que por sua vez, geram dados.
A maior parte do tempo do cientista de dados é gasto em atividades que não geram valor nenhum (encontrar conjunto de dados – datasets – levar os dados para um local onde eles possam ser trabalhados, transformá-los. limpá-los…). Costumo brincar que até acabar essa parte, o dia já se foi!
Sabemos o quanto é difícil contratar cientistas de dados! Sendo assim, pode ter certeza que essas tarefas de baixo valor não são o que você pode extrair de melhor do trabalho deles.
Você também pode ter certeza que não é exatamente nessas tarefas que eles gostariam de estar trabalhando (posso dizer com conhecimento de causa).
Empresas que usam tecnologia e ciência de dados como, por exemplo, o Uber permitem que os cientistas de dados se concentrem na engenharia, extração e análise de dados, invés de ficar “escovando os bits e bytes”. Isso permite que eles sejam muito mais produtivos.
Data Analytics leva muito tempo!
Sabemos o quanto é importante agir rapidamente seja no lançamento de um produto ou serviço, responder a uma consulta em base de dados de clientes quase em tempo real é um diferencial competitivo.
Muitas vezes, Data Analytics parece algo que leva muito tempo para ser executado, contrariando o objetivo de atingir velocidade e agilidade.
Ainda existe o mito de que esse tipo de projeto leva muito tempo e são complexos demais mas, isso na verdade é uma questão de talento!
Com a combinação certa de habilidades em ciência e análise de dados e a aplicação de metodologias ágeis de projetos, grandes perguntas podem ser respondidas em alguns dias ou semanas. Do contrário, podem levar meses ou até mesmo anos.
Por isso é extremamente importante que o profissional de Data Science e Data Analytics busque cursos e pratique Data Science nos mais diversos cenários, sempre tentando responder um problema real de negócios.
A tecnologia é fator limitante!
Com o número cada vez maior de tecnologias disponíveis, selecionar a combinação certa de ferramentas para implementar para obter o melhor da análise de dados realmente não é fácil.
Entretanto, a parte mais difícil é ajustar toda a estrutura de pessoas e processos dentro do modelo operacional da empresa, reunindo aquilo que é necessário antes de se pensar em tecnologia!
Como fazer isso do lado de uma empresa que já tem seus processos definidos? Pois é, responder a essa pergunta é o que mais difícil para as empresas.
É importante não assumir que as ferramentas de análise farão todo o trabalho! Mais uma vez, a tecnologia sozinha nunca resolve nenhum problema de negócios.
Na pressa de criar datalakes, as organizações não levam em consideração que é necessário estruturar seus processos ao adequar toda a estrutura de armazenamento e processamento de dados.
A tecnologia sozinha também não resolve os desafios internos das empresas! A cada sprint de implementação, precisamos identificar primeiramente o problema ao qual será destinado.
O “departamento” de análise de dados deve ser separado dos outros departamentos!
Em algumas empresas, a análise de dados opera como um departamento apartado. Já em outras é profundamente incorporada a uma equipe multifuncional.
Com a explosão de dados em todas as áreas de negócios e a velocidade com que as mudanças estão ocorrendo (principalmente frente à pandemia do coronavírus), o modelo departamentalizado não funciona.
À medida que as empresas se tornam mais customer centric, os especialistas em análise de dados devem estar no centro de uma unidade de negócios, não operando como um departamento que você solicita suporte (existe inclusive um jargão entre as agências: “BI não é o departamento que faz relatórios”).
Muitos dos problemas complexos que as empresas enfrentam atualmente estão dentro das unidades de negócios e muitas soluções para esses problemas estão ocultas aos dados.
Cientistas e especialistas em dados devem trabalhar de forma colaborativa com essas unidades de negócios e usando os dados (datasets) e inteligência artificial de forma bem orquestrada.
Data Analytics é apenas para PhDs
É ótimo ter pessoas instruídas na equipe de análise de dados, mas não é um requisito para o sucesso!
As empresas tendem a pensar que, sem PhDs a bordo, não serão capazes de executar as melhores análises. Data Analytics é uma mistura de habilidades: tem aqueles que são conhecedores de tecnologias e outros que dominam os softwares de código aberto.
Construir “squads” com diferentes habilidades, incluindo arquitetos de dados, engenheiros de dados, cientistas de dados, especialistas em visualização de dados, entre outras competências é o que faz a diferença.
A Inteligência Artifical (IA) ameaça o emprego das pessoas e pode destruir a economia!
Historicamente, a introdução de novas tecnologias desencadeou o desemprego em diversas indústrias e há temores de que o avanço da inteligência artificial acabe tirando empregos humanos.
As soluções de inteligência artificial são muito melhores do que as pessoas na solução de certos tipos de problemas. A Inteligência artificial (IA) pode ler mais rápido, lembrar mais e calcular relacionamentos matemáticos complexos melhor do que qualquer pessoa.
No entanto, ela não é capaz de lidar com novos cenários, que é onde os humanos se destacam.
Claro que certos empregos já foram perdidos ou diminuídos com o crescimento da IA. Outros seguirão no mesmo caminho mas, ainda assim, nossa capacidade humana de entender e solucionar circunstâncias completamente imprevistas não será substituída por nenhuma tecnologia de IA.
Eu acredito que em um futuro próximo, a abordagem mais eficaz para a IA será aumentar as habilidades humanas com sistemas de IA que realizam alguns dos ‘trabalhos pesados’ em que os algoritmos superam as pessoas.
Embora muitos empregos sofram mudanças mediante a inteligência artificial, as pessoas continuarão sendo uma parte crítica desse ecossistema de negócios.