Big Data

As perguntas nesta seção foram mostradas para desenvolvedores envolvidos em Análises de Dados, Engenharia de Dados, Machine Learning ou para aqueles cuja função era Analista de Dados/Engenheiro de Dados/Cientista de Dados. Esta pesquisa foi direcionada especificamente para desenvolvedores e, portanto, os resultados podem não representar o público mais amplo de big data.

Quais destas ferramentas de processamento em lote você utiliza?

Quais destas ferramentas de processamento de streaming você utiliza?

Profissionais que não estão envolvidos na criação de pipelines de dados usam bancos de dados relacionais tradicionais para criar data lakes. O Spark continua a ser a ferramenta mais popular para processamento em lotes e streaming.

Quais dessas ferramentas de orquestração você utiliza?

Previsivelmente, o Apache Airflow é a ferramenta de orquestração mais popular, especialmente entre os engenheiros de dados. Curiosamente, 10% das ferramentas de orquestração são personalizadas ou autoconstruídas.