Big Data
Compartir:
Las preguntas de esta sección se mostraron a los desarrolladores que se dedican al análisis de datos, la ingeniería de datos, el aprendizaje automático, o a aquellos cuyo rol de trabajo era analista de datos, ingeniero de datos o científico de datos. Esta encuesta estaba dirigida específicamente a los desarrolladores, por lo que los resultados pueden no ser representativos de la audiencia de big data en general.
Los profesionales que no participan en la creación de procesos de datos utilizan bases de datos relacionales tradicionales para crear lagos de datos. Spark sigue siendo la herramienta más popular para el procesamiento por lotes y streaming.
Como era de esperar, Apache Airflow es la herramienta de orquestación más popular, especialmente entre los ingenieros de datos. Curiosamente, el 10 % de las herramientas de orquestación son personalizadas o de creación propia.
Kubernetes, YARN y Amazon EMR son las soluciones en la nube más populares para la ejecución de Spark.
La gran mayoría de los encuestados no utiliza herramientas MPP. BigQuery, Redshift y Azure SQL Data Warehouse son los instrumentos más populares.
¡Gracias por el tiempo que nos ha dado!
Esperamos que nuestro informe le haya resultado útil. Comparta este informe con sus amigos y compañeros.
Si tiene alguna pregunta o sugerencia, no dude en ponerse en contacto con nosotros a través de surveys@jetbrains.com.