Las preguntas de esta sección se mostraron a los desarrolladores que se dedican al Análisis de datos, la Ingeniería de datos, el Machine learning, o a aquellos cuyo rol de trabajo era analista de datos, ingeniero de datos o científico de datos. Esta encuesta estaba dirigida específicamente a los desarrolladores, por lo que los resultados pueden no ser representativos de la audiencia de big data en general.
Macrodatos
Los editores de hojas de cálculo son las herramientas más utilizadas para el análisis y la visualización de datos (46 %).
La mayoría de los desarrolladores de big data no utiliza plataformas específicas de análisis de datos (68 %). La plataforma de análisis de datos más utilizada es Google Colab (19 %).
Jupyter es la herramienta de big data más popular, utilizada por el 32 % de los desarrolladores de big data. Otras herramientas populares son Apache Spark (20 %) y Apache Kafka (17 %).
En su mayoría, los datos se alojan en servidores internos (36 %) o locales (26 %). El 21 % de las personas encuestadas utiliza AWS para el alojamiento de datos; los otros tipos de alojamiento son menos comunes.
En los sectores no tecnológicos, los sectores financieros son los que contratan con más frecuencia a ingenieros de datos, mientras que los especialistas en machine learning trabajan más a menudo en los sectores educativo y científico.
Python se utiliza junto con Apache Spark en un 66 %, con Java en un 34 % y con Scala en un 11 %.
El 10 % utiliza tanto Apache Spark como Apache Kafka. El 9 % utiliza tanto Apache Spark como Apache Hadoop.
Los tres lenguajes más populares utilizados junto con Apache Kafka son Python, Java y SQL.
R se utiliza más en Rusia (5 %) y Python se utiliza más en Asia (59 %).
Python y Java se usan más con Google Cloud, JavaScript y PHP se usan más con AWS, y C# se usa más con Azure.
Jupyter y Apache Beam se utilizan con más frecuencia con Google Cloud. Apache Spark y Apache Kafka se utilizan con más frecuencia entre los usuarios de AWS.
Los especialistas en machine learning utilizan con más frecuencia Python, C++ y C, y con menos frecuencia SQL y PHP, en comparación con los desarrolladores que participan en el análisis y la ingeniería de datos.
Los desarrolladores relacionados con la educación y la ciencia utilizan más Python y R.
Jupyter se utiliza con más frecuencia en la educación y la ciencia. Apache Spark, Apache Kafka, Apache Hadoop y Apache Hive se utilizan con más frecuencia en la banca.
Los mayores porcentajes de usuarios de Apache Spark se encuentran en China, India, Corea del Sur, España y América Latina.
¡Gracias por el tiempo que nos has dado!
Esperamos que nuestro informe le haya resultado útil. Comparta este informe con sus amigos y compañeros.
Participe en el JetBrains Tech Insights Lab
Participe en encuestas y estudios de experiencia de usuario para que los productos JetBrains sean más fáciles de usar y aún más potentes. Por participar en nuestras investigaciones, también tendrá la oportunidad de ganar premios.
Si tiene alguna pregunta o sugerencia, no dude en ponerse en contacto con nosotros a través de surveys@jetbrains.com.