Las preguntas de esta sección se mostraron a los desarrolladores que se dedican al Análisis de datos, la Ingeniería de datos, el Machine learning, o a aquellos cuyo rol de trabajo era analista de datos, ingeniero de datos o científico de datos. Esta encuesta estaba dirigida específicamente a los desarrolladores, por lo que los resultados pueden no ser representativos de la audiencia de big data en general.

Macrodatos

¿Qué paquetes de estadísticas utiliza para analizar y visualizar datos?

46%16% 4% 3% 2% 1%12%37%

Los editores de hojas de cálculo son las herramientas más utilizadas para el análisis y la visualización de datos (46 %).

¿Qué plataformas analíticas de big data utiliza?

68%19% 7% 4% 3% 3% 2% 4%

La mayoría de los desarrolladores de big data no utiliza plataformas específicas de análisis de datos (68 %). La plataforma de análisis de datos más utilizada es Google Colab (19 %).

¿Qué herramientas de big data utiliza?

32%20%17%12%10% 4% 3% 2% 1% 1% 2%49%

Jupyter es la herramienta de big data más popular, utilizada por el 32 % de los desarrolladores de big data. Otras herramientas populares son Apache Spark (20 %) y Apache Kafka (17 %).

¿Qué versión de Spark utiliza?

1%39%34% 9% 5% 1% 3% 0%23%

¿Dónde aloja la mayoría de sus datos?

36%26%21% 8% 5% 4%

En su mayoría, los datos se alojan en servidores internos (36 %) o locales (26 %). El 21 % de las personas encuestadas utiliza AWS para el alojamiento de datos; los otros tipos de alojamiento son menos comunes.

¿La informática es el negocio principal de su empresa?

No
43%57%42%58%34%66%Análisis de datosIngeniería de datosMachine Learning

Los especialistas en machine Learning suelen trabajar en empresas tecnológicas.

¿En cuál de los siguientes sectores opera su empresa principalmente?

37%33%22%21%16%16%15%12%11%10% 9%
Todos los resultados

En los sectores no tecnológicos, los sectores financieros son los que contratan con más frecuencia a ingenieros de datos, mientras que los especialistas en machine learning trabajan más a menudo en los sectores educativo y científico.

¿En cuál de los siguientes sectores opera su empresa principalmente?

14%14%12%10%10% 9% 7% 7% 7% 5% 5%
Todos los resultados

Utilización de Python, Scala y Java junto con Apache Spark

Python se utiliza junto con Apache Spark en un 66 %, con Java en un 34 % y con Scala en un 11 %.

Las 10 mejores combinaciones de herramientas de big data

10% 9% 9% 7% 7% 6% 6% 6% 5% 4%

El 10 % utiliza tanto Apache Spark como Apache Kafka. El 9 % utiliza tanto Apache Spark como Apache Hadoop.

Los 3 idiomas más utilizados con Apache Kafka

Los tres lenguajes más populares utilizados junto con Apache Kafka son Python, Java y SQL.

Proporción Python/R en Estados Unidos, Europa, Rusia y Asia

A
De
Valor
-
Estados UnidosEuropaRusiaAsia
49%44 %54 %59%Python
2%2%5%2%R
51%56 %45 %40%Ninguno de los anteriores
00.59
Estados Unidos
Europa
Rusia
Asia
A
De
Valor
-
PythonRNinguno de los anteriores
00.59

R se utiliza más en Rusia (5 %) y Python se utiliza más en Asia (59 %).

Lenguaje principal por utilización de alojamiento de big data

49%41%30%27%23%19%15% 9% 8% 7% 6%
Todos los resultados

Python y Java se usan más con Google Cloud, JavaScript y PHP se usan más con AWS, y C# se usa más con Azure.

Utilización de herramientas de big data por utilización de alojamiento de big data

30%26%22%14%10% 4% 3% 2% 1% 1% 3%47%

Jupyter y Apache Beam se utilizan con más frecuencia con Google Cloud. Apache Spark y Apache Kafka se utilizan con más frecuencia entre los usuarios de AWS.

Lenguaje principal por utilización en Análisis de datos / Ingeniería de datos / Machine learning

52%31%29%28%18%18%11%10% 8% 8% 6% 5% 4%
Todos los resultados

Los especialistas en machine learning utilizan con más frecuencia Python, C++ y C, y con menos frecuencia SQL y PHP, en comparación con los desarrolladores que participan en el análisis y la ingeniería de datos.

Lenguaje principal por sectores

A
De
Valor
-
Actividad principal tecnológicaBanca / finanzasEducación y cienciaVentas, distribución, venta minoristaFabricación
46 %55 %66 %43 %47 %Python
33 %27 %23 %37 %32 %JavaScript
29 %34 %19%21%20%Java
29 %36 %21%40%29 %SQL
20%12%15%29 %15%PHP
16%15%16%22 %18%HTML / CSS
14%9%6%9%10%TypeScript
11%11%10%9%28 %C#
10%7%19%6%12%C++
10%7%2%6%6%Go
10%14%13%9%9%Lenguajes de programación shell
5%5%3%6%9%Kotlin
4%4%6%1%4%C
4%5%0%3%4%Scala
3%1%1%1%1%Rust
3%1%3%1%-Swift
2%2%1%3%2%Dart
2%1%1%3%2%Ruby
1%1%6%2%-R
1%1%0%4%4%Visual Basic
0%-4%-1%MATLAB
4%5%3%4%2%Otro
00.66
Actividad principal tecnológica
Banca / finanzas
Educación y ciencia
Ventas, distribución, venta minorista
Fabricación
A
De
Valor
-
PythonJavaScriptJavaSQLPHPHTML / CSSTypeScriptC#C++GoLenguajes de programación shellKotlinCScalaRustSwiftDartRubyRVisual BasicMATLABOtro
00.66

Los desarrolladores relacionados con la educación y la ciencia utilizan más Python y R.

Utilización de herramientas de big data por sectores

A
De
Valor
-
Actividad principal tecnológicaBanca / finanzasEducación y cienciaVentas, distribución, venta minoristaFabricación
29 %33 %38 %27 %26%Jupyter
24 %36 %14%26%15%Apache Spark
23 %33 %6%21%9%Apache Kafka
15%24 %7%12%4%Apache Hadoop/MapReduce
13%21%4%14%6%Apache Hive
7%9%1%3%2%Apache Flink
3%7%6%1%4%Dask
2%5%0%1%1%Apache Beam
2%3%2%1%-Apache Pig
1%2%-3%-Apache Tez
3%2%4%2%1%Otro
46 %40%53 %53 %61 %Ninguna
00.61
Actividad principal tecnológica
Banca / finanzas
Educación y ciencia
Ventas, distribución, venta minorista
Fabricación
A
De
Valor
-
JupyterApache SparkApache KafkaApache Hadoop/MapReduceApache HiveApache FlinkDaskApache BeamApache PigApache TezOtroNinguna
00.61

Jupyter se utiliza con más frecuencia en la educación y la ciencia. Apache Spark, Apache Kafka, Apache Hadoop y Apache Hive se utilizan con más frecuencia en la banca.

Porcentaje de utilización de Apache Spark por país o región

29%29%27%20%19%19%18%18%17%16%16%
Todos los resultados

Los mayores porcentajes de usuarios de Apache Spark se encuentran en China, India, Corea del Sur, España y América Latina.

¡Gracias por el tiempo que nos has dado!

Esperamos que nuestro informe le haya resultado útil. Comparta este informe con sus amigos y compañeros.

Participe en el JetBrains Tech Insights Lab

Participe en encuestas y estudios de experiencia de usuario para que los productos JetBrains sean más fáciles de usar y aún más potentes. Por participar en nuestras investigaciones, también tendrá la oportunidad de ganar premios.

Si tiene alguna pregunta o sugerencia, no dude en ponerse en contacto con nosotros a través de surveys@jetbrains.com.