Die Fragen in diesem Abschnitt wurden Befragten gestellt, die in den Bereichen Datenanalyse, Data Engineering oder Maschinelles Lernen mitwirken oder als Data Analyst/Data Engineer/Data Scientist tätig sind. Diese Umfrage richtete sich speziell an Entwickler*innen, daher sind die Ergebnisse möglicherweise nicht repräsentativ für die allgemeine Big-Data-Community.

Big Data

Welche Statistikpakete verwenden Sie, um Daten zu analysieren und zu visualisieren?

46%16% 4% 3% 2% 1%12%37%

Tabellenkalkulationen sind die meistverwendeten Tools bei der Datenanalyse und -visualisierung (46%).

Welche Big-Data-Analyseplattformen verwenden Sie?

68%19% 7% 4% 3% 3% 2% 4%

Die Mehrheit der Big-Data-Entwickler*innen nutzt keine spezifischen Datenanalyseplattformen (68%). Die meistverwendete Datenanalyseplattform ist Google Colab (19%).

Welche Big-Data-Tools verwenden Sie?

32%20%17%12%10% 4% 3% 2% 1% 1% 2%49%

Jupyter ist das beliebteste Big-Data-Tool: Es wird von 32% der Big-Data-Entwicklergemeinschaft verwendet. Weitere beliebte Tools sind Apache Spark (20%) und Apache Kafka (17%).

Welche Spark-Version verwenden Sie?

1%39%34% 9% 5% 1% 3% 0%23%

Wo werden die meisten Ihrer Daten gehostet?

36%26%21% 8% 5% 4%

Daten werden meist auf internen Servern (36%) oder lokal (26%) gehostet. AWS wird von 21% der Befragten für das Datenhosting verwendet, andere Hosting-Typen sind weniger verbreitet.

Ist IT das Kerngeschäft Ihres Unternehmens?

Nein
Ja
43%57%42%58%34%66%DatenanalyseData EngineeringMachine Learning

Expert*innen für maschinelles Lernen arbeiten häufiger in IT-Unternehmen.

In welcher der folgenden Branchen ist Ihr Unternehmen hauptsächlich tätig?

37%33%22%21%16%16%15%12%11%10% 9%
Alle Ergebnisse

In IT-fernen Bereichen werden Data Engineers häufiger im Finanzsektor beschäftigt, während Spezialist*innen für maschinelles Lernen häufiger im Bildungs- und Wissenschaftssektor tätig sind.

In welcher der folgenden Branchen ist Ihr Unternehmen hauptsächlich tätig?

14%14%12%10%10% 9% 7% 7% 7% 5% 5%
Alle Ergebnisse

Nutzung von Python, Scala und Java mit Apache Spark

66% der Apache-Spark-Nutzer*innen verwenden Python, 34% verwenden Java und 11% verwenden Scala.

Top-10-Kombinationen der Big-Data-Tools

10% 9% 9% 7% 7% 6% 6% 6% 5% 4%

10% verwenden sowohl Apache Spark als auch Apache Kafka. 9% verwenden sowohl Apache Spark als auch Apache Hadoop.

Top 3 der Sprachen, die zusammen mit Apache Kafka verwendet werden

Die drei Sprachen, die am häufigsten zusammen mit Apache Kafka verwendet werden, sind Python, Java und SQL.

Python/R-Anteile in den USA, Europa, Russland und Asien

Zu
Von
Wert
-
Vereinigte StaatenEuropaRusslandAsien
49%44%54%59%Python
2%2%5%2%R
51%56%45%40%Nichts davon
00.59
Vereinigte Staaten
Europa
Russland
Asien
Zu
Von
Wert
-
PythonRNichts davon
00.59

R wird häufiger in Russland (5%) und Python häufiger in Asien verwendet (59%).

Hauptsprachen nach Big-Data-Hosting-Nutzung

49%41%30%27%23%19%15% 9% 8% 7% 6%
Alle Ergebnisse

Python und Java werden häufiger mit Google Cloud verwendet, JavaScript und PHP mit AWS, und C# mit Azure.

Nutzung von Big-Data-Tools nach Big-Data-Hosting

30%26%22%14%10% 4% 3% 2% 1% 1% 3%47%

Jupyter und Apache Beam werden häufiger zusammen mit Google Cloud verwendet. Apache Spark und Apache Kafka werden häufiger in Verbindung mit AWS verwendet.

Hauptsprachen nach Beteiligung an Datenanalyse/Data Engineering/maschinellem Lernen

52%31%29%28%18%18%11%10% 8% 8% 6% 5% 4%
Alle Ergebnisse

Spezialist*innen für maschinelles Lernen verwenden häufiger Python, C++ oder C und seltener SQL oder PHP im Vergleich zu Entwickler*innen, die sich mit Datenanalyse und Data Engineering befassen.

Hauptsprachen nach Sektoren

Zu
Von
Wert
-
IT-KerngeschäftBanken/FinanzwesenBildung und WissenschaftVertrieb / Groß- und EinzelhandelIndustriefertigung
46%55%66%43%47%Python
33%27%23%37%32%JavaScript
29%34%19%21%20%Java
29%36%21%40%29%SQL
20%12%15%29%15%PHP
16%15%16%22%18%HTML / CSS
14%9%6%9%10%TypeScript
11%11%10%9%28%C#
10%7%19%6%12%C++
10%7%2%6%6%Go
10%14%13%9%9%Shell-Skriptsprachen
5%5%3%6%9%Kotlin
4%4%6%1%4%C
4%5%0%3%4%Scala
3%1%1%1%1%Rust
3%1%3%1%-Swift
2%2%1%3%2%Dart
2%1%1%3%2%Ruby
1%1%6%2%-R
1%1%0%4%4%Visual Basic
0%-4%-1%MATLAB
4%5%3%4%2%Sonstiges
00.66
IT-Kerngeschäft
Banken/Finanzwesen
Bildung und Wissenschaft
Vertrieb / Groß- und Einzelhandel
Industriefertigung
Zu
Von
Wert
-
PythonJavaScriptJavaSQLPHPHTML / CSSTypeScriptC#C++GoShell-SkriptsprachenKotlinCScalaRustSwiftDartRubyRVisual BasicMATLABSonstiges
00.66

Python und R werden eher von Entwickler*innen verwendet, die in Bildung und Wissenschaft tätig sind.

Nutzung von Big-Data-Tools nach Sektoren

Zu
Von
Wert
-
IT-KerngeschäftBanken/FinanzwesenBildung und WissenschaftVertrieb / Groß- und EinzelhandelIndustriefertigung
29%33%38%27%26%Jupyter
24%36%14%26%15%Apache Spark
23%33%6%21%9%Apache Kafka
15%24%7%12%4%Apache Hadoop/MapReduce
13%21%4%14%6%Apache Hive
7%9%1%3%2%Apache Flink
3%7%6%1%4%Dask
2%5%0%1%1%Apache Beam
2%3%2%1%-Apache Pig
1%2%-3%-Apache Tez
3%2%4%2%1%Sonstiges
46%40%53%53%61%Keine
00.61
IT-Kerngeschäft
Banken/Finanzwesen
Bildung und Wissenschaft
Vertrieb / Groß- und Einzelhandel
Industriefertigung
Zu
Von
Wert
-
JupyterApache SparkApache KafkaApache Hadoop/MapReduceApache HiveApache FlinkDaskApache BeamApache PigApache TezSonstigesKeine
00.61

Jupyter wird häufiger in Bildung und Wissenschaft verwendet. Apache Spark, Apache Kafka, Apache Hadoop und Apache Hive werden häufiger im Bankensektor verwendet.

Apache-Spark-Nutzung nach Land oder Region

29%29%27%20%19%19%18%18%17%16%16%
Alle Ergebnisse

Den höchsten Nutzungsanteil hat Apache Spark in China, Indien, Südkorea, Spanien und Lateinamerika.

Danke, dass Sie sich die Zeit genommen haben!

Wir hoffen, dass Sie unseren Bericht nützlich fanden. Teilen Sie diesen Bericht im Freundes- und Kollegenkreis.

Werden Sie Mitglied im JetBrains Tech Insights Lab

Nehmen Sie an Umfragen und UX-Studien teil, um JetBrains-Produkte benutzerfreundlicher und gleichzeitig leistungsfähiger zu machen. Durch die Teilnahme an unserer Forschung können Sie auch Prämien erhalten.

Wenn Sie Fragen oder Anregungen haben, schreiben Sie uns bitte unter surveys@jetbrains.com.