Die Fragen in diesem Abschnitt wurden Befragten gestellt, die in den Bereichen Datenanalyse, Data Engineering oder Maschinelles Lernen mitwirken oder als Data Analyst/Data Engineer/Data Scientist tätig sind. Diese Umfrage richtete sich speziell an Entwickler*innen, daher sind die Ergebnisse möglicherweise nicht repräsentativ für die allgemeine Big-Data-Community.
Big Data
Tabellenkalkulationen sind die meistverwendeten Tools bei der Datenanalyse und -visualisierung (46%).
Die Mehrheit der Big-Data-Entwickler*innen nutzt keine spezifischen Datenanalyseplattformen (68%). Die meistverwendete Datenanalyseplattform ist Google Colab (19%).
Jupyter ist das beliebteste Big-Data-Tool: Es wird von 32% der Big-Data-Entwicklergemeinschaft verwendet. Weitere beliebte Tools sind Apache Spark (20%) und Apache Kafka (17%).
Daten werden meist auf internen Servern (36%) oder lokal (26%) gehostet. AWS wird von 21% der Befragten für das Datenhosting verwendet, andere Hosting-Typen sind weniger verbreitet.
In IT-fernen Bereichen werden Data Engineers häufiger im Finanzsektor beschäftigt, während Spezialist*innen für maschinelles Lernen häufiger im Bildungs- und Wissenschaftssektor tätig sind.
66% der Apache-Spark-Nutzer*innen verwenden Python, 34% verwenden Java und 11% verwenden Scala.
10% verwenden sowohl Apache Spark als auch Apache Kafka. 9% verwenden sowohl Apache Spark als auch Apache Hadoop.
Die drei Sprachen, die am häufigsten zusammen mit Apache Kafka verwendet werden, sind Python, Java und SQL.
R wird häufiger in Russland (5%) und Python häufiger in Asien verwendet (59%).
Python und Java werden häufiger mit Google Cloud verwendet, JavaScript und PHP mit AWS, und C# mit Azure.
Jupyter und Apache Beam werden häufiger zusammen mit Google Cloud verwendet. Apache Spark und Apache Kafka werden häufiger in Verbindung mit AWS verwendet.
Spezialist*innen für maschinelles Lernen verwenden häufiger Python, C++ oder C und seltener SQL oder PHP im Vergleich zu Entwickler*innen, die sich mit Datenanalyse und Data Engineering befassen.
Python und R werden eher von Entwickler*innen verwendet, die in Bildung und Wissenschaft tätig sind.
Jupyter wird häufiger in Bildung und Wissenschaft verwendet. Apache Spark, Apache Kafka, Apache Hadoop und Apache Hive werden häufiger im Bankensektor verwendet.
Den höchsten Nutzungsanteil hat Apache Spark in China, Indien, Südkorea, Spanien und Lateinamerika.
Danke, dass Sie sich die Zeit genommen haben!
Wir hoffen, dass Sie unseren Bericht nützlich fanden. Teilen Sie diesen Bericht im Freundes- und Kollegenkreis.
Werden Sie Mitglied im JetBrains Tech Insights Lab
Nehmen Sie an Umfragen und UX-Studien teil, um JetBrains-Produkte benutzerfreundlicher und gleichzeitig leistungsfähiger zu machen. Durch die Teilnahme an unserer Forschung können Sie auch Prämien erhalten.
Wenn Sie Fragen oder Anregungen haben, schreiben Sie uns bitte unter surveys@jetbrains.com.