Les questions de cette section ont été posées aux développeurs impliqués dans l’analyse de données, l’ingénierie de données ou le machine learning, ou travaillant comme analyste de données, ingénieur de données ou data scientist. Cette enquête s’adressait aux développeurs, les résultats ne sont donc pas forcément représentatifs des professionnels du secteur du big data dans leur ensemble.

Big Data

Quel·s logiciel·s de statistiques utilisez-vous pour analyser et visualiser les données ?

Les éditeurs de type tableur sont les outils les plus utilisés pour l’analyse et la visualisation des données (46 %).

Quelles plateformes d'analyse big data utilisez-vous ?

La majorité des développeurs big data n’utilisent pas de plateforme d’analyse de données spécifique (68 %). La plateforme d’analyse de données la plus utilisée est Google Colab (19 %).

Quels outils big data utilisez-vous ?

Jupyter est l’outil de big data le plus populaire. Il est utilisé par 32 % des développeurs big data. Les autres outils populaires sont Apache Spark (20 %) et Apache Kafka (17 %).

Quelle version de Spark utilisez-vous ?

Où hébergez vous principalement vos données ?

Les données sont principalement hébergées sur des serveurs internes (36 %) ou localement (26 %). AWS est utilisé pour l’hébergement des données par 21 % des répondant·e·s. Les autres types d’hébergement sont moins courants.

L'informatique est-t-elle l'activité principale de votre entreprise ?

Les spécialistes du machine learning travaillent principalement dans des entreprises dont l’informatique est le cœur de métier.

Dans lesquels des secteurs suivants votre entreprise opère-t-elle principalement ?

Analyse de données

Ingénierie de données

Machine Learning

Lorsqu'ils me travaillent pas dans le secteur informatique, les ingénieurs de données sont le plus souvent employés dans les secteurs financiers, tandis que les spécialistes du machines learning travaillent plus souvent dans les secteurs de l’éducation et des sciences.

Dans lesquels des secteurs suivants votre entreprise opère-t-elle principalement ?

Analyse de données

Ingénierie de données

Machine Learning

Utilisation de Python, Scala et Java avec Apache Spark

Python est utilisé avec Apache Spark par 66 % des participant·es, Java par 34 %, et Scala par 11 %.

Les 10 principales combinaisons d’outils de big data utilisées

10 % utilisent Apache Spark et Apache Kafka. 9 % utilisent Apache Spark et Apache Hadoop.

Les 3 principaux langages utilisés avec Apache Kafka

Les 3 langages les plus utilisés avec Apache Kafka sont Python, Java, and SQL.

Ratio Python/R aux États-Unis, en Europe, en Russie et en Asie

R est plus largement utilisé en Russie (5 %), alors wu Python est plus utilisé en Asie (59 %).

Langage principal basée sur les options d'hébergement

AWS

Google Cloud

Azure

Python et Java sont plus généralement utilisés avec Google Cloud. JavaScript et PHP sont généralement utilisés avec AWS et C# est le plus souvent associé avec Azure.

Utilisation des outils de big data basée sur les options d'hébergement

AWS

Google Cloud

Azure

Jupyter et Apache Beam sont plus généralement utilisés avec Google Cloud. L’utilisation d’Apache Spark et Apache Kafka est plus fréquente chez les utilisateurs d’AWS.

Principal langage pour les personnes impliquées dans l’analyse des données / l’ingénierie des données / le machine learning

Analyse de données

Ingénierie de données

Machine Learning

Les spécialistes du machine learning privilégient l'utilisation de Python, C++ et C et utilisent moins souvent SQL et PHP que les développeurs impliqués dans l’analyse et l’ingénierie des données.

Principaux langages par secteurs

Python et R sont plutôt utilisés par les développeurs travaillant dans les domaines de l’éducation et des sciences.

Utilisation des outils de big data par secteur

L’utilisation de Jupyter est plus marquée dans l’éducation et les sciences. Apache Spark, Apache Kafka, Apache Hadoop et Apache Hive sont plus souvent utilisés dans le secteur bancaire.

Part d’utilisation d’Apache Spark par pays ou région

Le plus grand nombre d’utilisateurs d’Apache Spark se trouve en Chine, en Inde, en Corée du Sud, en Espagne et en Amérique latine.

data:image/svg+xml;base64,PHN2ZyB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciIHdpZHRoPSI2MCIgaGVpZ2h0PSI2MCIgZmlsbD0ibm9uZSIgdmlld0JveD0iMCAwIDYwIDYwIj48ZGVmcz48bGluZWFyR3JhZGllbnQgaWQ9ImJpZy1kYXRhLXRvb2xzX3N2Z19fYSIgeDE9Ii03LjEzMiIgeDI9IjUzLjIxMiIgeTE9Ii45ODMiIHkyPSI2Mi42MTEiIGdyYWRpZW50VW5pdHM9InVzZXJTcGFjZU9uVXNlIj48c3RvcCBvZmZzZXQ9IjAiIHN0b3AtY29sb3I9IiNGRjQ1RUQiLz48c3RvcCBvZmZzZXQ9IjEiIHN0b3AtY29sb3I9IiMwODdDRkEiLz48L2xpbmVhckdyYWRpZW50PjwvZGVmcz48cGF0aCBmaWxsPSJ1cmwoI2JpZy1kYXRhLXRvb2xzX3N2Z19fYSkiIGQ9Ik0zMCAwSDB2NjBsMjkuOTk5LS4wMDJMMzAgNjBhMzAuMDg4IDMwLjA4OCAwIDAgMCAzMC0zMFYzMEEzMC4wODcgMzAuMDg3IDAgMCAwIDMwIDBaIi8+PC9zdmc+

Big Data Tools Plugin

Plugin pour IntelliJ IDEA, DataGrip, PyCharm

Swift et Objective-C

Merci du temps que vous nous avez accordé !

Nous espérons que vous avez trouvé ce rapport intéressant. N'hésitez pas à le partager avec vos ami·e·s et collègues.

Rejoignez le JetBrains Tech Insights Lab

Participez à des enquêtes et à des études sur l'expérience utilisateur pour aider les produits JetBrains à gagner en facilité d'utilisation, mais aussi en puissance. En participant à nos études, vous aurez également la possibilité de gagner des récompenses.

S'inscrire

Si vous avez des questions ou des suggestions, contactez-nous à surveys@jetbrains.com.

Big Data

Quel·s logiciel·s de statistiques utilisez-vous pour analyser et visualiser les données ?

Quelles plateformes d'analyse big data utilisez-vous ?

Quels outils big data utilisez-vous ?

Quelle version de Spark utilisez-vous ?

Où hébergez vous principalement vos données ?

L'informatique est-t-elle l'activité principale de votre entreprise ?

Dans lesquels des secteurs suivants votre entreprise opère-t-elle principalement ?

Dans lesquels des secteurs suivants votre entreprise opère-t-elle principalement ?

Utilisation de Python, Scala et Java avec Apache Spark

Les 10 principales combinaisons d’outils de big data utilisées

Les 3 principaux langages utilisés avec Apache Kafka

Ratio Python/R aux États-Unis, en Europe, en Russie et en Asie

Langage principal basée sur les options d'hébergement

Utilisation des outils de big data basée sur les options d'hébergement

Principal langage pour les personnes impliquées dans l’analyse des données / l’ingénierie des données / le machine learning

Principaux langages par secteurs

Utilisation des outils de big data par secteur

Part d’utilisation d’Apache Spark par pays ou région

Big Data Tools Plugin

Swift et Objective-C

Bases de données

Merci du temps que vous nous avez accordé !

Rejoignez le JetBrains Tech Insights Lab