Domaine : Internet et télécommunications
Produits JetBrains utilisés : Datalore
Taille de l'organisation : 3000+
Pays : Japon
“Au cours du processus d'évaluation, nous avons constaté que nos développeurs trouvaient l'expérience utilisateur de Datalore familière et que la fonctionnalité de partage des rapports était facile à utiliser. Grâce à la collaboration de notre équipe d'ingénierie et de l'équipe de développement de Datalore, nous avons pu répondre à nos exigences en matière de workflow et de gouvernance des données.”
— Seongduk Cheon, manager senior chez LINE Corporation
Je m'appelle Seongduk Cheon. Je suis manager senior chez LINE Corporation et je dirige une organisation appelée Data Platform Department. Notre mission consiste à démocratiser l'utilisation des données et à fournir une plateforme permettant aux utilisateurs au sein de l'entreprise d'analyser les données.
Nous fournissons des services dans plusieurs domaines tels que les médias, le commerce et la fintech, par l'intermédiaire de l'application de communication « LINE » qui compte 193 millions d'utilisateurs actifs mensuels dans le monde, dont 94 millions au Japon.
Le Data Platform Department met à disposition de ses utilisateurs une plateforme de collecte, de stockage, de gestion et d'analyse des données des différents services de LINE. Appelée IU ou Information Universe, il s'agit d'une infrastructure de données à l'échelle de l'entreprise qui contient les données de différentes activités.
Au sein de l'entreprise, la demande en matière d'analyse de données a augmenté ces dernières années. Les demandes de solutions notebook vont plus loin que la simple exécution de requêtes, en particulier pour les data scientists et les ingénieurs en machine learning. OASIS, la solution de notebooks interne que nous utilisions, ne disposait pas des ressources de développement nécessaires pour répondre à ces besoins variés.
Nous avons commencé à évaluer de nouvelles solutions de notebooks et Datalore était l'un des candidats.
Au cours du processus d'évaluation, nous avons constaté que nos développeurs trouvaient l'expérience utilisateur de Datalore familière et que la fonctionnalité de partage des rapports était facile à utiliser.
Grâce à la collaboration de notre équipe d'ingénierie et de l'équipe de développement de Datalore, nous avons pu satisfaire nos exigences en matière de workflow et de gouvernance des données :
Ces fonctionnalités étaient essentielles pour nous et nous avons décidé de choisir Datalore pour notre plateforme de science des données.
« Nous avons également la satisfaction de constater que Datalore est utilisé par beaucoup plus de personnes que ce que nous avions initialement prévu, y compris des personnes occupant des rôles autres que l'ingénierie et la science des données. À terme, nous anticipons que plusieurs centaines de personnes utiliseront Datalore chez LINE. »
Datalore a été déployé chez LINE assez récemment, mais près de la moitié des équipes d'analyse de données au sein du groupe LINE et des sociétés du groupe utilisent Datalore au 1er mars 2023. Nous avons également la satisfaction de constater que Datalore est utilisé par beaucoup plus de personnes que ce que nous avions initialement prévu, y compris des personnes occupant des rôles autres que l'ingénierie et la science des données. À terme, nous anticipons que plusieurs centaines de personnes utiliseront Datalore chez LINE.
Premièrement, les obstacles à l'introduction de Datalore n'étaient pas majeurs. Bien que nous ayons reçu quelques questions des utilisateurs au début, l'interface et l'expérience utilisateur familières ont permis aux personnes qui utilisaient nos solutions internes, OASIS et Jupyter, de démarrer facilement.
Deuxièmement, le plus grand défi pour nos utilisateurs était d'exécuter des tâches dans le mode client de Spark. Grâce à la collaboration entre notre équipe de développement et l'équipe d'assistance de Datalore, nous avons réussi à résoudre ce problème.
Troisièmement, le concept du produit Datalore et la gouvernance des données LINE divergeaient sur le plan de la gestion des autorités, ce qui entraînait quelques difficultés. Grâce à nos discussions collaboratives avec l'équipe de développement de Datalore, nous avons pu régler ce problème et adopter officiellement Datalore.
Comme nous fournissons l'infrastructure des données, nous ne connaissons pas les détails de ces données. Les personnes qui ont accès à l'IU (Information Universe) importent et analysent les données dans Datalore.
Nous partageons généralement les résultats de notre travail en publiant des liens vers les rapports Datalore sur les wikis de l'organisation. Les fonctionnalités de reporting nous sont très utiles.
« Comme Datalore vient d'être déployé, nous avons réussi à libérer des ressources de développement internes lorsque nous avons décidé de basculer de notre plateforme interne de science des données vers Datalore. Nous avons également pu respecter nos exigences en matière de gouvernance des données, ce qui était essentiel pour les politiques de conformité de LINE. »
Comme Datalore vient d'être déployé, nous n'avons pas encore d'évaluation quantitative du ROI. Nous avons toutefois réussi à libérer des ressources de développement internes lorsque nous avons décidé de basculer de notre plateforme interne de science des données vers Datalore. Nous avons également pu respecter nos exigences en matière de gouvernance des données, ce qui était essentiel pour les politiques de conformité de LINE.
Nous espérons que l'introduction de la solution de notebooks de Datalore favorisera une prise de décisions informée par les données chez les acteurs de l'analyse des données au sein du groupe LINE. Le déploiement fluide et rapide des résultats de l'analyse des données dans les différentes divisions commerciales de LINE contribuera à l'activité en accélérant les cycles PDCA et en facilitant la prise de décision basée sur les données.
Netanel Golani, un expert en Threat Hunting chez Hunters
Cela fait maintenant un mois que l'équipe de science des données de Hunters utilise Datalore, et nous avons déjà constaté des gains de productivité et d'utilisation dans nos workflows quotidiens, notamment lors de la manipulation de plusieurs sources de données de clients.
Chad Rosenberg, directeur des technologies, Center for New Data
Datalore nous donne simplement des moyens de travailler sur nos données que nous n’aurons pas dans Airflow, comme le débogage des résultats du pipeline, l’essai des webhooks et la visualisation rapide des données grâce aux fonctionnalités de traçage automatique. La possibilité d’utiliser le connecteur Snowflake natif dans Datalore, ainsi que les connecteurs programmatiques dans pandas, a certainement permis de gagner du temps lors du travail sur des notebooks partagés.
Moreno Raimondo Vendra, ingénieur responsable du machine learning chez TrueLayer
Datalore a offert à notre équipe un accès ergonomique à nos données dans le respect des exigences de sécurité. Cela a complètement changé la donne pour nous. Nous pouvons collaborer beaucoup plus facilement, tant au sein de notre équipe machine learning qu’avec nos autres interlocuteurs et interlocutrices.