Domaine : Développement de logiciels

Produits JetBrains utilisés : PyCharm

Taille de l'organisation : 30+

Pays : Allemagne

Scieneers

Scieneers est une société informatique composée de 35 experts en informatique, données et science des données, tous passionnés par les données et l'extraction de valeur à partir de ces données. Ils offrent des services ciblés d'ingénierie et de science des données pour extraire des connaissances précieuses et maximiser le potentiel des données.

Vidéo YouTube

“PyCharm se démarque des autres IDE grâce à un ensemble unique de fonctionnalités. La plus importante est sa capacité de refactorisation, fiable et complète. PyCharm se distingue aussi par sa prise en charge des configurations d'exécution avancées. J'apprécie particulièrement « l'impression de poste de pilotage » que PyCharm offre : c'est un espace centralisé qui me permet d'accéder rapidement à tous les outils nécessaires à mon travail.”

— Moritz Renftle, Data Scientist, Scieneers GmbH

Pourriez-vous vous présenter et préciser ce que fait votre entreprise ?

J'ai étudié l'informatique à l'Université de Constance et à l'Institut de technologie de Karlsruhe (KIT), avec une spécialisation en bases de données et en science des données. J'ai rejoint Scieneers en 2022 et depuis, je développe et déploie des solutions de données pour des entreprises de divers secteurs. Mon travail nécessite un large éventail de compétences qui incluent l'analyse des données, le développement de modèles personnalisés, la formation aux techniques récentes de machine learning et le déploiement de pipelines de données dans le cloud.

Scieneers renforce les équipes de nos clients ou leur propose nos équipes pour concevoir et développer des produits de données complets jusqu'à l'étape de production. Outre nos clients du monde des affaires et de la recherche, nous soutenons également de nombreux projets dans le secteur associatif. Vous trouverez plusieurs exemples de notre travail sur notre site web : https://www.scieneers.de.

Qu'est-ce qui vous a incité à choisir PyCharm comme IDE principal ?

Tout d'abord, j'aime « l'impression de poste de pilotage » de PyCharm : c'est un espace centralisé qui me permet d'accéder rapidement à tous les outils dont j'ai besoin pour mon travail. Ces outils incluent un éditeur de code, un système de contrôle de version, un terminal et un navigateur de base de données. Par rapport à l'utilisation de ces outils dans des applications distinctes, PyCharm permet un fonctionnement plus fluide et m'économise « l'énergie cérébrale » gaspillée lors des changements de contexte.

PyCharm se démarque des autres IDE grâce à un ensemble unique de fonctionnalités. La plus importante est sa capacité de refactorisation, fiable et complète. Par rapport à d'autres outils, PyCharm effectue des refactorisations très fiables et assure une continuité de fonctionnement à mon code.

Autre fonctionnalité unique de PyCharm : sa prise en charge des configurations d'exécution avancées. Par exemple, je peux facilement configurer une configuration d'exécution qui lance un script Python localement en tant que tâche « Before launch », avant d'exécuter l'application principale sur une machine distante.

J'aime aussi l'intégration de l'interpréteur SSH distant dans PyCharm. Cet interpréteur peut être un peu compliqué à configurer, en fonction des paramètres réseau et d'autres facteurs. Mais une fois lancé, son fonctionnement est vraiment fiable. Par ailleurs, j'apprécie la possibilité de déboguer du code sur une machine distante. C'est particulièrement utile notamment lors de la formation d'un modèle de machine learning sur une machine distante dotée d'un GPU spécifique que je ne peux pas tester localement. J'apprécie également la facilité avec laquelle on peut exécuter des notebooks Jupyter distants par SSH dans PyCharm. Enfin et surtout, PyCharm m'aide à éviter les envois accidentels de code vers les mauvais clients en spécifiant exactement quels répertoires télécharger vers quelle machine distante.

Quels défis PyCharm vous a-t-il aidé à surmonter dans votre développement ?

PyCharm m'a aidé sur les points suivants :

Réduire le changement de contexte entre plusieurs applications et outils.
Lancer rapidement des refactorisations fiables.
Encapsuler facilement plusieurs étapes d'exécution locales ou distantes dans une configuration d'exécution unique.
Exécuter et déboguer du code sur des machines distantes, en préservant la confidentialité des données.
Expérimenter et prototyper avec des notebooks Jupyter distants.

Quels avantages associez-vous spécifiquement à l'utilisation des notebooks Jupyter dans PyCharm ?

Voici quelques fonctionnalités qui m'ont marqué lors de l'utilisation des notebooks Jupyter dans PyCharm :

L'accès aux refactorisations de PyCharm.
L'extraction fluide du code du notebook vers un paquet séparé.
L'accès au débogueur de PyCharm depuis les cellules du notebook.
La possibilité d'exécuter Jupyter sur une machine distante à l'aide d'un interpréteur SSH.

Pouvez-vous partager un exemple de situation dans laquelle les outils de débogage de PyCharm ont joué un rôle déterminant pour identifier et résoudre des problèmes dans un projet de machine learning ?

Dans une étape de prétraitement de notre pipeline de ML, nous avons rencontré un bug qui produisait des valeurs invraisemblables de la part de nos modèles. Pour déboguer ce problème, j'ai utilisé le débogueur de PyCharm sur une machine GPU distante qui exécutait le pipeline de ML. Nous étions convaincus que le bug se trouvait dans notre propre code et non dans une bibliothèque externe. Lors du débogage, j'ai donc utilisé la fonctionnalité « Step into my code » de PyCharm et ignoré tous les appels intermédiaires du code de la bibliothèque. Nous avons pu localiser et résoudre efficacement le problème en définissant des points d'arrêt et en visualisant des trames de données intermédiaires.

Pourriez-vous nous parler du rôle de PyCharm dans la mise à l'échelle des modèles de machine learning ?

PyCharm permet une mise à l'échelle et des tests réalistes des modèles de ML en les exécutant à distance sur une machine dotée du même matériel que l'environnement de déploiement.

Avez-vous déjà utilisé ou envisagé d'utiliser l'une des fonctionnalités de l'AI Assistant dans PyCharm ?

J'ai l'intention de les essayer à la première occasion. Ce serait formidable si l'on pouvait utiliser un modèle de ML local ou un modèle autohébergé pour la saisie semi-automatique du code par IA.

Contacts