Domaine : Développement de logiciels
Produits JetBrains utilisés : PyCharm
Taille de l'organisation : 30+
Pays : Allemagne
Scieneers est une société informatique composée de 35 experts en informatique, données et science des données, tous passionnés par les données et l'extraction de valeur à partir de ces données. Ils offrent des services ciblés d'ingénierie et de science des données pour extraire des connaissances précieuses et maximiser le potentiel des données.
“PyCharm se démarque des autres IDE grâce à un ensemble unique de fonctionnalités. La plus importante est sa capacité de refactorisation, fiable et complète. PyCharm se distingue aussi par sa prise en charge des configurations d'exécution avancées. J'apprécie particulièrement « l'impression de poste de pilotage » que PyCharm offre : c'est un espace centralisé qui me permet d'accéder rapidement à tous les outils nécessaires à mon travail.”
— Moritz Renftle, Data Scientist, Scieneers GmbH
J'ai étudié l'informatique à l'Université de Constance et à l'Institut de technologie de Karlsruhe (KIT), avec une spécialisation en bases de données et en science des données. J'ai rejoint Scieneers en 2022 et depuis, je développe et déploie des solutions de données pour des entreprises de divers secteurs. Mon travail nécessite un large éventail de compétences qui incluent l'analyse des données, le développement de modèles personnalisés, la formation aux techniques récentes de machine learning et le déploiement de pipelines de données dans le cloud.
Scieneers renforce les équipes de nos clients ou leur propose nos équipes pour concevoir et développer des produits de données complets jusqu'à l'étape de production. Outre nos clients du monde des affaires et de la recherche, nous soutenons également de nombreux projets dans le secteur associatif. Vous trouverez plusieurs exemples de notre travail sur notre site web : https://www.scieneers.de.
Tout d'abord, j'aime « l'impression de poste de pilotage » de PyCharm : c'est un espace centralisé qui me permet d'accéder rapidement à tous les outils dont j'ai besoin pour mon travail. Ces outils incluent un éditeur de code, un système de contrôle de version, un terminal et un navigateur de base de données. Par rapport à l'utilisation de ces outils dans des applications distinctes, PyCharm permet un fonctionnement plus fluide et m'économise « l'énergie cérébrale » gaspillée lors des changements de contexte.
PyCharm se démarque des autres IDE grâce à un ensemble unique de fonctionnalités. La plus importante est sa capacité de refactorisation, fiable et complète. Par rapport à d'autres outils, PyCharm effectue des refactorisations très fiables et assure une continuité de fonctionnement à mon code.
Autre fonctionnalité unique de PyCharm : sa prise en charge des configurations d'exécution avancées. Par exemple, je peux facilement configurer une configuration d'exécution qui lance un script Python localement en tant que tâche « Before launch », avant d'exécuter l'application principale sur une machine distante.
J'aime aussi l'intégration de l'interpréteur SSH distant dans PyCharm. Cet interpréteur peut être un peu compliqué à configurer, en fonction des paramètres réseau et d'autres facteurs. Mais une fois lancé, son fonctionnement est vraiment fiable. Par ailleurs, j'apprécie la possibilité de déboguer du code sur une machine distante. C'est particulièrement utile notamment lors de la formation d'un modèle de machine learning sur une machine distante dotée d'un GPU spécifique que je ne peux pas tester localement. J'apprécie également la facilité avec laquelle on peut exécuter des notebooks Jupyter distants par SSH dans PyCharm. Enfin et surtout, PyCharm m'aide à éviter les envois accidentels de code vers les mauvais clients en spécifiant exactement quels répertoires télécharger vers quelle machine distante.
PyCharm m'a aidé sur les points suivants :
Voici quelques fonctionnalités qui m'ont marqué lors de l'utilisation des notebooks Jupyter dans PyCharm :
Dans une étape de prétraitement de notre pipeline de ML, nous avons rencontré un bug qui produisait des valeurs invraisemblables de la part de nos modèles. Pour déboguer ce problème, j'ai utilisé le débogueur de PyCharm sur une machine GPU distante qui exécutait le pipeline de ML. Nous étions convaincus que le bug se trouvait dans notre propre code et non dans une bibliothèque externe. Lors du débogage, j'ai donc utilisé la fonctionnalité « Step into my code » de PyCharm et ignoré tous les appels intermédiaires du code de la bibliothèque. Nous avons pu localiser et résoudre efficacement le problème en définissant des points d'arrêt et en visualisant des trames de données intermédiaires.
PyCharm permet une mise à l'échelle et des tests réalistes des modèles de ML en les exécutant à distance sur une machine dotée du même matériel que l'environnement de déploiement.
J'ai l'intention de les essayer à la première occasion. Ce serait formidable si l'on pouvait utiliser un modèle de ML local ou un modèle autohébergé pour la saisie semi-automatique du code par IA.