Informations sur le projet

  • Rôle : Data Scientist, Data Analyst
  • Entreprise : ALSTOM
  • Durée de la mission : depuis Février 2023.
  • Objectif : Analyser les données (Transport) puis deployer des rapports Tableau Software.
  • Données : Energie, Trains, Metros, Trams, Incidents, Alertes, etc.
Outils utilisés
  • Python: Scikit-learn, Numpy, Pandas, Logger
  • Python Web: Requests, BeautifulSoup, ElasticSearch
  • Data Viz: Tableau Software, PowerBI, Plotly, Matplotlib
  • Type de fichiers : Parquet, Csv, JSON, XML, Yml
  • Git, GitHub
  • PyCharm, Jupyter Notebook

Missions réalisées
  • Projet1: Génération de rapports visuels (Tableau) permettant de monitorer la consommation énergétique de trains/métros en Suède
    • Recueil et intégration des besoins clients
    • Intégration et traitement des données venant directement des trains
    • Requêtage SQL (avec jointure) pour extraire les données d'énergie
    • Analyse et comparaison avec PowerBI des formats de fichiers (Csv, Feather, Parquet et Pickle) afin de trouver un format optimal pour les données d’énergie
    • Stockage et manipulation de fichiers cache sous ElasticSearch
    • Déploiement de scripts de génération sur plusieurs environnements (Dev, Stagging et Production)
    • Collaboration avec les équipes à l'international (anglaises, suédoises, indiennes et italiennes)

  • Projet2: Proof-of-concept sur la génération de rapports sur les données d'évènements (alertes, incidents, etc) des trains/métros selon le projet (client)
    • Ecoute et prise en compte des besoins clients : projets localisés à Londres, Madrid et Inde
    • Requête API et gestion des réponses en python
    • Traitement et nettoyage des évènements avec des librairies python comme pandas, numpy, requests
    • Déploiement autonome de rapports Tableau sur la plateforme d'exécution du client

  • Réalisation de la documentation associée et des manuels d'utilisation

  • Gestion et organisation des missions avec l'outil Notion.