Python pour le Data Scientist / pour l’économiste


Objectif

Python est récemment devenu une alternative plus que probante pour les scientifiques et comme c’est un langage générique, il est possible de gérer l’ensemble des traitements appliqués aux données, depuis le traitements des sources de données jusqu’à leur visualisation sans changer de langage. Ce cours introduit différents outils qui permettent de faire "parler" les données pour obtenir rapidement des résultats.

Principaux acquis de la formation :

  • Tronc commun :
    • Pratique des principaux problèmes de machines Learning avec scikit-learn (classification, régression, clustering, prétraitement)
    • Visualisation des données

    • Construction d'un module python

    • Traitement des données textuelles (NLP, analyse de sentiments…) 

  • Python pour l'économiste :

    • Retour si nécessaire sur python, les notebooks, les data frames, pandas, numpy, manipulation de données … 

    • Cartographie

    • Ethique des données

    • Webscrapping, API et expressions régulières

    • Séries temporelles

  • Python pour le data scientist :

    • Implémentation de modèles personnalisés avec scikit-learn

    • Déploiement de modèles de machine Learning via des API rest

    • Problèmes moins fréquents de machine learning : apprentissage par renforcement, ranking, recommandation

Plan

– Dataframe, SQL
– Données non structurées (JSON, XML), Grandes données, distribution des calculs
– Visualisation, Graphiques interactifs
– Calcul numérique Optimisation (numpy, scipy, cvxopt)
– Machine Learning, Statistiques descriptives avec scikit-learn
– Code jam, aperçu des exercices qui reviennent fréquemment lors des entretiens d'embauche
– Sujets variés
      – Python et R
      – Python et C#
      – Quelques aspects techniques et légaux (tracer une carte veut dire parfois envoyer ses données à un service externe)

Références

Bibliographie :
– Python for Data Analysis, Wes McKinney
Learning scikit-learn: Machine Learning in Python, Raul Garreta, Guillermo Moncecchi
Modeling Creativity: Case Studies in Python, Tom De Smedt
Critical Mass: How One Thing Leads to Another, Philip Ball
 
MOOC :
Machine Learning par Andrew Y. Ng
Coursera Machine Learning