Session Data science appliquée et machine learning 2024

Cette session propose une découverte du Machine Learning par la pratique et un aperçu d’applications possibles.
Microcertification

Informations

Période

27 juin 2024 - 28 juin 2024
2 Crédits ECTS (Microcertification)
14 Heures enseignement en présence
Microcertification: travail personnel pour un total de 40h

Niveau CEC

7

Langue

Français

Format

En présence

Renseignements

Elisabeth GIUDICELLI
+41 (0)22 379 02 23
Elisabeth.Giudicelli(at)unige.ch

Lieu

Uni Battelle

Inscriptions

Délai d'inscription

30 mai 2024

Finance d'inscription:

CHF 950.- sans microcertification
CHF 1100.- avec microcertification

D'autres tarifs sont disponibles sur demande.

Contribution aux ODD

Objectif 4 : Assurer l’accès de tous à une éducation de qualité, sur un pied d’égalité, et promouvoir les possibilités d’apprentissage tout au long de la vie Objectif 9 : Bâtir une infrastructure résiliente, promouvoir une industrialisation durable qui profite à tous et encourager l’innovation

Objectifs

  • Comprendre ce qu'est la Data Science, le Machine Learning et l’Intelligence Artificielle, de la théorie à la pratique
  • Identifier les différentes étapes des pipelines d’apprentissage automatique
  • Découvrir et s’exercer avec différents outils classiques

Public

Développeur/euse, analyste

Programme

Jour 1:

  • Introduction
    • Qu’est-ce que la Data Science? Définition et relations avec le Machine Learning et l’Intelligence Artificielle?
  • Machine Learning
    • Types d’apprentissage, types de problèmes, et cas d’utilisation pratiques
    • Comment ça marche?
  • Pipeline de l'apprentissage automatique : Des données au modèle
    • Collecte et préparation des données
      • Problèmes de données courants
      • Préparation et partitionnement
    • Extraction des caractéristiques
      • Sélection des caractéristiques
      • Réduction des dimensions
      • Normalisation
    • Entraînement et évaluation du modèle
      • Sélection de l'algorithme approprié
      • Métriques d’évaluation
      • Sur-apprentissage et sous-apprentissage: le dilemme biais-variance
      • Ajustement des hyper-paramètres
  • Outils du Data Scientist: Python, Jupyter Notebook, Numpy, Scikit-learn, Git, etc.
  • Mise en pratique

 

Jour 2:

  • Qu’est-ce que le Deep Learning?
  • Exemples d’applications
    • Traitement d’images
    • Traitement du langage naturel
    • Autres
  • Modèles de Deep Learning
    • Convolutional Neural Networks (NN)
    • Recurrent NN
    • Transformer Networks
  • Apprentissage par transfert (Transfer Learning)
  • Mise en pratique

Direction

Prof. Giovanna DI MARZO SERUGENDO, Centre universitaire d'informatique (CUI), Université de Genève

Coordination

Dre Lamia FRIHA, Université de Genève

Conditions d'admission

  • Connaissances de base en programmation type Python
  • Notions de statistiques sont un plus

Les participant-es devront disposer d'un laptop (Mac OS, linux, Windows). Les logiciels à installer seront communiqués avant le cours.

Aziza Merzouki, PhD - Scientific Collaborator II - Data Scientist - Institute of Global Health – Université de Genève

Aziza est titulaire d'un doctorat en Informatique de l'Université de Genève (UNIGE). Elle travaille entant que Data Scientist et collaboratrice de recherche à l'Institut de Santé Globale, dans la division des Maladies Infectieuses et de la Modélisation Mathématique.

Durant ses études doctorales, elle s'est plongée dans le monde de la modélisation numérique appliquée aux applications biologiques. Pendant cette période, elle a exercé en tant qu'assistante d'enseignement pour des cours avancés portant sur des sujets tels que les méta-heuristiques pour les problèmes d'optimisation, la modélisation et la simulation, ainsi que la finance computationnelle.

Depuis qu'elle a rejoint l'Institut de Santé Mondiale, Aziza mène des projets de recherche centrés sur la relation entre les facteurs socio-comportementaux et le VIH, ainsi que sur l'amélioration de la qualité des soins de santé en Afrique subsaharienne. Son travail se concentre sur l'utilisation de vastes ensembles de données complexes et l'application de méthodes statistiques, de techniques d'apprentissage automatique, de modélisation mathématique et de simulations numériques.

Contribution aux ODD

Objectif 4 : Assurer l’accès de tous à une éducation de qualité, sur un pied d’égalité, et promouvoir les possibilités d’apprentissage tout au long de la vie Objectif 9 : Bâtir une infrastructure résiliente, promouvoir une industrialisation durable qui profite à tous et encourager l’innovation