Aller au contenu

Les cinq piliers du Machine Learning


L'intelligence artificielle n'est plus un mythe, elle est devenue une réalité. Les machines sont capables d'affectuer des tâches initialement réservées aux humains et cela est possible grâce à l'apprentissage, c'est tout l'objet du machine learning. Dans cette formation, je vous propose de découvrir les notions fondamentales du machine learning et la librairie Scikit-learn de l'INRIA.

Comprendre l’apprentissage machine

Qu'est-ce que l'apprentissage machine ? Comment est-ce que les machines apprennent ? Je vous donne des pistes de réponses à ces questions.

L'apprentissage ou l'entraînement fait intervenir cinq (5) éléments à savoir:

  1. Un problème
  2. Des données
  3. Un modèle
  4. La fonction de coût ou de perte
  5. Une méthode d’optimisation

Apprendre, c’est trouver le meilleur ensemble de règles qui rendent compte des données. Du point de vue mathématique, il s'agit plus précisément de minimiser la fonction de perte.

Ces règles ici, sont les paramètres du modèle dont nous devons déterminer les valeurs optimales.

Au bout d’un processus itératif (entraînement), on trouve les valeurs optimales des paramètres du modèle.

1. Problème ou Objectif

Dans notre cas d'étude, l’objectif est de prédire le diagnostic du cancer de prostate.

2. Données

Les données constituent le nerf de la guerre, pas de données pas d'apprentissage.

Caractéristiques Étiquettes
Les caractéristiques, également appelées entrées ou prédicteurs, représentent les données d'entrée fournies au modèle lors du processus d'apprentissage. Elles sont utilisées par le modèle pour effectuer des prédictions ou pour apprendre à partir des données. On note généralement X. Les étiquettes, également appelées sorties, sont les valeurs cibles associées à chaque exemple de données. Elles représentent ce que le modèle doit prédire ou apprendre à estimer à partir des caractéristiques fournies. Les étiquettes sont souvent utilisées pour évaluer les performances du modèle et pour guider le processus d'apprentissage. On note généralement y.

3. Modèle

Un modèle est une fonction mathématique ou un ensemble de règles permettant d’attribuer une étiquette à une donnée nouvelle.

4. Fonction de coût

Pour estimer les valeurs optimales des paramètres du modèle, on associe une fonction coût aux erreurs des prédictions faites qu’elle fait.

C’est cette fonction de coût encore appelé fonction de perte qui nous indique sur les performances du modèle. L’objectif de l’entraînement consistera à optimiser la valeur de la fonction de coût.

L’entropie binaire croisée est un exemple de fonction de coût.

5. Méthode d’optimisation

L’objectif de la fonction de coût est d’optimiser la valeur de la fonction de coût. Il existe différents types de méthodes d’optimisation:

  • les méthodes exactes
  • les méthodes itératives
  • les méthodes stochastiques

Déscente de Gadient

Déscente de Gadient Stochastique


https://learn.microsoft.com/fr-fr/training/modules/introduction-to-machine-learning/4-understand-training. Dans la prochaine section, nous verrons comment est-ce que tout cela est orchestré dans un workflow.

Partagez sur les réseaux sociaux

Commentaires