L'apprentissage à partir de zéro (expliqué simplement)

Image de : https://encord.com/blog/zero-shot-learning-explained/

Qu'est-ce que l'apprentissage à partir de zéro (ZSL) ?

Apprentissage à partir de zéro (ZSL) est une approche d'apprentissage automatique qui permet aux modèles de reconnaître et de catégoriser les choses qu'ils ont déjà vues. jamais vu auparavant sans avoir besoin d'exemples étiquetés de ces nouveaux éléments pendant la formation. Contrairement à l'apprentissage supervisé qui nécessite un grand nombre de données étiquetées, qui doivent être catégorisées explicitement, ZSL utilise des informations auxiliaires telles que enchâssements sémantiques (qui sont des représentations numériques de la signification des mots ou des concepts) ou attributs (caractéristiques descriptives telles que la couleur, la forme ou la catégorie).

Comment fonctionne l'apprentissage Zero-Shot ?

Comme nous l'avons dit précédemment, ZSL utilise des informations auxiliaires pour combler l'écart entre ce qu'il a vu ("classes vues") et ce qu'il n'a pas vu ("classes non vues") :

  • Classes vues : Catégories sur lesquelles le modèle est formé, avec des exemples étiquetés.
  • Classes invisibles : Nouvelles catégories que le modèle n'a jamais vues au cours de la formation.
  • Informations auxiliaires : Descriptions, attributs ou relations sémantiques qui décrivent à la fois des classes visibles et invisibles (par exemple, "un zèbre est comme un cheval mais avec des rayures").

Exemple : Supposons que vous ayez entraîné votre modèle à reconnaître des chevaux et des chats, mais que vous ne lui ayez jamais montré un zèbre. Le modèle peut utiliser ce qu'il sait des chevaux et les nouvelles informations sur les rayures pour identifier un zèbre, même s'il n'en a jamais vu auparavant.

Comment se déroule le processus ?

L'apprentissage à partir de zéro consiste généralement à deux étapes principales :

  1. Formation : Faire en sorte que le modèle apprenne à partir de données étiquetées afin qu'il puisse reconnaître ce sur quoi il a été formé.
  2. Déduction : Lorsqu'on montre au modèle quelque chose qu'il n'a pas vu auparavant, il utilise les informations auxiliaires qu'il a acquises lors de l'étape précédente et le nouvel exemple pour faire une prédiction basée sur les similitudes.

Pourquoi est-ce important ?

  1. Gain de temps et de ressources : Il n'est pas nécessaire de collecter et d'étiqueter d'énormes ensembles de données pour chaque catégorie possible.
  2. Traite les cas rares ou nouveaux : Les modèles peuvent reconnaître des classes nouvelles, rares ou émergentes sans nécessiter de recyclage.
  3. Flexibilité dans le monde réel : Utile dans les domaines où de nouvelles catégories apparaissent souvent ou où il est difficile d'obtenir des données étiquetées, comme l'imagerie médicale, le traitement du langage ou la surveillance de la faune.

Applications de l'apprentissage à partir de zéro

  • Classification des images : Reconnaître de nouveaux types d'animaux ou d'objets sans images étiquetées.
  • Traitement du langage naturel : Comprendre de nouveaux sujets ou de nouvelles intentions dans un texte sans exemples explicites.
  • Diagnostic médical : Identifier les maladies rares à l'aide de descriptions et de liens avec des maladies connues.
  • Notation automatisée : Générer un retour d'information pour de nouveaux types de missions en utilisant la connaissance de tâches similaires.

Les défis de ZSL

  • Qualité des informations auxiliaires : Le succès du modèle dépend de la manière dont les attributs ou les descriptions rendent compte des différences entre les classes.
  • Limites de la généralisation : Si les classes non vues sont très différentes des classes vues, le modèle peut avoir du mal à faire des prédictions précises.

Résumé

L'apprentissage à partir de zéro permet aux systèmes d'IA de donner un sens à l'inconnu en s'appuyant sur les relations, les descriptions et les attributs, ce qui leur permet de reconnaître de nouvelles choses sans les avoir jamais vues auparavant. L'IA devient ainsi plus adaptable, plus efficace et plus utile dans un monde où de nouvelles données et catégories apparaissent constamment.

En savoir plus sur Zero-Shot Learning

IBM : https://www.ibm.com/think/topics/zero-shot-learning
Grammarly : https://www.grammarly.com/blog/ai/what-is-zero-shot-learning/
V7Labs: https://www.v7labs.com/blog/zero-shot-learning-guide
Encord: https://encord.com/blog/zero-shot-learning-explained/


Commentaires

Laisser un commentaire

Votre adresse courriel ne sera pas publiée. Les champs obligatoires sont indiqués avec *

fr_CAFrench