Aprendizaje de tiro cero (explicado de forma sencilla)

Imagen de: https://encord.com/blog/zero-shot-learning-explained/

¿Qué es el aprendizaje sin disparos (ZSL)?

Aprendizaje sin disparos (ZSL) es un enfoque de aprendizaje automático que permite a los modelos reconocer y categorizar las cosas que han nunca antes visto sin necesitar ejemplos etiquetados de esas cosas nuevas durante el entrenamiento. A diferencia del aprendizaje supervisado, que requiere una gran cantidad de datos etiquetados, que deben categorizarse explícitamente, ZSL utiliza información auxiliar como incrustaciones semánticas (que son representaciones numéricas del significado de palabras o conceptos) o atributos (características descriptivas como el color, la forma o la categoría).

¿Cómo funciona Zero-Shot Learning?

Como hemos dicho anteriormente, la ZSL utiliza información auxiliar para rellenar el hueco entre lo que ha visto ("clases vistas") y lo que no ("clases no vistas"), he aquí un desglose:

  • Clases vistas: Categorías en las que se ha entrenado el modelo, con ejemplos etiquetados.
  • Clases no vistas: Nuevas categorías que el modelo nunca ha visto durante el entrenamiento.
  • Información auxiliar: Descripciones, atributos o relaciones semánticas que describen clases vistas y no vistas (por ejemplo, "una cebra es como un caballo pero con rayas").

Ejemplo: Supongamos que has entrenado a tu modelo para reconocer caballos y gatos, pero nunca le enseñas una cebra. Entonces, procedes a describir cómo es una cebra, por ejemplo podrías decir que una cebra es un "caballo con rayas", el modelo puede utilizar lo que sabe sobre los caballos y la nueva información sobre las rayas para identificar una cebra aunque nunca antes haya visto una.

¿Cómo es el proceso?

El Aprendizaje Cero Disparos suele consistir en dos etapas principales:

  1. Formación: Hacer que el modelo aprenda a partir de datos etiquetados para que pueda reconocer aquello en lo que ha sido entrenado.
  2. Inferencia: Cuando al modelo se le muestra algo que no ha visto antes, utiliza la información auxiliar obtenida en el paso anterior y el nuevo ejemplo para hacer una predicción basada en las similitudes.

¿Por qué es importante?

  1. Ahorra tiempo y recursos: No es necesario recopilar y etiquetar enormes conjuntos de datos para cada categoría posible.
  2. Se ocupa de casos raros o nuevos: Los modelos pueden reconocer clases nuevas, raras o emergentes sin necesidad de reentrenamiento.
  3. Flexibilidad en el mundo real: Útil en ámbitos en los que aparecen nuevas categorías con frecuencia o es difícil obtener datos etiquetados, como la imagen médica, el procesamiento del lenguaje o la vigilancia de la fauna salvaje.

Aplicaciones del aprendizaje de tiro por cero

  • Clasificación de imágenes: Reconocer nuevos tipos de animales u objetos sin imágenes etiquetadas.
  • Procesamiento del lenguaje natural: Comprender nuevos temas o intenciones en un texto sin ejemplos explícitos.
  • Diagnóstico médico: Identificación de enfermedades raras mediante descripciones y relaciones con afecciones conocidas.
  • Calificación automatizada: Generar comentarios para nuevos tipos de tareas utilizando el conocimiento de tareas similares.

Retos de ZSL

  • Calidad de la información auxiliar: El éxito del modelo depende de lo bien que los atributos o descripciones capten las diferencias entre las clases.
  • Límites de generalización: Si las clases no vistas son muy diferentes de las vistas, el modelo puede tener dificultades para hacer predicciones precisas.

Resumen

El aprendizaje cero permite a los sistemas de IA dar sentido a lo desconocido aprovechando relaciones, descripciones y atributos, lo que les permite reconocer cosas nuevas sin haberlas visto antes. Esto hace que la IA sea más adaptable, eficiente y útil en un mundo en el que surgen constantemente nuevos datos y categorías.

Más información sobre Zero-Shot Learning

IBM: https://www.ibm.com/think/topics/zero-shot-learning
Grammarly: https://www.grammarly.com/blog/ai/what-is-zero-shot-learning/
V7Labs: https://www.v7labs.com/blog/zero-shot-learning-guide
Encord: https://encord.com/blog/zero-shot-learning-explained/


Comentarios

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

es_MXSpanish