Aprendizado Zero-Shot (Explicação simples)

Imagem de: https://encord.com/blog/zero-shot-learning-explained/

O que é aprendizagem de tiro zero (ZSL)?

Aprendizagem de tiro zero (ZSL) é uma abordagem de aprendizado de máquina que permite que os modelos reconheçam e categorizem as coisas que eles têm nunca visto antes sem precisar de exemplos rotulados dessas coisas novas durante o treinamento. Diferentemente do aprendizado supervisionado, que exige muitos dados rotulados, que devem ser categorizados explicitamente, a ZSL usa informações auxiliares, como incorporação semântica (que são representações numéricas do significado de palavras ou conceitos) ou atributos (características descritivas como cor, forma ou categoria).

Como funciona o Zero-Shot Learning?

Como dissemos anteriormente, a ZSL usa informações auxiliares para preencher a lacuna entre o que foi visto ("classes vistas") e o que não foi visto ("classes não vistas"):

  • Aulas vistas: Categorias nas quais o modelo é treinado, com exemplos rotulados.
  • Classes invisíveis: Novas categorias que o modelo nunca viu durante o treinamento.
  • Informações auxiliares: Descrições, atributos ou relações semânticas que descrevem classes visíveis e não visíveis (por exemplo, "uma zebra é como um cavalo, mas com listras")

Exemplo: Digamos que você tenha treinado seu modelo para reconhecer cavalos e gatos, mas nunca mostrou a ele uma zebra. Por exemplo, você poderia dizer que uma zebra é um "cavalo com listras". O modelo pode usar o que sabe sobre cavalos e as novas informações sobre listras para identificar uma zebra, mesmo que nunca tenha visto uma antes.

Como é o processo?

O Zero-Shot Learning geralmente consiste em dois estágios principais:

  1. Treinamento: Fazer com que o modelo aprenda com dados rotulados para que ele possa reconhecer aquilo em que foi treinado.
  2. Inferência: Quando é mostrado ao modelo algo que ele nunca viu antes, ele usa as informações auxiliares obtidas na etapa anterior e o novo exemplo para fazer uma previsão com base nas semelhanças.

Por que é importante?

  1. Economiza tempo e recursos: Não há necessidade de coletar e rotular enormes conjuntos de dados para cada categoria possível.
  2. Lida com casos raros ou novos: Os modelos podem reconhecer classes novas, raras ou emergentes sem retreinamento.
  3. Flexibilidade no mundo real: Útil em áreas em que novas categorias aparecem com frequência ou em que é difícil obter dados rotulados, como imagens médicas, processamento de linguagem ou monitoramento da vida selvagem

Aplicativos de aprendizagem Zero-Shot

  • Classificação de imagens: Reconhecimento de novos tipos de animais ou objetos sem imagens rotuladas.
  • Processamento de linguagem natural: Compreensão de novos tópicos ou intenções no texto sem exemplos explícitos.
  • Diagnóstico médico: Identificação de doenças raras usando descrições e relações com doenças conhecidas.
  • Avaliação automatizada: Geração de feedback para novos tipos de atribuições usando o conhecimento de tarefas semelhantes.

Desafios da ZSL

  • Qualidade das informações auxiliares: O sucesso do modelo depende de quão bem os atributos ou as descrições capturam as diferenças entre as classes.
  • Limites de generalização: Se as classes não vistas forem muito diferentes das classes vistas, o modelo poderá ter dificuldades para fazer previsões precisas.

Resumo

A aprendizagem zero-shot capacita os sistemas de IA a dar sentido ao desconhecido, aproveitando relacionamentos, descrições e atributos, permitindo que eles reconheçam coisas novas sem nunca tê-las visto antes. Isso torna a IA mais adaptável, eficiente e útil em um mundo em que novos dados e categorias estão surgindo constantemente.

Saiba mais sobre o Zero-Shot Learning

IBM: https://www.ibm.com/think/topics/zero-shot-learning
Grammarly: https://www.grammarly.com/blog/ai/what-is-zero-shot-learning/
V7Labs: https://www.v7labs.com/blog/zero-shot-learning-guide
Registro: https://encord.com/blog/zero-shot-learning-explained/


Comentários

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

pt_BRPortuguese