
什麼是 Zero-shot learning (ZSL) ?
零點學習 (ZSL) 是一種機器學習方法,可讓模型識別事物並將其分類。 前所未见 在訓練過程中,不需要這些新事物的任何標記範例。監督式學習需要大量的標記資料,這些資料必須明確分類,與此不同的是,ZSL 使用輔助資訊,例如 語意嵌入 (是詞彙或概念意義的數字表示)或 屬性 (顏色、形狀或類別等描述性特徵)。
Zero-Shot Learning 如何運作?
正如我們之前所說,ZSL 使用輔助資訊來填補它所見過的 (「見過的類別」) 和未見過的 (「未見過的類別」) 之間的差距,以下是細分:
- 見過的班級: 使用標示範例訓練模型的類別。
- 未見過的班級: 模型在訓練期間從未見過的新類別。
- 輔助資訊: 說明、屬性或語義關係,可同時描述看得到和看不到的類別(例如:「斑馬像馬,但有條紋」)。
例子: 比方說,您已經訓練您的模型去辨識馬和貓了,但是您從來沒有給它看過斑馬。然後,您開始描述斑馬是什麼樣子,例如,您可以說斑馬是一匹「有條紋的馬」,模型就可以利用它對馬的認識以及關於條紋的新資訊來辨識斑馬,即使它以前從未見過斑馬。
流程是怎樣的?
零射擊學習通常包括 兩個主要階段:
- 訓練: 讓模型從標籤資料中學習,使其能夠識別所訓練的資料。
- 推論: 當模型看到以前未見過的東西時,它會使用從上一步和新範例中獲得的輔助資訊,根據相似性做出預測。
為什麼重要?
- 節省時間和資源: 不需要為每個可能的類別收集和標示龐大的資料集。
- 處理罕見或新的案例: 模型可辨識新的、罕見的或新興的類別,而無需重新訓練。
- 真實世界的彈性: 適用於經常出現新類別或標示資料難以取得的領域,例如醫療影像、語言處理或野生動物監測
零點學習的應用
- 影像分類: 在沒有標籤圖像的情況下識別新類型的動物或物件。
- 自然語言處理: 在沒有明確例子的情況下,理解文字中的新主題或意圖。
- 醫療診斷: 利用描述和與已知病症的關係識別罕見疾病。
- 自動分級: 利用類似任務的知識,產生對新型任務的回饋。
ZSL 的挑戰
- 輔助資訊的品質: 模型的成功與否取決於屬性或描述是否能很好地捕捉類別之間的差異。
- 概括限制: 如果未見過類別與已見過類別有很大差異,模型可能難以做出準確的預測。
概括
零點學習 (Zero-shot learning) 可讓人工智能系統利用關係、描述和屬性來理解未知事物,讓它們在未曾見過新事物的情況下也能識別出來。這讓人工智能在新資料和新類別不斷出現的世界中,更具適應性、更有效率、更有用。
進一步了解 Zero-Shot Learning
IBM: https://www.ibm.com/think/topics/zero-shot-learning
Grammarly: https://www.grammarly.com/blog/ai/what-is-zero-shot-learning/
V7Labs: https://www.v7labs.com/blog/zero-shot-learning-guide
Encord: https://encord.com/blog/zero-shot-learning-explained/

發佈留言