Context Windows & Tokens in AI: A Simple Explanation

संदर्भ विंडो और टोकन एआई में, विशेष रूप से लार्ज लैंग्वेज मॉडल्स (एलएलएम) में, दो मूलभूत अवधारणाएँ हैं। इन अवधारणाओं को समझने से यह समझने में मदद मिलेगी कि एआई मॉडल पर्याप्त रूप से विकसित हो जाने के बाद बातचीत के कुछ हिस्सों को "भूल" क्यों जाते हैं और साथ ही, मॉडल द्वारा जटिल संकेतों की गलत व्याख्या क्यों की जा सकती है।

टोकन क्या हैं?

एआई में, एक टोकन एक डेटा की इकाई जो किसी वर्ण, शब्द या वाक्यांश का प्रतिनिधित्व कर सकता है। आप इसे ऐसे बिल्डिंग ब्लॉक्स के रूप में सोच सकते हैं जिनका उपयोग मॉडल अपने उत्तर बनाने के लिए करते हैं। आमतौर पर, अंग्रेजी भाषा में, प्रत्येक टोकन 4 अक्षरों के बराबर होता है, हालाँकि यह कोई नियम नहीं है। अन्य भाषाओं में टोकनीकरण की तुल्यता अलग-अलग होती है और यह स्वयं AI सिस्टम पर भी निर्भर हो सकता है।

टोकन का उदाहरण:

पूर्ण शब्द ("घर," "बिल्ली," "अद्भुत")
शब्दों के भाग (“अन-” “अपेक्षित-” “-ed”)
व्यक्तिगत वर्ण (विशेषकर “.” या “?” जैसे विराम चिह्नों के लिए)
शब्दों के बीच रिक्त स्थान

उदाहरण के लिए, वाक्य “मुझे AI के बारे में सीखना बहुत पसंद है!” को निम्नलिखित जैसे टोकनों में तोड़ा जा सकता है:

"मैं"
" प्यार"
" सीखना"
" के बारे में"
” एआई”
“!”

टोकन क्यों मायने रखते हैं?

टोकन एआई सिस्टम को भाषा को ज़्यादा कुशलता से प्रोसेस करने में मदद करते हैं। वे आपके द्वारा दर्ज किए जाने वाले हर शब्द को समझने की कोशिश नहीं करते, बल्कि टोकन की सीमित शब्दावली के साथ काम करते हैं। इससे उनका काम और भी आसान हो जाता है।

संदर्भ विंडो क्या है?

संदर्भ विंडो वह सीमा है जिसके भीतर कुछ मॉडल आपके द्वारा वार्तालाप में दी गई जानकारी को स्मृति में रखेंगे, ताकि बाद में उत्तर दे सकें।

संदर्भ विंडो यह दर्शाती है कि एक AI मॉडल प्रतिक्रिया उत्पन्न करते समय एक साथ कितना टेक्स्ट (टोकन में मापा गया) "देख" और विचार कर सकता है। इसमें शामिल हैं:

आपका वर्तमान प्रश्न या अनुरोध
बातचीत में पिछले संदेश
आपके द्वारा साझा किए गए कोई भी दस्तावेज़ या जानकारी
एआई की अपनी पिछली प्रतिक्रियाएँ

संदर्भ विंडोज़ क्यों मायने रखती है?

संदर्भ विंडो इस मायने में महत्वपूर्ण हैं कि वे आउटपुट/उत्तर की गुणवत्ता को प्रभावित करती हैं। मान लीजिए कि किसी AI के पास 8000 टोकन (लगभग 6 हज़ार शब्द) की एक संदर्भ विंडो है, तो वह उत्तर तैयार करने के लिए केवल उतने ही संदर्भ पर विचार कर सकता है। इस संदर्भ विंडो के बाहर की हर चीज़ AI के लिए प्रभावी रूप से अदृश्य होगी।

इन अवधारणाओं को समझने के कुछ व्यावहारिक लाभ:

यदि आप एक लंबे समय का विश्लेषण करें दस्तावेज़, आपको इसे संदर्भ विंडो के भीतर संक्षेप में प्रस्तुत करने, इसे छोटे खंडों में विभाजित करने, फिर उनका विश्लेषण करने और महत्वपूर्ण भागों पर ध्यान केंद्रित करने की आवश्यकता हो सकती है
के लिए रचनात्मक लेखनमान लीजिए कि आप किसी कहानी पर काम कर रहे हैं, तो आप इस बात पर नजर रखना चाहेंगे कि संदर्भ विंडो का कितना हिस्सा उपयोग किया जा रहा है, समय-समय पर बातचीत को रिफ्रेश करें और टोकन बचाते हुए निरंतरता सुनिश्चित करने के लिए पिछले अध्यायों का सारांश दें।
के लिए कोडन प्रोजेक्ट्स में, आप यह सुनिश्चित करना चाहेंगे कि आप अपने लक्ष्य को प्राप्त करने के लिए केवल आवश्यक संदर्भ ही प्रदान करें। एआई के साथ प्रोग्रामिंग करने वाले व्यक्ति के लिए, आलसी होना और जिस समस्या को आप हल करने का प्रयास कर रहे हैं, उसके बारे में बहुत अधिक या बहुत कम जानकारी देना आसान है। हालाँकि, इससे सर्वोत्तम परिणाम नहीं मिलते और यह आपके लिए किसी भी चीज़ से ज़्यादा बाधा बन सकता है।

संदर्भ विंडोज़ के साथ काम करने की रणनीतियाँ

संक्षिप्त रहें: टोकन बचाने के लिए स्पष्ट लेकिन कुशलतापूर्वक संवाद करें।
जानकारी को प्राथमिकता दें: सबसे महत्वपूर्ण विवरण पहले शामिल करें।
जब संभव हो तो संक्षेप में लिखें: संपूर्ण दस्तावेज़ चिपकाने के बजाय, मुख्य बिंदुओं के साथ सारांश साझा करने पर विचार करें।
साफ - सफाई: लंबी बातचीत में, जब संदर्भ अप्रासंगिक जानकारी से भर जाए, तो नए सिरे से बातचीत शुरू करने पर विचार करें।
अपने प्रश्नों की संरचना इस प्रकार करें: सुव्यवस्थित, विशिष्ट प्रश्न एआई को अतिरिक्त बातचीत के बिना आपकी आवश्यकताओं को समझने में मदद करते हैं।

निष्कर्ष

कृत्रिम बुद्धिमत्ता (एआई) के साथ काम करते समय टोकन और कॉन्टेक्स्ट विंडो महत्वपूर्ण अवधारणाएं हैं। इन्हें समझने से आपको एआई मॉडल के साथ बेहतर संवाद स्थापित करने, उनकी पूरी क्षमता का उपयोग करने और उनकी सीमाओं के भीतर रहते हुए काम करने में मदद मिलेगी। जैसे-जैसे एआई तकनीक उन्नत होती जा रही है, कॉन्टेक्स्ट विंडो का आकार बढ़ता जा रहा है और टोकन प्रोसेसिंग अधिक कुशल होती जा रही है, लेकिन ये अवधारणाएं भाषा एआई के साथ हमारे अंतर्संबंध के मूल में बनी हुई हैं।

संसाधन:

टोकन:

डेटाकैंप: https://www.datacamp.com/blog/what-is-tokenization
माइक्रोसॉफ्ट: https://learn.microsoft.com/en-us/dotnet/ai/conceptual/understanding-tokens
पर प्रकाश: https://www.lighton.ai/lighton-blogs/the-magic-of-tokens-in-generative-ai-a-deep-dive

संदर्भ विंडो:

आईबीएम: https://www.ibm.com/think/topics/context-window
मैककिन्से: https://www.mckinsey.com/featured-insights/mckinsey-explainers/what-is-a-context-window
नेबियस: https://nebius.com/blog/posts/context-window-in-ai

एआई में संदर्भ विंडोज़ और टोकन: एक सरल व्याख्या