नई दिल्ली 15 मई। भारत में एक, दो या तीन नहीं बल्कि कई भाषाएं बोली जाती हैं, दिलचस्प बात तो यह है कि भारत के कई क्षेत्र ऐसे भी हैं जहां लगभग हर 5 किलोमीटर में भाषा बदल जाती है. Google ने एआई टेक्नोलॉजी की मदद से सभी भाषाओं को समझने वाला एक शानदार टूल तैयार कर लिया है. गूगल डेवलपर्स ने ऐसी टेक्नोलॉजी को डेवलप किया है जो न केवल लोगों की भाषा को समझ सकती है बल्कि उन्हें उनकी भाषा में जवाब भी दे सकती है.
पहले कई ऐसे मॉडल तैयार किए गए जो इंग्लिश लैंग्वेज डेटा पर ट्रेन्ड थे और अब एक मॉडल तैयार किया गया है जो भारत की कई भाषाओं पर ट्रेंड है. Google Gemma कंपनी के ओपन मॉडल का हिस्सा है. Gemma को इस तरह से डिजाइन किया गया है जो सभी चैलेंज को दूर करने में सक्षम है, इसका पावरफुल टोकनाइज़र और बड़ी टोकन शब्दावली (vocabulary) इसे अलग-अलग भाषाओं में जवाब देने के लिए सक्षम बनाती है.
नेचुरल लैंग्वेज प्रोसेसिंग और मशीन लर्निंग के जरिए जब टेक्स्ट को छोटे भागों में कंवर्ट किया जाता है तो उसे टोकन कहते हैं. ये टोकन अक्षरों जितने छोटे या शब्दों जितने लंबे हो सकते हैं.
Gemini मॉडल को तैयार करने वाली रिसर्च और टेक्नोलॉजी का ही इस्तेमाल Gemma को लिए भी डेवलप करने के लिए किया गया है. गूगल जेम्मा एक लाइटवेट ओपन मॉडल है जिसे Google DeepMind और गूगल की अन्य टीमों द्वारा तैयार किया गया है.
गूगल Gemma का पावरफुल टोकनाइजर मॉडल को ऐनेबल करता है और फिर ये मॉडल हजारों शब्द, सिंबल और कैरेक्टर्स को समझने के लिए लैंग्वेज सिस्टम का इस्तेमाल करता है. Navarasa जैसे प्रोजेक्ट्स को पावर देने के लिए बड़ी शब्दावली (vocabulary) भी काफी जरूरी है.
भारत में डेवलपर्स ने Navarasa को तैयार करने के लिए कंपनी के Gemma मॉडल का इस्तेमाल किया है. नवरासा एक ऐसा प्रोजेक्ट या फिर कह लीजिए ऐसा मॉडल है जिसे इस तरह से ट्रेन्ड किया गया है कि वह अलग-अलग भारतीय भाषाओं को समझने में सक्षम है.
नवरासा एक फाइन-ट्यून मॉडल है जो Google Gemma पर बेस्ड है. नवरासा को बनाने के पीछे का मकसद बड़े लैंग्वेज मॉडल्स को बनाना है जिससे कि लोग इससे अपनी मातृभाषा में बात कर सकें और उन्हें जवाब भी उनकी मातृभाषा में मिले. इस मॉडल को तैयार करने के पीछे गूगल का मकसद देश के हर कोने से हर एक व्यक्ति को AI से जोड़ना है.