गूगल बुधवार, 21 फरवरी को जेम्मा नामक कृत्रिम बुद्धिमत्ता (एआई) मॉडल का एक नया हल्का ओपन-सोर्स परिवार जारी किया गया। जेम्मा के दो वेरिएंट, जेम्मा 2बी और जेम्मा 7बी, डेवलपर्स और शोधकर्ताओं के लिए उपलब्ध कराए गए हैं। टेक दिग्गज ने कहा कि उसने जेम्मा के लिए उसी तकनीक और अनुसंधान का उपयोग किया है जिसका उपयोग उसने बनाने में किया था मिथुन राशि एआई मॉडल. दिलचस्प बात यह है कि जेमिनी 1.5 मॉडल था अनावरण किया पिछले सप्ताह। इन छोटे भाषा मॉडल का उपयोग कार्य-विशिष्ट एआई उपकरण बनाने के लिए किया जा सकता है, और कंपनी जिम्मेदार व्यावसायिक उपयोग और वितरण की अनुमति देती है।
यह घोषणा गूगल के सीईओ सुंदर पिचाई ने की डाक एक्स पर (जिसे पहले ट्विटर के नाम से जाना जाता था)। उन्होंने कहा, “भाषा की समझ और तर्क के लिए सभी बेंचमार्क में मजबूत प्रदर्शन का प्रदर्शन करते हुए, जेम्मा आज से दुनिया भर में दो आकारों (2बी और 7बी) में उपलब्ध है, यह टूल और सिस्टम की एक विस्तृत श्रृंखला का समर्थन करता है, और एक डेवलपर लैपटॉप, वर्कस्टेशन या @GoogleCloud पर चलता है। ।” कंपनी ने भी किया है बनाया था एआई मॉडल के लिए एक डेवलपर-केंद्रित लैंडिंग पेज, जहां लोग इसके कागल मॉडल पेज पर क्विकस्टार्ट लिंक और कोड उदाहरण पा सकते हैं, वर्टेक्स एआई (एआई/एमएल टूल बनाने के लिए डेवलपर्स के लिए Google का प्लेटफॉर्म) के माध्यम से एआई टूल को तुरंत तैनात कर सकते हैं, या इसके साथ खेल सकते हैं। मॉडल बनाएं और इसे Collab का उपयोग करके एक अलग डोमेन से जोड़ें (इसके लिए Keras 3.0 की आवश्यकता होगी)।
जेम्मा एआई मॉडल की कुछ विशेषताओं पर प्रकाश डालते हुए, Google ने कहा कि दोनों वेरिएंट पूर्व-प्रशिक्षित और निर्देश-ट्यून हैं। यह हगिंग फेस, मैक्सटेक्स्ट, NVIDIA NeMo और TensorRT-LLM जैसे लोकप्रिय डेटा रिपॉजिटरी के साथ एकीकृत है। भाषा मॉडल वर्टेक्स एआई और गूगल कुबेरनेट्स इंजन (जीकेई) के माध्यम से लैपटॉप, वर्कस्टेशन या Google क्लाउड पर चल सकते हैं। टेक दिग्गज ने डेवलपर्स को सुरक्षित और जिम्मेदार एआई टूल बनाने में मदद करने के लिए एक नया रिस्पॉन्सिबल जेनरेटिव एआई टूलकिट भी जारी किया है।
Google द्वारा साझा की गई रिपोर्ट के अनुसार, जेम्मा ने मैसिव मल्टीटास्क लैंग्वेज अंडरस्टैंडिंग (MMLU), ह्यूमनएवल, हेलास्वैग और BIG-बेंच हार्ड (BBH) जैसे कई प्रमुख बेंचमार्क में मेटा के लामा-2 भाषा मॉडल से बेहतर प्रदर्शन किया है। उल्लेखनीय रूप से, मेटा विभिन्न रिपोर्टों के अनुसार, लामा-3 पर काम शुरू हो चुका है।
डेवलपर्स और शोधकर्ताओं के लिए ओपन-सोर्स छोटे भाषा मॉडल जारी करना एआई क्षेत्र में एक चलन बन गया है। स्थिरता, मेटा, मोज़ेकएमएल और यहां तक कि Google अपने Flan-T5 मॉडल के साथ पहले से ही ओपन-सोर्स में मौजूद है। एक ओर, यह एक पारिस्थितिकी तंत्र बनाने में मदद करता है क्योंकि सभी डेवलपर्स और डेटा वैज्ञानिक जो एआई फर्मों के साथ काम नहीं कर रहे हैं, वे प्रौद्योगिकी में अपना हाथ आजमा सकते हैं, और अद्वितीय उपकरण बना सकते हैं। दूसरी ओर, इससे कंपनी को भी फ़ायदा होता है क्योंकि अक्सर कंपनियाँ स्वयं परिनियोजन प्लेटफ़ॉर्म पेश करती हैं जो सदस्यता शुल्क के साथ आते हैं। इसके अलावा, डेवलपर्स द्वारा अपनाया जाना अक्सर प्रशिक्षण डेटा या एल्गोरिदम में खामियों को उजागर करता है जो रिलीज से पहले पता लगाने से बच सकते हैं, जिससे उद्यमों को अपने मॉडल में सुधार करने की अनुमति मिलती है।