सेब शोधकर्ताओं ने एक नया पेपर प्रकाशित किया है कृत्रिम होशियारी (एआई) मॉडल जिसके बारे में उसका दावा है कि वह प्रासंगिक भाषा को समझने में सक्षम है। अभी तक सहकर्मी-समीक्षा किए जाने वाले शोध पत्र में यह भी उल्लेख किया गया है कि बड़े भाषा मॉडल (एलएलएम) बहुत अधिक कम्प्यूटेशनल शक्ति का उपभोग किए बिना पूरी तरह से डिवाइस पर काम कर सकते हैं। एआई मॉडल का विवरण इसे स्मार्टफोन सहायक की भूमिका के लिए उपयुक्त बनाता है, और यह तकनीकी दिग्गज के मूल आवाज सहायक सिरी को अपग्रेड कर सकता है। पिछले महीने, एप्पल प्रकाशित MM1 नामक मल्टीमॉडल AI मॉडल के बारे में एक अन्य पेपर।
शोध पत्र वर्तमान में प्री-प्रिंट चरण में है और इसे arXiv पर प्रकाशित किया गया है, जो विद्वानों के पत्रों का एक ओपन-एक्सेस ऑनलाइन भंडार है। AI मॉडल को ReALM नाम दिया गया है, जिसे भाषा मॉडल के रूप में संदर्भ रिज़ॉल्यूशन के लिए छोटा किया गया है। पेपर इस बात पर प्रकाश डालता है कि मॉडल का प्राथमिक फोकस उन कार्यों को निष्पादित करना और पूरा करना है जो प्रासंगिक भाषा का उपयोग करके प्रेरित किए जाते हैं, जो कि मनुष्यों के बोलने के तरीके के लिए अधिक सामान्य है। उदाहरण के लिए, अखबार के दावे के अनुसार, यह तब समझ में आएगा जब कोई उपयोगकर्ता कहता है, “मुझे नीचे से दूसरे स्थान पर ले चलो”।
ReALM को स्मार्ट डिवाइस पर कार्य करने के लिए बनाया गया है। इन कार्यों को तीन खंडों में विभाजित किया गया है – ऑन-स्क्रीन इकाइयाँ, संवादात्मक इकाइयाँ और पृष्ठभूमि इकाइयाँ। पेपर में साझा किए गए उदाहरणों के आधार पर, ऑन-स्क्रीन इकाइयां डिवाइस की स्क्रीन पर दिखाई देने वाले कार्यों को संदर्भित करती हैं, संवादात्मक इकाइयां उपयोगकर्ता द्वारा अनुरोध किए गए कार्यों पर आधारित होती हैं, और पृष्ठभूमि इकाइयां पृष्ठभूमि में होने वाले कार्यों को संदर्भित करती हैं जैसे कि एक ऐप पर गाना बज रहा है.
इस एआई मॉडल के बारे में दिलचस्प बात यह है कि पेपर का दावा है कि प्रासंगिक संकेतों के माध्यम से सुझाए गए कार्यों को समझने, संसाधित करने और निष्पादित करने के जटिल कार्य के बावजूद, इसमें उच्च मात्रा में कम्प्यूटेशनल ऊर्जा की आवश्यकता नहीं होती है, “ReaLM को व्यावहारिक के लिए एक आदर्श विकल्प बनाना” संदर्भ रिज़ॉल्यूशन प्रणाली जो प्रदर्शन से समझौता किए बिना डिवाइस पर मौजूद हो सकती है।” यह प्रमुख एलएलएम जैसे प्रमुख एलएलएम की तुलना में काफी कम मापदंडों का उपयोग करके इसे प्राप्त करता है जीपीटी-3.5 और जीपीटी-4.
पेपर यह भी दावा करता है कि ऐसे प्रतिबंधित वातावरण में काम करने के बावजूद, एआई मॉडल ने “काफी हद तक” बेहतर प्रदर्शन किया। ओपनएआई जीपीटी-3.5 और जीपीटी-4. पेपर आगे विस्तार से बताता है कि जबकि मॉडल ने GPT-3.5 की तुलना में केवल-टेक्स्ट बेंचमार्क पर बेहतर स्कोर किया, इसने डोमेन-विशिष्ट उपयोगकर्ता कथनों के लिए GPT-4 को बेहतर प्रदर्शन किया।
हालाँकि पेपर आशाजनक है, फिर भी इसकी अभी तक सहकर्मी-समीक्षा नहीं की गई है, और इस प्रकार इसकी वैधता अनिश्चित बनी हुई है। लेकिन अगर पेपर को सकारात्मक समीक्षा मिलती है, तो यह ऐप्पल को मॉडल को व्यावसायिक रूप से विकसित करने और यहां तक कि इसे बनाने के लिए उपयोग करने के लिए प्रेरित कर सकता है महोदय मै होशियार.