सेब के लिए पूरी तरह तैयार है मेज़बान मंगलवार, 7 मई को इसका ‘लेट लूज़’ इवेंट होगा, जहां नए आईपैड एयर और आईपैड प्रो मॉडल और एक नया ऐप्पल पेंसिल पेश करने की उम्मीद है। हालाँकि, 10 जून को वर्ल्डवाइड डेवलपर्स कॉन्फ्रेंस (WWDC) 2024, देखने लायक घटना हो सकती है क्योंकि यह संभावित रूप से अपने उपकरणों, विशेष रूप से iPhone के लिए कंपनी के दृष्टिकोण को बदल सकता है। ऐसा कहा जा रहा है कि क्यूपर्टिनो स्थित टेक दिग्गज इसका अनावरण करेगी कृत्रिम होशियारी (AI) रणनीति और iOS 18 के साथ नई सुविधाएँ पेश करना। Apple शोधकर्ताओं द्वारा प्रकाशित पत्रों के आधार पर, हम इसके पीछे कंपनी का दृष्टिकोण देख सकते हैं।
पिछले कुछ महीनों में, Apple शोधकर्ताओं ने AI मॉडल और उनकी कार्यक्षमता पर ध्यान केंद्रित करते हुए कई नए पेपर प्रकाशित किए हैं। हमने कंप्यूटर विज़न के साथ नए AI मॉडल देखे हैं, एक AI मॉडल जो स्क्रीन पर दिखाई देने वाली चीज़ों का पता लगा सकता है, और यहां तक कि छवि संपादन AI मॉडल भी देख सकता है। इसके अलावा, ऐसे विशेष शोध पत्र भी हैं जो ऑन-डिवाइस चैटबॉट को बेहतर बनाने पर ध्यान केंद्रित करते हैं और प्रासंगिक त्वरित प्रसंस्करण क्षमताओं को जोड़ते हैं। यह विशेष मॉडल सिरी के लिए हो सकता है, और इसे अधिक कुशल और अधिक जटिल कार्यों को करने में सक्षम बनाता है।
ऐप्पल के अधिकांश प्रकाशित शोध पत्रों में, छोटे भाषा मॉडल (एसएलएम) पर ध्यान केंद्रित किया गया है जो एक डिवाइस के अंदर स्वतंत्र रूप से काम कर सकते हैं। उदाहरण के लिए, कंपनी ने एक प्रकाशित किया कागज़ ReALM नामक AI मॉडल पर, जिसे भाषा मॉडल के रूप में संदर्भ रिज़ॉल्यूशन के लिए छोटा किया गया है। इस मॉडल की कार्यक्षमता को प्रासंगिक भाषा का उपयोग करके संकेत दिए गए कार्यों को निष्पादित करने और पूरा करने के रूप में वर्णित किया गया है। विवरण से यह विश्वास पैदा हुआ है कि इस मॉडल का उपयोग सिरी को अपग्रेड करने के लिए किया जा सकता है।
ऐसा ही एक और शोध कागज़ एक ‘फेरेट-यूआई’ का उल्लेख करता है, जो एक मल्टीमॉडल एआई मॉडल है जिसे “यूआई स्क्रीन के लिए विशिष्ट सटीक रेफरिंग और ग्राउंडिंग कार्यों को निष्पादित करने के लिए डिज़ाइन किया गया है, जबकि ओपन-एंडेड भाषा निर्देशों की कुशलता से व्याख्या और कार्य किया जाता है।” संक्षेप में, यह आपकी स्क्रीन को पढ़ सकता है और किसी भी इंटरफ़ेस पर कार्रवाई कर सकता है, चाहे वह होम स्क्रीन हो, या कोई ऐप हो। यह कार्यक्षमता अनिवार्य रूप से उंगली के इशारों पर मौखिक आदेशों के माध्यम से iPhone का उपयोग करना अधिक सहज बना सकती है।
फिर कीफ़्रेमर है, जो दावा यह स्थिर छवियों और अन्य AI से एनीमेशन उत्पन्न कर सकता है नमूना जो AI का उपयोग करके छवियों को संपादित कर सकता है। ये क्षमताएं फ़ोटो ऐप में तेजी से सुधार कर सकती हैं और उपयोगकर्ताओं को DALL-E और मिडजॉर्नी की पेशकश के समान सरल चरणों में जटिल संपादन करने की अनुमति देती हैं।
हालाँकि, यह ध्यान दिया जाना चाहिए कि ये अटकलें Apple द्वारा प्रकाशित शोध पत्रों पर आधारित हैं, और इस बात की कोई गारंटी नहीं है कि इन्हें एक फीचर में बदल दिया जाएगा। WWDC 2024 में मुख्य भाषण सत्र के बाद AI के पीछे Apple का दृष्टिकोण स्पष्ट हो जाएगा।