Google ने सोमवार को अपने सोशल मीडिया प्लेटफॉर्म पर एक वीडियो साझा किया, जिसमें उसकी कृत्रिम बुद्धिमत्ता (AI)-संचालित चैटबॉट की नई क्षमताओं को दिखाया गया है। मिथुन राशि. यह वीडियो कंपनी के वार्षिक डेवलपर-केंद्रित कार्यक्रम से ठीक एक दिन पहले जारी किया गया था गूगल आई/ओ आयोजन। ऐसा माना जाता है कि तकनीकी दिग्गज एआई के आसपास कई घोषणाएं कर सकते हैं और नई सुविधाओं और संभवतः नए एआई मॉडल का अनावरण कर सकते हैं। इसके अलावा, केंद्र-मंच द्वारा उठाए जाने की संभावना है एंड्रॉइड 15 और Wear OS 5, जिसका अनावरण इवेंट के दौरान किया जा सकता है।
एक्स (जिसे पहले ट्विटर के नाम से जाना जाता था) पर पोस्ट किए गए एक लघु वीडियो में, Google के आधिकारिक खाते ने अपने इन-हाउस एआई चैटबॉट की नई क्षमताओं को छेड़ा। 50 सेकंड लंबे वीडियो में उसके भाषण में उल्लेखनीय सुधारों पर प्रकाश डाला गया, जिससे जेमिनी को अधिक भावनात्मक आवाज और मॉड्यूलेशन मिला जो उसे और अधिक मानवीय रूप देता है। इसके अलावा, वीडियो में नई कंप्यूटर विज़न क्षमताओं पर प्रकाश डाला गया। एआई स्क्रीन पर दृश्यों को पकड़ सकता है और उसका विश्लेषण कर सकता है।
जेमिनी स्मार्टफोन के कैमरे तक भी पहुंच सकता है, यह क्षमता फिलहाल उसके पास नहीं है। उपयोगकर्ता अंतरिक्ष में कैमरा घुमा रहा था और उसने एआई से यह बताने को कहा कि उसने क्या देखा। लगभग बिना किसी समय अंतराल के, चैटबॉट सेटिंग को एक चरण के रूप में वर्णित कर सकता है और संकेत दिए जाने पर इसे पहचान भी सकता है गूगल I/O लोगो और इसके आसपास की जानकारी साझा करें।
वीडियो में एआई के बारे में कोई और विवरण साझा नहीं किया गया, बल्कि लोगों से अधिक जानने के लिए कार्यक्रम देखने के लिए कहा गया। ऐसे कुछ प्रश्न हैं जिनका उत्तर इवेंट के दौरान दिया जा सकता है जैसे कि क्या Google कंप्यूटर विज़न के लिए एक नए बड़े भाषा मॉडल (एलएलएम) का उपयोग कर रहा है या क्या यह जेमिनी 1.5 प्रो का उन्नत संस्करण है। इसके अलावा, Google यह भी बता सकता है कि AI अपने कंप्यूटर विज़न के साथ और क्या कर सकता है। विशेष रूप से, ऐसी अफवाहें हैं कि तकनीकी दिग्गज जेम्स पेश कर सकते हैं, जिन्हें चैटबॉट एजेंट माना जाता है जिन्हें विशेष कार्यों के लिए डिज़ाइन किया जा सकता है, जैसे ओपनएआई जीपीटी.
जबकि Google के इवेंट में जेमिनी के लिए नई सुविधाएँ पेश करने की उम्मीद है, OpenAI ने सोमवार को अपना स्प्रिंग अपडेट इवेंट आयोजित किया और अपने नवीनतम GPT-4o AI मॉडल का अनावरण किया जिसने इसमें सुविधाएँ जोड़ीं चैटजीपीटी, Google द्वारा साझा किए गए वीडियो के समान। नया एआई मॉडल इसे वार्तालाप भाषण, कंप्यूटर विज़न, वास्तविक समय भाषा अनुवाद और बहुत कुछ करने की अनुमति देता है।