Google ने अपने वार्षिक डेवलपर-केंद्रित कार्यक्रम में कई नई घोषणाएँ कीं गूगल I/O 2024 आयोजन। बहुत बीच मैं कृत्रिम होशियारी मुख्य भाषण सत्र के दौरान की गई (एआई) केंद्रित घोषणाएं विशेष रूप से आश्चर्यजनक थीं। टेक दिग्गज ने अपने टेक्स्ट-टू-इमेज एआई मॉडल, इमेजेन 3 की अगली पीढ़ी को पेश किया। नया एआई मॉडल अपने पूर्ववर्ती इमेजेन 2 के लॉन्च के कुछ महीने बाद पेश किया गया था, जो दिसंबर 2023 में सामने आया था और बाद में जारी किया गया था। अपग्रेड पिछला महीना। कंपनी ने कहा कि नया मॉडल प्रॉम्प्ट का बारीकी से पालन करते हुए विस्तृत फोटोरिअलिस्टिक छवियां उत्पन्न कर सकता है।
इमेजेन 3 को Google DeepMind के वरिष्ठ अनुसंधान निदेशक डगलस एक ने पेश किया था। इसका अनावरण करते हुए उन्होंने कहा, “आज, मैं इमेजन 3 पेश करते हुए बहुत उत्साहित हूं। यह हमारा अब तक का सबसे सक्षम छवि निर्माण मॉडल है। यह लोगों के लिखने के तरीके से लिखे गए संकेतों को समझता है। आप जितने अधिक रचनात्मक और विस्तृत होंगे, उतना बेहतर होगा। साथ ही, टेक्स्ट को प्रस्तुत करने के लिए यह हमारा अब तक का सबसे अच्छा मॉडल है जो छवि निर्माण मॉडल के लिए एक चुनौती रहा है।
कहा जाता है कि एआई मॉडल की संकेतों को समझने की क्षमता में भारी सुधार हुआ है, जो अब इसे छोटे विवरणों को पकड़ने और एक विश्वसनीय छवि उत्पन्न करने के लिए संकेतों का बारीकी से पालन करने की अनुमति देता है। इवेंट के दौरान एआई से संबंधित अधिकांश घोषणाओं के लिए यह एक सामान्य दिशा प्रतीत होती है, क्योंकि अधिकांश एआई मॉडल अब संकेतों को बेहतर ढंग से समझने में सक्षम हैं। गूगल इसमें कहा गया है कि इमेजेन 3 कई संस्करणों में उपलब्ध होगा जहां प्रत्येक मॉडल को एक विशिष्ट प्रकार के कार्य के लिए अनुकूलित किया गया है जो त्वरित स्केच बनाने से लेकर उच्च-रिज़ॉल्यूशन छवियां बनाने तक हो सकता है।
इमेजन 3 को छोटे विवरणों और विशिष्ट निर्देशों जैसे कैमरा कोण या रचनाओं को लंबे, जटिल संकेतों में कैप्चर करने में सक्षम बनाने के लिए, Google ने एआई मॉडल को उन छवियों के साथ प्रशिक्षित किया है जिनमें इसके कैप्शन में विस्तृत विवरण शामिल हैं, जिससे इसे छोटी बारीकियों को भी पकड़ने की अनुमति मिलती है। यह विभिन्न प्रकार की बनावट भी उत्पन्न कर सकता है और पाठ-आधारित छवियों को प्रस्तुत कर सकता है।
सुरक्षा पर ध्यान केंद्रित करते हुए, इमेजन 3 द्वारा उत्पन्न प्रत्येक छवि में सिंथआईडी की वॉटरमार्क लेबलिंग शामिल होगी। यह एक डिजिटल वॉटरमार्क को सीधे छवि के पिक्सेल में एम्बेड करता है, जिससे छवि को क्रॉप करना, साझा करना या कोई भी बदलाव करके इसे हटाना असंभव हो जाता है। आने वाले महीनों में एआई मॉडल के सार्वजनिक पूर्वावलोकन में आने की उम्मीद है। अभी, Google इनपेंटिंग और आउटपेंटिंग संपादन विकल्प जोड़ने पर काम कर रहा है। Imagen 3 वर्तमान में चुनिंदा रचनाकारों के लिए ImageFX के अंदर निजी पूर्वावलोकन में उपलब्ध है। इसे जल्द ही टेक दिग्गज के एंटरप्राइज ग्राहकों के लिए उपलब्ध कराया जाएगा।