OpenAI एक ऑडियो टूल का पूर्वावलोकन करता है जो 15 सेकंड में आपकी आवाज़ को क्लोन कर सकता है

ओपनएआई एक ऐसी सुविधा के लिए परीक्षण के प्रारंभिक परिणाम साझा कर रहा है जो एक ठोस मानवीय आवाज में शब्दों को पढ़ सकता है – कृत्रिम बुद्धिमत्ता के लिए एक नई सीमा को उजागर करता है और डीपफेक जोखिमों के खतरे को बढ़ाता है। कंपनी टेक्स्ट-टू-स्पीच मॉडल के छोटे पैमाने के पूर्वावलोकन से शुरुआती डेमो और उपयोग के मामलों को साझा कर रही है, जिसे कहा जाता है आवाज इंजनएक प्रवक्ता ने कहा, जिसे उसने अब तक लगभग 10 डेवलपर्स के साथ साझा किया है। ओपनएआई ने इस सुविधा के व्यापक रोलआउट के खिलाफ फैसला किया, जिसके बारे में उसने इस महीने की शुरुआत में संवाददाताओं को जानकारी दी थी।

ओपनएआई के एक प्रवक्ता ने कहा कि कंपनी ने नीति निर्माताओं, उद्योग विशेषज्ञों, शिक्षकों और क्रिएटिव जैसे हितधारकों से प्रतिक्रिया प्राप्त करने के बाद रिलीज को कम करने का फैसला किया। पहले की प्रेस ब्रीफिंग के अनुसार, कंपनी ने शुरू में एक एप्लिकेशन प्रक्रिया के माध्यम से 100 से अधिक डेवलपर्स के लिए टूल जारी करने की योजना बनाई थी।

कंपनी ने शुक्रवार को एक ब्लॉग पोस्ट में लिखा, “हम मानते हैं कि लोगों की आवाज़ से मिलता-जुलता भाषण तैयार करने में गंभीर जोखिम होते हैं, जो चुनावी वर्ष में विशेष रूप से दिमाग में सबसे ऊपर होते हैं।” “हम सरकार, मीडिया, मनोरंजन, शिक्षा, नागरिक समाज और उससे परे के अमेरिकी और अंतर्राष्ट्रीय साझेदारों के साथ जुड़ रहे हैं ताकि यह सुनिश्चित किया जा सके कि हम निर्माण करते समय उनकी प्रतिक्रिया को शामिल कर रहे हैं।”

अन्य ऐ कुछ संदर्भों में नकली आवाज़ों के लिए प्रौद्योगिकी का उपयोग पहले ही किया जा चुका है। जनवरी में, राष्ट्रपति जो बिडेन की ओर से कथित तौर पर एक फर्जी लेकिन यथार्थवादी लगने वाला फोन कॉल ने न्यू हैम्पशायर में लोगों को प्राइमरी में वोट न देने के लिए प्रोत्साहित किया – एक ऐसी घटना जिसने महत्वपूर्ण वैश्विक चुनावों से पहले एआई के डर को बढ़ा दिया।

ऑडियो सामग्री तैयार करने के ओपनएआई के पिछले प्रयासों के विपरीत, वॉयस इंजन ऐसा भाषण बना सकता है जो व्यक्तिगत लोगों की तरह लगता है, उनके विशिष्ट ताल और स्वर के साथ। सॉफ़्टवेयर को अपनी आवाज़ को फिर से बनाने के लिए बोलने वाले व्यक्ति के 15 सेकंड के रिकॉर्ड किए गए ऑडियो की आवश्यकता होती है।

टूल के प्रदर्शन के दौरान, ब्लूमबर्ग ने ओपनएआई के मुख्य कार्यकारी अधिकारी की एक क्लिप सुनी सैम ऑल्टमैन ऐसी आवाज़ में प्रौद्योगिकी को संक्षेप में समझाते हुए जो उनके वास्तविक भाषण से अप्रभेद्य लग रही थी, लेकिन पूरी तरह से एआई-जनित थी।

ओपनएआई के उत्पाद प्रमुख जेफ हैरिस ने कहा, “यदि आपके पास सही ऑडियो सेटअप है, तो यह मूल रूप से एक मानव-क्षमता वाली आवाज है।” “यह काफी प्रभावशाली तकनीकी गुणवत्ता है।” हालाँकि, हैरिस ने कहा, “मानव भाषण की वास्तव में सटीक नकल करने की क्षमता के आसपास स्पष्ट रूप से बहुत सारी सुरक्षा संबंधी नाजुकता है।”

टूल का उपयोग करने वाले ओपनएआई के वर्तमान डेवलपर भागीदारों में से एक, गैर-लाभकारी स्वास्थ्य प्रणाली लाइफस्पैन में नॉर्मन प्रिंस न्यूरोसाइंसेज इंस्टीट्यूट, मरीजों को उनकी आवाज को ठीक करने में मदद करने के लिए प्रौद्योगिकी का उपयोग कर रहा है। उदाहरण के लिए, इस उपकरण का उपयोग एक युवा मरीज की आवाज को बहाल करने के लिए किया गया था, जो ब्रेन ट्यूमर के कारण स्पष्ट रूप से बोलने की क्षमता खो चुकी थी, एक स्कूल प्रोजेक्ट के लिए पहले की रिकॉर्डिंग से उसके भाषण की नकल करके, कंपनी ब्लॉग पोस्ट में कहा गया है।

OpenAI का कस्टम स्पीच मॉडल अपने द्वारा उत्पन्न ऑडियो का विभिन्न भाषाओं में अनुवाद भी कर सकता है। यह इसे Spotify Technology SA जैसी ऑडियो व्यवसाय वाली कंपनियों के लिए उपयोगी बनाता है। Spotify ने लेक्स फ्रिडमैन जैसे लोकप्रिय होस्ट के पॉडकास्ट का अनुवाद करने के लिए अपने स्वयं के पायलट कार्यक्रम में पहले से ही प्रौद्योगिकी का उपयोग किया है। ओपनएआई ने प्रौद्योगिकी के अन्य लाभकारी अनुप्रयोगों की भी वकालत की, जैसे कि बच्चों के लिए शैक्षिक सामग्री के लिए आवाजों की एक विस्तृत श्रृंखला तैयार करना।

परीक्षण कार्यक्रम में, ओपनएआई को अपने साझेदारों को इसकी उपयोग नीतियों से सहमत होने, अपनी आवाज का उपयोग करने से पहले मूल वक्ता से सहमति प्राप्त करने और श्रोताओं को यह बताने की आवश्यकता है कि वे जो आवाजें सुन रहे हैं वे एआई-जनरेटेड हैं। कंपनी एक अश्रव्य ऑडियो वॉटरमार्क भी स्थापित कर रही है ताकि यह पता लगाया जा सके कि ऑडियो का एक टुकड़ा उसके टूल द्वारा बनाया गया था या नहीं।

यह निर्णय लेने से पहले कि सुविधा को अधिक व्यापक रूप से जारी किया जाए या नहीं, ओपनएआई ने कहा कि वह बाहरी विशेषज्ञों से प्रतिक्रिया मांग रहा है। कंपनी ने ब्लॉग पोस्ट में कहा, “यह महत्वपूर्ण है कि दुनिया भर के लोग समझें कि यह तकनीक किस ओर जा रही है, चाहे हम अंततः इसे स्वयं व्यापक रूप से तैनात करें या नहीं।”

ओपनएआई ने यह भी लिखा है कि उसे उम्मीद है कि उसके सॉफ्टवेयर का पूर्वावलोकन अधिक उन्नत एआई प्रौद्योगिकियों द्वारा लाई गई चुनौतियों के खिलाफ “सामाजिक लचीलेपन को मजबूत करने की आवश्यकता को प्रेरित करेगा”। उदाहरण के लिए, कंपनी ने बैंकों से बैंक खातों और संवेदनशील जानकारी तक पहुंचने के लिए सुरक्षा उपाय के रूप में ध्वनि प्रमाणीकरण को चरणबद्ध तरीके से बंद करने का आह्वान किया। यह भ्रामक एआई सामग्री के बारे में सार्वजनिक शिक्षा और ऑडियो सामग्री वास्तविक है या एआई-जनित है इसका पता लगाने के लिए तकनीकों के अधिक विकास की भी मांग कर रहा है।

(यह कहानी एनडीटीवी स्टाफ द्वारा संपादित नहीं की गई है और एक सिंडिकेटेड फीड से ऑटो-जेनरेट की गई है।)

संबद्ध लिंक स्वचालित रूप से उत्पन्न हो सकते हैं – हमारा देखें नैतिक वक्तव्य जानकारी के लिए।

What's Hot

Moto G05 भारत में 7 जनवरी को लॉन्च होगा; विशिष्टताओं का खुलासा

निंटेंडो पेटेंट का सुझाव है कि स्विच 2 को डीएलएसएस-स्टाइल अपस्केलिंग तकनीक मिलेगी

सैमसंग ने कहा कि वह iPhone के लिए नए कैमरा सेंसर पर काम कर रहा है

Moto G05 भारत में 7 जनवरी को लॉन्च होगा; विशिष्टताओं का खुलासा

निंटेंडो पेटेंट का सुझाव है कि स्विच 2 को डीएलएसएस-स्टाइल अपस्केलिंग तकनीक मिलेगी

सैमसंग ने कहा कि वह iPhone के लिए नए कैमरा सेंसर पर काम कर रहा है

Realme book slim में SSD अपग्रेड कर सकते है या नहीं ? | Realme book slim i3 review

Varient – News & Magazine Script v2.2.1

वनप्लस 12आर खरीदार इस तारीख तक पूरा रिफंड मांग सकते हैं

Most Popular

Realme book slim में SSD अपग्रेड कर सकते है या नहीं ? | Realme book slim i3 review

Varient – News & Magazine Script v2.2.1

वनप्लस 12आर खरीदार इस तारीख तक पूरा रिफंड मांग सकते हैं

Our Picks

Moto G05 भारत में 7 जनवरी को लॉन्च होगा; विशिष्टताओं का खुलासा

निंटेंडो पेटेंट का सुझाव है कि स्विच 2 को डीएलएसएस-स्टाइल अपस्केलिंग तकनीक मिलेगी

सैमसंग ने कहा कि वह iPhone के लिए नए कैमरा सेंसर पर काम कर रहा है

Subscribe to Updates

What's Hot

OpenAI एक ऑडियो टूल का पूर्वावलोकन करता है जो 15 सेकंड में आपकी आवाज़ को क्लोन कर सकता है

Related Posts

Subscribe to Updates