विषय - सूची[छिपाना][प्रदर्शन]
एआई में हाल के नवाचार कला के हमारे दृष्टिकोण को मौलिक रूप से बदल सकते हैं।
DALL-E 2 जैसे मॉडल सादे पाठ इनपुट से उच्च-गुणवत्ता वाली छवियां बनाने की अपनी क्षमता के लिए प्रसिद्ध हो गए हैं।
जबकि डीएएलएल-ई 2 अभी भी अधिकांश जनता के लिए बंद था, कई लोगों ने एक विकल्प की तलाश की जो काम भी कर सके। सबसे लोकप्रिय विकल्पों में से एक ऑनलाइन सेवा मिडजर्नी है।
अपने डिस्कॉर्ड सर्वर में 3 मिलियन से अधिक उपयोगकर्ताओं के साथ, यह यकीनन छवियों और कला को उत्पन्न करने के लिए सबसे सुलभ प्रसार मॉडल में से एक है।
इस लेख में हम किस बारे में जानेंगे मध्य यात्रा कर सकते हैं और यह कैसे काम करता है। बाद में, हम चरण-दर-चरण मार्गदर्शिका के साथ आपकी पहली AI-जनरेटेड तस्वीर बनाने में आपका मार्गदर्शन करेंगे।
मध्य यात्रा क्या है?
मध्य यात्रा एक मालिकाना एआई-पावर्ड टूल है जो टेक्स्ट इनपुट से इमेज बना सकता है। अपनी तरह के अन्य मॉडलों के विपरीत, मिडजॉर्नी सेवा को एक ऑनलाइन डिस्कॉर्ड सर्वर के माध्यम से एक्सेस किया जाता है।
जो उपयोगकर्ता मिडजॉर्नी के साथ कला बनाना चाहते हैं, उन्हें एक डिस्कॉर्ड खाता बनाना होगा और आधिकारिक मिडजर्नी सर्वर तक पहुंचना होगा। वहां से, उन्हें "चैनल" नामक कई उपलब्ध खुले चैट रूम में से एक पर नेविगेट करना होगा।
इन चैनलों में, उपयोगकर्ता कई अन्य उपयोगकर्ताओं के साथ टेक्स्ट प्रॉम्प्ट सबमिट करेंगे। अन्य उपयोगकर्ता आपके संकेतों और आउटपुट छवियों को देख सकेंगे।
चूंकि संपूर्ण फ्रंट-एंड इंटरफ़ेस अनिवार्य रूप से डिस्कॉर्ड प्लेटफॉर्म में रहता है, इसलिए इसमें कोई आश्चर्य की बात नहीं है कि पिछले कई महीनों में सर्वर में जबरदस्त वृद्धि हुई है। अक्टूबर 2022 तक, यह वर्तमान में प्लेटफॉर्म के इतिहास में सबसे बड़ा डिस्कॉर्ड सर्वर है।
संस्थापक डेविड होल्ज़ के अनुसार, लगभग 30 प्रतिशत उपयोगकर्ता मिडजॉर्नी को एक पेशेवर के रूप में उपयोग करते हैं। होल्ज़ ने उल्लेख किया कि बहुत सारे ग्राफिक कलाकार अपने अवधारणा विकास वर्कफ़्लो में एक प्रारंभिक चरण के रूप में मिडजॉर्नी का उपयोग करते हैं।
मध्य यात्रा ने वाणिज्यिक चित्रण उद्योग को भी प्रभावित करना शुरू कर दिया है। ब्रिटिश पत्रिका द इकोनॉमिस्ट ने अपने हाल के मुद्दों में से एक के लिए फ्रंट कवर बनाने के लिए मिडजर्नी का भी इस्तेमाल किया।
मध्य यात्रा कैसे काम करती है?
चूंकि मिडजॉर्नी मालिकाना है, इसलिए यह बिल्कुल ज्ञात नहीं है कि मॉडल अन्य छवि निर्माण मॉडल से कैसे भिन्न है जैसे स्थिर प्रसार और DALL-E 2. हालांकि, हम जानते हैं कि मिडजर्नी छवियों को उत्पन्न करने के लिए एक तंत्रिका नेटवर्क का उपयोग करता है।
इसके अलावा, कई अन्य छवि निर्माण एल्गोरिदम की तरह, मिडजर्नी एक तकनीक पर निर्भर करता है जिसे डिफ्यूजन मॉडलिंग कहा जाता है।
डिफ्यूजन मॉडल अनिवार्य रूप से एक छवि को थोड़ा-थोड़ा करके तब तक काम करते हैं जब तक कि आपकी छवि अर्थहीन शोर न बन जाए। मॉडल तब प्रसार प्रक्रिया को उलटने का तरीका जानने के लिए छवियों को निरूपित करने का प्रयास करेगा।
छवि निर्माण मॉडल आमतौर पर एक चरण जोड़ते हैं जो प्रारंभिक पाठ की व्याख्या करता है। उदाहरण के लिए, मान लें कि उपयोगकर्ता मिडजर्नी को हरे धागे की गेंद से खेलते हुए एक बिल्ली की छवि बनाने के लिए कहता है। एक टेक्स्ट एन्कोडर इनपुट टेक्स्ट लेता है "बिल्ली हरे धागे की गेंद के साथ खेल रही है" और इसे प्रत्येक शब्द का प्रतिनिधित्व करने वाली संख्याओं की सूची में परिवर्तित करता है।
शोर के एक यादृच्छिक ग्रिड से शुरू करते हुए, मिडजर्नी मूल पाठ से प्राप्त अर्थ संबंधी जानकारी को शामिल करते हुए छवि को निरूपित करने का प्रयास करेगा।
अपनी पहली मध्य यात्रा छवि बनाना
इस खंड में, हम आपको एक त्वरित मार्गदर्शिका देंगे जो आपकी पहली मध्य यात्रा छवि बनाने में आपकी सहायता करेगी।
सबसे पहले, आपको इसमें शामिल होना होगा मिडजर्नी डिस्कॉर्ड सर्वर. यदि आपके पास अभी तक एक डिस्कॉर्ड खाता नहीं है, तो आपको एक बनाने के लिए कहा जाएगा। डिस्कॉर्ड एक खाता बनाना आसान बनाता है और आप अपने ब्राउज़र के माध्यम से संपूर्ण एप्लिकेशन तक पहुंच सकते हैं।
एक बार जब आप सर्वर से जुड़ जाते हैं, तो आपको उपलब्ध "नवागंतुक" कमरों में से एक का चयन करना होगा। ये कमरे वे होंगे जहां आप अन्य मिडजर्नी उपयोगकर्ताओं के साथ अपने टेक्स्ट संकेत सबमिट करेंगे।
इसके बाद, "/कल्पना" कमांड टाइप करें और अपने प्रॉम्प्ट में टाइप करें।
मध्य यात्रा आपके संकेत के आधार पर चार विकल्प उत्पन्न करेगी। डिस्कॉर्ड बॉट को आउटपुट वापस करने में एक मिनट तक का समय लग सकता है। आप या तो अपस्केल चुन सकते हैं या चार छवियों की विविधताएं बना सकते हैं।
इस उदाहरण में, मैंने "फंतासी महल राज्याभिषेक" का संकेत दिया है।
हम किसी विशिष्ट छवि की अतिरिक्त विविधताएं उत्पन्न करना चुन सकते हैं। इस उदाहरण में, मैंने दूसरी छवि के रूपांतर बनाने के लिए "V2" बटन का चयन किया है।
हम एक छवि को अपस्केल करना भी चुन सकते हैं। एक छवि को अपस्केल करने से चुनी गई छवि का 1024×1024 पिक्सेल का बड़ा संस्करण उत्पन्न होता है। उन्नत छवि अक्सर अतिरिक्त विवरण भी जोड़ देगी।
मिडजर्नी एक प्रायोगिक रीमास्टर सुविधा भी प्रदान करता है। यह सुविधा एक ऐसी छवि को पुन: उत्पन्न करेगी जिसमें गुणवत्ता और सुसंगतता में वृद्धि हो सकती है।
एक उन्नत या रीमास्टर्ड प्रॉम्प्ट उत्पन्न करने के बाद, अब आप छवि को उसके पूर्ण आकार में दिखाने के लिए उस पर क्लिक करके छवि को डाउनलोड कर सकते हैं। छवि पर राइट-क्लिक करें और चुनें चित्र को सेव करें इसे स्थानीय रूप से बचाने के लिए।
मिडजॉर्नी ने आपके लिए जो तस्वीरें तैयार की हैं, उन्हें देखने के लिए आप अपने डिस्कॉर्ड खाते को आधिकारिक मिडजॉर्नी वेब एप्लिकेशन से जोड़ सकते हैं।
मूल्य निर्धारण
मिडजर्नी दो मुख्य योजनाएँ प्रदान करता है: मूल और मानक।
मूल योजना की लागत $10/माह है और उपयोगकर्ता को हर महीने लगभग 200 संकेत चलाने की अनुमति देता है। मानक योजना की कीमत $ 30 / माह है और उपयोगकर्ता को चित्र बनाने के लिए अतिरिक्त 15 GPU घंटे देता है। यह हर महीने लगभग 4.5 गुना अधिक अनुरोधों के बराबर है।
मानक योजना में अपग्रेड करने से "आराम" मोड भी अनलॉक हो जाता है, जो उपयोगकर्ता को थोड़े लंबे प्रतीक्षा समय के बदले असीमित संख्या में नौकरियां चलाने की अनुमति देता है।
उपयोगकर्ता अपने अनुरोधों को निजी तौर पर चलाने देने के लिए प्रति माह अतिरिक्त $20 भी जोड़ सकते हैं।
निष्कर्ष
मिडजर्नी एआई इमेज जनरेशन के लिए एक बेहतरीन टूल है जो एक पेड प्लान में अपग्रेड करने का फैसला करने पर उचित मूल्य प्रदान करता है।
टूल के अलावा, ऐप के आस-पास के समुदाय ने इसे अन्य समान एआई टूल्स के बीच खड़ा कर दिया है। डिस्कॉर्ड सर्वर में दैनिक सामुदायिक कार्यक्रम और चुनौतियाँ होती हैं जिनमें उपयोगकर्ता शामिल हो सकते हैं। सर्वर के भीतर विभिन्न चैनल मौजूद हैं जहां आप प्रश्न पूछ सकते हैं और अपने संकेतों को सुधारने के तरीके के बारे में सुझाव और तरकीबें ढूंढ सकते हैं।
एक जवाब लिखें