সুচিপত্র[লুকান][দেখান]
বড় টেক্সট-টু-ইমেজ মডেলগুলি প্রদত্ত টেক্সট প্রম্পট থেকে উচ্চ-মানের এবং বৈচিত্রপূর্ণ ছবি সংশ্লেষণ তৈরি করে এআই-এর বিকাশে একটি উল্লেখযোগ্য অগ্রগতি করেছে।
এই মডেলগুলি বিভিন্ন সেটিংসে বিষয়গুলির অনন্য উপস্থাপনা সংশ্লেষ করতে বা প্রদত্ত রেফারেন্স সেটে বিষয়গুলির উপস্থিতি প্রতিলিপি করতে অক্ষম।
OpenAI এর DALL.E2 বা StabilityAI এর মত নতুন প্রকাশিত প্রযুক্তি স্থিতিশীল বিস্তার এবং Midjourney ইতিমধ্যে ঝড় দ্বারা ইন্টারনেট গ্রহণ করা হয়. এখন ফলাফল কাস্টমাইজ করার সময়। তবুও কিভাবে?
Google DreamBooth AI এসেছে।
DreamBooth একটি ছবির বিষয় চিনতে, এটির মূল প্রেক্ষাপট থেকে এটিকে ডিকনস্ট্রাক্ট করার এবং তারপর একটি নতুন কাঙ্ক্ষিত প্রেক্ষাপটে এটিকে সুনির্দিষ্টভাবে সংশ্লেষিত করার ক্ষমতা রাখে। উপরন্তু, এটি বর্তমান AI ছবি জেনারেটরের সাথে ব্যবহার করা যেতে পারে।
এই নিবন্ধে, আমরা ড্রিমবুথ, এর ব্যবহার, এর টিউটোরিয়াল, এর সীমাবদ্ধতা এবং আরও অনেক কিছু সম্পর্কে গভীরভাবে নজর দেব।
ড্রিমবুথ কি?
ড্রিমবুথ, একটি একেবারে নতুন টেক্সট-টু-ইমেজ ডিফিউশন মডেল, Google দ্বারা উপস্থাপিত হয়েছে। বিভিন্ন সেটিংসে ব্যবহারকারীর নির্বাচিত বিষয়ের বিস্তৃত ফটো তৈরি করতে Google DreamBooth AI দ্বারা নির্দেশিকা হিসাবে একটি লিখিত প্রম্পট ব্যবহার করা যেতে পারে।
বোস্টন ইউনিভার্সিটি এবং গুগলের একটি গবেষণা গোষ্ঠী ড্রিমবুথ তৈরি করেছে, টেক্সট-টু-ইমেজ মডেলগুলিকে পরিবর্তন করার জন্য একটি অত্যাধুনিক প্রযুক্তি যা ব্যাপক প্রাক-প্রশিক্ষণের মধ্য দিয়ে গেছে।
সামগ্রিক ধারণাটি বরং সহজবোধ্য: তারা ভাষা-দর্শন অভিধান বাড়াতে চায় যাতে অস্বাভাবিক টোকেন আইডিগুলি কাস্টম বিষয়গুলির সাথে যুক্ত থাকে যা ব্যবহারকারীরা সংজ্ঞায়িত করতে পারে।
মডেলের মূল লক্ষ্য হল ব্যবহারকারীদের সাথে সংযোগ করা টেক্সট-টু-ইমেজ ডিফিউশন মডেল তাদের নির্বাচিত বিষয়বস্তুর উদাহরণগুলির ফটোরিয়ালিস্টিক উপস্থাপনা তৈরি করার জন্য তাদের প্রয়োজনীয় সংস্থানগুলি দিয়ে।
ফলস্বরূপ, এই কৌশলটি বিভিন্ন পরিস্থিতিতে চ্যালেঞ্জগুলির সংক্ষিপ্তসারের জন্য ভাল কাজ করে বলে মনে হচ্ছে।
গুগলের ড্রিমবুথ আগের টেক্সট-টু-ইমেজ টুল থেকে আলাদা, যেমন DALL-E2, স্থিতিশীল বিস্তার, এবং মিডজার্নি, যাতে এটি ব্যবহারকারীদের পাঠ্য-ভিত্তিক ইনপুট ব্যবহার করে বিচ্ছুরণ মডেল ম্যানিপুলেট করার আগে বিষয় চিত্রের উপর আরও নিয়ন্ত্রণ দেয়।
বৈশিষ্ট্য
- DreamBooth AI 3-5 ইমেজ সহ একটি টেক্সট-টু-ইমেজ মডেল উন্নত করতে পারে।
- ড্রিমবুথ এআই দিয়ে আসল ফটোরিয়ালিস্টিক ছবি তৈরি করা যায়।
- এছাড়াও, DreamBooth AI একাধিক কোণ থেকে একটি বিষয়ের ফটো তৈরি করতে পারে।
আবেদন
শিল্প পরিবেশন
এই কাজটি শৈলী স্থানান্তর থেকে বিশেষভাবে পৃথক, যা মূল দৃশ্যে অন্য চিত্রের শৈলীকে অন্তর্ভুক্ত করার সময় উত্স দৃশ্যের শব্দার্থকে ধরে রাখে।
সৃজনশীল পদ্ধতির উপর ভিত্তি করে, এআই শনাক্তকরণ এবং বিষয়ের দৃষ্টান্তের সুনির্দিষ্টতা বজায় রেখে উল্লেখযোগ্য দৃশ্যের পরিবর্তনগুলি সম্পাদন করতে পারে।
সম্পত্তি পরিবর্তন
বিষয় উদাহরণের বৈশিষ্ট্য DreamBooth AI দ্বারা সংশোধন করা যেতে পারে.
অ্যাক্সেসরাইজেশন
প্রজন্মের মডেলের আগে শক্তিশালী কম্পোজিশনাল যা ড্রিমবুথ এআই-এর বস্তুকে সাজানোর ক্ষমতাকে এত আকর্ষণীয় করে তোলে।
পুনঃপ্রসঙ্গকরণ
DreamBooth AI একটি নির্দিষ্ট বিষয়ের উদাহরণের জন্য স্বতন্ত্র চিত্র তৈরি করতে পারে একটি প্রশিক্ষিত মডেলকে একটি বাক্য প্রদান করে যাতে অনন্য শনাক্তকারী এবং শ্রেণি বিশেষ্য অন্তর্ভুক্ত থাকে।
এটি পরিবেশ পরিবর্তনের পরিবর্তে অনন্য, পূর্বে না শোনা ভঙ্গি, বক্তব্য এবং দৃশ্যের কাঠামোতে বিষয় তৈরি করতে পারে। বাস্তবসম্মত প্রতিফলন এবং ছায়া, সেইসাথে বিষয় এবং পার্শ্ববর্তী বস্তুর মধ্যে মিথস্ক্রিয়া।
ড্রিমবুথ টিউটোরিয়াল
এই টিউটোরিয়ালে, আমরা অনুসরণ করব Google Collab নোটবুক, এবং আমি আপনাকে এটির মধ্য দিয়ে হেঁটে যাবো, যা আপনাকে বুঝতে এবং আপনার নিজের উপর এটি ব্যবহার করবে।
GPU সেট আপ করা এবং লাইব্রেরি ইনস্টল করা
জিপিইউ এবং ভিআরএএম কী ধরনের উপলব্ধ তা খুঁজে বের করা হল প্রথম ধাপ। কয়েকটি প্রয়োজনীয়তা এবং নির্ভরতা ইনস্টল করাও প্রয়োজনীয়। শুধু প্লে বোতাম টিপুন, তারপর এটি শেষ হওয়ার জন্য অপেক্ষা করুন।
Huggingface এ একটি অ্যাকাউন্ট তৈরি করুন এবং একটি টোকেন তৈরি করুন
পরবর্তী ধাপ হল একটি Huggingface অ্যাকাউন্টের জন্য নিবন্ধন করা। আপনি শেষ হয়ে গেলে, উপরের ডানদিকের কোণায় সেটিংস ক্লিক করুন। আপনি পরবর্তী পৃষ্ঠায় পৌঁছাবেন।
এখান থেকে অনুরোধ অনুযায়ী টোকেন এবং নাম তৈরি করুন। টোকেনটি কপি করে নিচের ঘরে থাকা Google collab-এ পেস্ট করতে হবে।
xformers ইনস্টল করুন
এই পর্যায়ে, আপনি রানটাইমে ক্লিক করে xformers ইনস্টল করতে প্লে বোতাম টিপুন।
ড্রাইভে সংযোগ করুন৷
এখন, আপনাকে গুগল ড্রাইভে সংযোগ করতে এই সেলটি চালাতে হবে।
প্রম্পট লিখুন
নিম্নলিখিত ঘরে, আপনাকে কেবল প্রম্পটটি প্রবেশ করতে হবে।
ছবি আপলোড করা হচ্ছে
এই ধাপে, আপনাকে শুধু সেই ছবিগুলি আপলোড করতে হবে যা আপনি প্রশিক্ষণ দিতে চেয়েছিলেন।
ট্রেন এআই মডেল
এটি সবচেয়ে গুরুত্বপূর্ণ পর্যায়, কারণ আপনি আপনার জমা দেওয়া সমস্ত রেফারেন্স ফটোগ্রাফের উপর ভিত্তি করে একটি নতুন AI মডেল প্রশিক্ষণের জন্য DreamBooth ব্যবহার করবেন। আপনাকে অবশ্যই দুটি ইনপুট ক্ষেত্রে আপনার মনোযোগ সীমাবদ্ধ করতে হবে। "—উদাহরণ প্রম্পট" হল প্রথম প্যারামিটার। আপনি এখানে একটি উচ্চ স্বতন্ত্র নাম প্রদান করতে হবে.
'-ধারণা তালিকা' আর্গুমেন্ট হল দ্বিতীয় গুরুত্বপূর্ণ ইনপুট ক্ষেত্র। 'প্রম্পট পরিবর্তন করুন' বিভাগে ব্যবহৃত একটির সাথে মেলে এটির নাম পরিবর্তন করতে হবে।
এআই ইমেজ তৈরি করুন
AI ছবিগুলি এই পর্যায়ে তৈরি করা হবে, যেখানে আপনি পাঠ্য নির্দেশাবলী ইনপুট করতে পারেন।
ড্রিমবুথ সীমাবদ্ধতা
- কমান্ড প্রম্পট উচ্চ মাত্রার বিশদ বিবরণ সহ বিষয়ের পুনরাবৃত্তি করতে বাধা হয়ে দাঁড়ায়। DreamBooth বিষয়ের প্রসঙ্গ পরিবর্তন করতে পারে, কিন্তু যদি মডেল নিজেই বিষয় পরিবর্তন করতে চায়, ফ্রেমের সাথে সমস্যা আছে।
- আরেকটি সমস্যা হল আউটপুট ছবিকে ইনপুট ইমেজে ওভারফিটিং করা। যদি পর্যাপ্ত ছবি সরবরাহ না করা হয়, তাহলে বিষয় বিবেচনা করা যাবে না বা জমা দেওয়া ছবিগুলির প্রসঙ্গের সাথে মিশ্রিত করা যেতে পারে। একটি বিজোড় প্রজন্মের জন্য একটি প্রসঙ্গ জিজ্ঞাসা করা হলে, একই জিনিস সঞ্চালিত হয়.
উপসংহার
একটি একক টেক্সট ইনপুট থেকে আউটপুট তৈরি করতে, টেক্সট-টু-ইমেজ মডেলের জন্য লক্ষ লক্ষ প্যারামিটার এবং লাইব্রেরি প্রয়োজন।
DreamBooth একটি পাঠ্য ব্যাকগ্রাউন্ড সহ শুধুমাত্র তিন থেকে পাঁচটি বিষয়ের ফটোগ্রাফের ইনপুট প্রয়োজন করে ভোক্তাদের জন্য সামগ্রী অর্জন এবং ব্যবহার সহজ করে।
নির্দেশিকা সমন্ধে মতামত দিন