با هوش مصنوعی محبوب این روزها و توانایی هایش بیشتر آشنا شوید

میدجرنی متخصص تبدیل ذهنیات شما به تصویر!

میدجرنی متخصص تبدیل ذهنیات شما به تصویر!

ایزو وب: به گزارش ایزو وب، «میدجرنی» یک برنامه هوش مصنوعی مولد تصویر است که رقبای بسیاری دارد. اگر تمایل دارید با نحوه کارکرد این برنامه، خصوصیت ها و هزینه آن آشنا شوید، این گزارش را مطالعه کنید.


به گزارش ایزو وب به نقل از ایسنا و به نقل از اندروید اتوریتی، به لطف برنامه های هوش مصنوعی مولد تصویر مانند «میدجرنی»(Midjourney) هم اکنون می توانید تصویری را در عرض چند دقیقه مستقیما از تصورات خود تداعی کنید. مهم نیست که مهارت های هنری ندارید یا در زندگی خود حتی یک قلم مو به دست نگرفته اید چونکه هوش مصنوعی می تواند هنر دیجیتال را در عرض چند ثانیه ایجاد نماید. تنها چیزی که نیاز دارید، کمی متن است تا تصویر نقش بسته در ذهن شما را توصیف کند.
این گزارش به نکاتی می پردازد که باید در مورد هوش مصنوعی میدجرنی بدانید.

میدجرنی چیست؟
میدجرنی یک نمونه از هوش مصنوعی مولد است که می تواند گفته های زبان طبیعی را به تصاویر تبدیل کند. این تنها یکی از انواع مختلف مولدهای تصویر مبتنی بر یادگیری ماشینی است که به تازگی ظهور کرده اند. به رغم وجود داشتن مدلهای یادگیری ماشینی مانند «دال-ئی»(DALL-E) شرکت «OpenAI» و «استیبل دیفیوژن»(Stable Diffusion) متعلق به «استبیلیتی ای آی»(Stability AI)، میدجرنی به یکی از بزرگ ترین نامهای هوش مصنوعی تبدیل گشته است.
با میدجرنی می توانید تصاویر باکیفیت بالا را از اعلان های ساده مبتنی بر متن ایجاد کنید. جهت استفاده کردن از میدجرنی، به سخت افزار یا نرم افزار تخصصی نیاز ندارید چونکه این برنامه کاملا از راه اپلیکیشن چت «دیسکورد»(Discord) کار می کند. تنها نقطه ضعف میدجرنی اینست که قبل از آغاز کردن تولید تصاویر باید کمی هزینه بپردازید. این برخلاف روند کاری خیلی از رقباست که معمولاً حداقل چند تصویر را به صورت مجانی عرضه می دهند.
میدجرنی می تواند تصاویر خیره کننده ای را از یک توضیح متنی ساده ایجاد نماید. با این حال، موانع ورود به میدجرنی خیلی کم هستند و هر کسی می تواند از آن برای تولید تصاویر واقعی در عرض چند دقیقه استفاده نماید. بسته به درخواست کاربر، نتایج می توانند غیرعادی یا خیره کننده باشند.
در بعضی موارد، تصاویر میدجرنی حتی کارشناسان عکاسی و سایر حوزه ها را گول زده اند. بنابراین، امکان دارد تصاویر بسیار قانع کننده ای را که توسط هوش مصنوعی میدجرنی ساخته شده اند، در شبکه های اجتماعی دیده باشید.
نمونه هایی از این تصاویر، «پاپ فرانسیس»(Pope Francis) پوشیده در کاپشن پف دار یا «دونالد ترامپ»(Donald Trump) دستگیرشده قبل از رویداد واقعی هستند. بعضی از این تصاویر، صحنه های خلاقانه ای مانند صحنه های فیلم «جنگ ستارگان»(Star Wars) را به نمایش می گذارند.






برخلاف دال-ئی که توسط شرکت OpenAI خالق چت بات «ChatGPT» پشتیبانی می شود، میدجرنی خویش را بعنوان یک پروژه مستقل و با سرمایه خود معرفی می کند. علاوه بر این، میدجرنی تا به امروز هیچ بودجه ای را از بیرون دریافت نکرده است. در مقابل، OpenAI بالغ بر ۱۰ میلیارد دلار از شرکت «مایکروسافت»(Microsoft) و تعدادی سرمایه گذار دیگر جمع آوری کرده است. بنابراین، با عنایت به این موضوعات، نتایج میدجرنی کاملا چشم گیر هستند.

میدجرنی چطور کار می کند؟
ما همه چیز را در مورد عملکرد داخلی میدجرنی نمی دانیم چونکه این یک برنامه منبع بسته است و با کد اختصاصی اجرا می شود. با این حال، ما به اندازه کافی در مورد فناوری زیربنای آن می دانیم تا یک توضیح کلی را عرضه دهیم.
میدجرنی بر دو فناوری نسبتا جدید یادگیری ماشینی، یعنی مدلهای زبانی بزرگ و مدلهای انتشاری متکی است. اگر از چت بات های هوش مصنوعی مانند ChatGPT بهره برده اید، امکان دارد با حالت اول آشنا باشید. ابتدا یک مدل زبانی بزرگ به میدجرنی کمک می نماید تا معنای کلماتی را که شما در دستورات خود تایپ کرده اید، درک کند. سپس، این به یک گرافیک برداری تبدیل می شود که می توانید آنرا بعنوان یک نسخه عددی از دستور خود تصور کنید. در نهایت، این گرافیک برداری به هدایت کردن فرایند پیچیده دیگری به نام انتشار کمک می نماید.
میدجرنی از یک مدل انتشاری برای تبدیل کردن نویز تصادفی به هنر زیبا استفاده می نماید. مدل انتشاری که فقط در حدود یک دهه گذشته رایج شده است، موج ناگهانی تولیدکنندگان تصویر هوش مصنوعی را توضیح می دهد. در یک مدل انتشاری، شما یک کامپیوتر دارید که نویز تصادفی را به تدریج به مجموعه داده آموزشی خود اضافه می کند. با گذشت زمان، کامپیوتر یاد می گیرد که چگونه با معکوس کردن نویز، تصویر اصلی را به دست بیاورد. ایده اینست که چنین مدلی با آموزش کافی می تواند یاد بگیرد چگونه تصاویر کاملا جدید را تولید نماید.
بنابراین، باید دید که این از منظر یک هوش مصنوعی مولد تصویر چگونه به نظر می آید. وقتی یک پیام متنی را به برنامه وارد می کنید، کار آن با میدانی از نویز بصری شروع می شود. می توانید گام اول را معادل تلویزیون ثابت در نظر بگیرید. تصویر در این مرحله شبیه به چیزی نیست که شما خواسته اید. سپس یک مدل هوش مصنوعی آموزش دیده، از مدل انتشاری پنهان برای کم کردن نویز در مراحل استفاده می نماید. در نهایت، تصویری شبیه به اشیاء و ایده ها در دنیای واقعی به دست می آید.
بنابراین است که معمولاً باید یک یا دو دقیقه منتظر بمانید تا تصویر تولیدشده توسط هوش مصنوعی کامل شود. اگر این فرایند را زودتر متوقف کنید، یک تصویر پر از نویز را دریافت خواهید کرد که مراحل حذف نویز را به اندازه کافی طی نکرده است.

هزینه میدجرنی چقدر است؟
باآنکه پیش تر شاهد بودیم که چت بات هایی مانند ChatGPT و «بینگ چت»(Bing Chat)، استفاده حدودا نامحدود را به صورت مجانی عرضه می دهند اما این مورد در مورد تولیدکنندگان تصویر صدق نمی نماید. حدودا همه آنها محدودیت هایی دارند و میدجرنی حتی یک آزمایش مجانی عرضه نمی دهد. دلیل اینست که تولید تصویر به قدرت محاسباتی و بخصوص «واحدهای پردازش گرافیکی»(GPU) زیادی نیاز دارد. علاوه بر این، هر پردازنده گرافیکی دارای حافظه ویدئویی محدودی است که مقدار زیادی از آن برای فرایند حذف نویز استفاده می شود. ازاین رو با در نظر گرفتن این موضوع، جای تعجب نیست که یک هوش مصنوعی مولد تصویر پیشرفته، مقداری هزینه برای کاربر داشته باشد.
میدجرنی حداقل ۱۰ دلار در ماه هزینه دارد اما ارزش بیشتری را در برنامه های سطح بالاتر فراهم می آورد.یک راهنمای اختصاصی در مورد سطوح قیمت گذاری و اکانت اشتراک میدجرنی وجود دارد اما کاربران باید ماهانه حداقل ۱۰ دلار به صورت ثابت بپردازند. این مبلغ، ۳.۳ ساعت زمان پردازش گرافیکی را فراهم می آورد که برای حدودا ۲۰۰ تصویر خوب است. گران ترین طرح، ۶۰ ساعت زمان پردازش گرافیکی سریع را با ۱۲۰ دلار در ماه فراهم می آورد.
برنامه های پیشرفته میدجرنی، تصاویر نامحدودی را در «حالت آرام»(Relaxed mode) به شما می دهد اما باید تا ۱۰ دقیقه صبر کنید. اگر به بهترین کیفیت نیاز ندارید، سفارش می شود جایگزین های مختلف میدجرنی را بررسی کنید. حدودا همه شرکتهای فناوری، از «گوگل» گرفته تا «متا» حالا دارای مولدهای تصویر رقیب هستند که خیلی از آنها یک سکه هم هزینه ندارند.




منبع:

1402/10/05
09:35:14
5.0 / 5
333
تگهای خبر: آموزش , تخصص , تولید , حافظه
این مطلب را می پسندید؟
(1)
(0)

تازه ترین مطالب مرتبط
نظرات بینندگان در مورد این مطلب
لطفا شما هم نظر دهید
= ۳ بعلاوه ۳
ایزو وب
ISO Web