Stable Diffusion چیست و چطور کار میکند؟

یک سیستم هوش مصنوعی مبتنی بر تبدیل متن به تصویر است که با کمک الگوریتمهای یاد گیرنده سعی میکنند به صورت مرحله به مرحله، تصاویر مورد نیاز شما را خلق کند.

آیا Stable Diffusion جایگزینی هم دارد؟

ابزارهای Dall-E 2 و Midjourney را میتوان جزو رقبای قدرتمند Stable Diffusion معرفی کرد. البته Craiyon نیز یکی دیگر از ابزارهای رایگان مشابه این هوش مصنوعی است که عملکرد نسبتاً ضعیفتری را به نمایش گذاشته است.

هوش مصنوعی Stable Diffusion چیست؟ معرفی تمامی ویژگی ها

Q: Stable Diffusion رایگان است؟

هم میتوانید از نسخه رایگان این هوش مصنوعی روی سیستم لوکال خود استفاده کنید و هم نسخه پولی تحت وب آن را بخرید.

آریاپی

24 مهر 1402

اگر کمی از تکنولوژی و ابزارهای روز سررشته داشته باشید، متوجه می‌شوید که هوش مصنوعی در حال تغییر دنیای ماست. هر یک از ابزارهای هوش مصنوعی قادرند طبق یک الگوریتم خاص مبتنی بر درک انسانی، فرایند و عملیات پروژه‌ها را به حدی ساده کنند که انسان انگشت به دهان بماند!

این ساده‌سازی تا جایی ادامه دارد که هوش مصنوعی می‌تواند در نقش یک برنامه‌نویس، با سرعت تمام کد بزند یا مثل یک نویسنده ماهر، داستانی جذاب تعریف کند. هوش مصنوعی Stable Diffusion حتی قادر است بر اساس متنی که دریافت می‌کند، یک تصویر بی‌نقص را در اختیار شما قرار دهد.

برای کار با چنین ابزارهای قدرتمندی کافیست روش کار آنها را یاد بگیرید و با کسب تجربه به خروجی‌های مد نظرتان دست یابید؛ بنابراین در ادامه این نوشتار از آریاپی همراه ما باشید تا بگوییم هوش مصنوعی Stable Diffusion چیست؟ چه کاربردی دارد و چطور کار می‌کند؟

Stable Diffusion؛ هوش مصنوعی open-suorce با قابلیت تبدیل متن به عکس

هوش مصنوعی Stable Diffusion یک مدل یادگیری ماشین است که توانایی تولید تصاویر از توصیفات به زبان طبیعی را دارد. این مدل توسط شرکت Stability AI توسعه داده شده و کد منبع آن به صورت متن‌باز (open source) در دسترس عموم قرار دارد.

به زبان ساده، وقتی به Stable Diffusion یک اعلان می‌دهید، مدل آموزش داده می‌شود تا تصویری واقعی از چیزی ایجاد کند که با توضیحات شما مطابقت داشته باشد. می‌توان گفت این یک پیشرفت قابل توجه نسبت به تولیدکننده‌های متن – تصویر قبلی است؛ زیرا می‌تواند توصیفات متنی پیچیده و انتزاعی را مدیریت کند. استیبل دیفیوژن با استفاده از روش جدیدی به نام آموزش پایدار به این امر دست می‌یابد و به مدل انتشار پایدار اجازه می‌دهد تا تصاویر با کیفیت بالا و مطابق با ورودی متنی تولید کند.

این مدل که از محدودیت‌های مصنوعی برای تولید تصاویر پیروی نمی‌کند، می‌تواند تصاویر خلاقانه و جذابی را از متن‌های کوتاه ایجاد کند. برای استفاده از این مدل می‌توانید از برنامهDreamStudio که یک سرویس تحت وب است استفاده کنید. این برنامه به شما امکان می‌دهد که با وارد کردن توصیف مورد نظر خود، تصویری را از آن تولید کنید. همچنین می توانید با خرید اکانت چت جی پی تی از خدمات متفاوت و گوناگون آن استفاده کنید.

برای این کار باید به وب‌سایت Beta.DreamStudio.ai مراجعه و ثبت‌نام کنید. سپس می‌توانید متن خود را در کادر مربوطه نوشته و دکمه Dream را بزنید. برنامه به شما تصویر مورد نظر را نشان می‌دهد.

روش های استفاده از Stable Diffusion

در سال‌های اخیر، پیشرفت‌های چشمگیری در مدل‌های تولید تصویر با هوش مصنوعی صورت گرفته است. در مقاله بهترین ابزارهای طراحی گرافیک هوش مصنوعی 2024 سعی کردیم برخی از این ابزارهای کاربردی را معرفی کنیم. یکی دیگر از این مدل‌های پیشگامانه، Stable Diffusion است؛ یک مدل متن به تصویر متن باز که در سال 2022 از طریق تکنیک‌های یادگیری عمیق معرفی شد.

این مدل انتشار پایدار به ما امکان می‌دهد تصاویر را بر اساس توضیحات متنی تولید کنیم. به عبارت دیگر، می‌توانیم متنی را که به‌عنوان ورودی ارائه می‌کنیم به صورت یک نمایش بصری درآوریم؛ اما چگونه این امر محقق می‌شود؟

برای استفاده از Stable Diffusionمی‌توانید یکی از روش‌های زیر را انتخاب کنید:

استفاده از برنامه DreamStudio که یک سرویس تحت وب است و به شما امکان می‌دهد با وارد کردن متن و توصیف مورد نظر خود، تصویری را از آن تولید کنید. برای این کار باید به وب‌سایت DreamStudio.ai رفته و ثبت‌نام کنید. سپس می‌توانید با نوشتن توصیف خود در قسمت مشخص شده و زدن دکمه Dream تصویر مورد نظرتان را مشاهده کنید.
استفاده از پروژه Stable Horde که به شما اجازه می‌دهد کارت‌های گرافیک خود را برای تولید تصویر رایگان با استفاده از منبع باز Stable Diffusion مدل ارسال کنید. برای این کار باید یک حساب کاربری ثبت نمایید. با دریافت یک کلید API و استفاده از کلید API خود با افزودن آن به Options استفاده کنید و برای تصاویر مورد نیازتان خروجی بگیرید.
استفاده از کد منبع باز Stable Diffusion مدل که می‌توانید از PyTorch و TensorFlow استفاده کنید. برای ساخت تصویر با استفاده از Stable Diffusion باید از یک تصویر اولیه شروع کنید و سپس با استفاده از Stable Diffusion، تصویر را به صورت پیوسته تا رسیدن به تصویر مورد نظر خود تغییر دهید.

آیا استفاده از هوش مصنوعی Stable Diffusion رایگان است؟

Stable Horde یک پروژه رایگان و متن باز است که به شما اجازه می‌دهد از قدرت کارت گرافیک خود برای تولید تصویر با استفاده از Stable Diffusion استفاده کنید. تولیدکننده هوش مصنوعی Stable Diffusion می‌تواند طیف گسترده‌ای از سبک‌های هنری از جمله پرتره‌های فوتو رئالیستی، مناظر و هنر انتزاعی را تولید کند. البته در ادامه خواهیم گفت که استفاده از هوش مصنوعی Stable diffusion تحت وب نیاز به پرداخت هزینه خواهد داشت.

آیا استفاده از هوش مصنوعی Stable Diffusion رایگان است؟

عملکرد سرویس Stable Diffusion چگونه است؟

این الگوریتم در کاربردهای مختلفی از جمله تولید تصاویر برای تحقیقات علمی، ایجاد هنر دیجیتال و توسعه بازی‌های ویدئویی استفاده شده است.

به‌عنوان مثال، توسعه‌دهندگان بازی می‌توانند از مدل‌هایی برای تولید آیتم‌های بازی مانند شخصیت‌ها و صحنه‌های بازی به کمک توضیحات متنی استفاده کنند. به‌علاوه سایت‌های تجارت الکترونیکی می‌توانند با ارائه توضیحاتی درباره محصول، یک طرح محصول بصری داشته باشند یا حتی برخی افراد زیرک به راحتی می‌توانند از تصاویر خروجی در سایت‌هایی مثل فری پیک به در آمد برسند. در این مورد می‌توانید سری به نوشته معرفی سایت‌های مشابه فری پیک و بررسی جایگزین‌های بزنید و اطلاعات بیشتری کسب کنید.

شاید با خواندن این مطالب از خودتان بپرسید الگوریتم هوش مصنوعی Stable Diffusion چیست؟ بیایید نحوه عملکرد Stable Diffusion را بررسی کنیم.

Stable Diffusion با اعمال مکرر فرایند انتشار بر روی تصویر عمل می‌کند. در هر تکرار، الگوریتم ضریب انتشار را بر اساس ویژگی‌های تصویر محلی، مانند گرادیان‌ها و لبه‌ها، محاسبه می‌کند. این ضریب قدرت و جهت انتشار را تعیین کرده و به الگوریتم اجازه می‌دهد تا اثر هموارسازی را در بخش‌های مختلف تصویر تنظیم کند.

فرایند انتشار با توزیع مجدد مقادیر پیکسل بر اساس اطلاعات محلی کار می‌کند. این الگوریتم نویز را با انتشار مقادیر پیکسل در مناطق صاف و در عین حال حفظ انتقال‌ها و لبه‌های واضح کاهش می‌دهد. این صاف کردن انتخابی به حفظ جزئیات تصویر و جلوگیری از تار شدن یا از دست دادن ویژگی‌های مهم آن کمک می‌کند.

به زبان ساده‌تر، هنگامی که کاربر توضیحاتی را با ادبیاتی روان وارد می‌کند، Stable Diffusion با تفسیر و درک درخواست کار خود را آغاز می‌کند. با استفاده از هوش مصنوعی، متن مورد تجزیه و تحلیل قرار گرفته و اطلاعات مربوطه به منظور تولید تصویر مورد نظر استخراج می‌شود.

مدل انتشار Stable Diffusion

Stable Diffusion از مدل انتشاری استفاده می‌کند که برای حذف نویز گاوسی از تصاویر تار آموزش دیده است. مدل پخش به طور اختصاصی برای تولید تصاویر از مراحل ابتدایی ساخته شده که با یک تصویر اولیه نویز و تار شروع می‌شود. از طریق پالایش تکراری، مدل به تدریج تصویر را بهبود می‌بخشد تا زمانی که به نتیجه واضحی دست یابد که با خروجی مورد نظر کاربر همسو شود.

Stable Diffusion با یادگیری مستمر تصاویر بهتری را به مرور زمان خلق می‌کند!
با افزایش تعامل کاربر و ارائه توضیحات متنی به Stable Diffusion، سیستم هوش مصنوعی به طور مداوم تلاش می‌کند با گذشت زمان بیشتر یاد بگیرد و کیفیت خروجی‌های خود را افزایش دهد. این فرایند یادگیری مداوم، Stable Diffusion را قادر می‌سازد تا تصاویری را تولید کند که به تدریج دقیق‌تر و واقعی‌تر هستند.
پس از درک متن و اجرای مدل انتشار، مولد هوش مصنوعی Stable Diffusion با استفاده از اطلاعات داده شده و دانش به دست آمده از آموزش آن تصویری تولید می‌کند و حتی در مواردی خاص، هوش مصنوعی این قابلیت را دارد که تصاویر متعددی تولید کند که بیانگر درک یا تفاسیر مختلفی از توضیحات ارائه شده هستند.
Stable Diffusion امکان ویرایش تصاویر موجود را نیز دارد!
جدا از ایجاد تصاویر از ابتدا، Stable Diffusion این قابلیت را دارد که تصاویر موجود را بر اساس دستورالعمل‌های کاربر تغییر دهد. این فرایند مستلزم کارهایی مانند افزودن یا حذف اشیا، تغییر رنگ‌ها یا تنظیمات دیگر عناصر درون تصویر است.
چگونه Stable Diffusion را اجرا کنیم؟
Stable Diffusion را می‌توان در تنظیمات و برنامه‌های مختلف استفاده کرد. در اینجا سه روش متداول برای استفاده از Stable Diffusion و تجربه موثر هنر Stable Diffusion AI را عنوان کردیم.
از Stable Diffusion در Cloud استفاده کنید!
خدمات مبتنی بر ابر یک رویکرد راحت برای استفاده از Stable Diffusion ارائه می‌دهد. شرکت‌های متعددی خدمات Stable Diffusion را از طریق ابر ارائه می‌کنند و کاربران را قادر می‌سازند آثار هنری را مطابق با نیاز خود تولید کنند.
این خدمات معمولا شامل آپلود تصویر ورودی و انتخاب سبک هنری مورد نظر است. سپس این سرویس از Stable Diffusion برای ایجاد تصویر خروجی استفاده می‌کند که می‌تواند به صورت آنلاین دانلود یا به اشتراک گذاشته شود.
انتخاب Stable Diffusion مبتنی بر ابر چندین مزیت دارد که عبار‌ت‌اند از:

در اغلب موارد در مقایسه با اجرای الگوریتم به صورت محلی، سریع‌تر عمل می‌کند.
این سرویس‌ها توانایی پردازش در مقیاس بزرگ را دارند که در نتیجه منجر به تولید سریع تصاویر با کیفیت بالا خواهد شد.
در نهایت، استفاده از Stable Diffusion در فضای ابری اغلب مقرون‌به‌صرفه‌تر است؛ زیرا کاربران فقط برای منابعی که استفاده می‌کنند هزینه می‌پردازند و در نتیجه هزینه‌ها را به حداقل می‌رسانند.

از Stable Diffusion Locally استفاده کنید!
یک انتخاب جایگزین، اجرای Stable Diffusion در رایانه شخصی شما است. برای این روش که کاملا رایگان است، نیاز دارید نرم‌افزار Stable Diffusion را بر روی دستگاه خود نصب کنید و پس از نصب نرم‌افزار، می‌توانید برای تولید آثار هنری با استفاده از AI Stable Diffusion نهایت استفاده را ببرید.
Running Stable Diffusion به صورت محلی چندین مزیت دارد که در ادامه نام می‌بریم:
در مرحله اول، کنترل بیشتری بر فرایند به شما می‌دهد و شما را قادر می‌سازد الگوریتم را مطابق با نیازهای خاص خود سفارشی کنید.
ثانیاً اجرای Stable Diffusion در رایانه محلی‌تان به شما امکان می‌دهد بدون اتکا به اتصال اینترنت، آثار هنری تولید کنید که می‌تواند در شرایطی که دسترسی به اینترنت محدود بوده یا اصلا در دسترس نیست مفید باشد.

از Stable Diffusion Online استفاده کنید!

پلتفرم‌های آنلاین متعددی مثل dream studio مدل انتشار پایدار را به‌عنوان یک سرویس آنلاین ارائه می‌دهند و به کاربران اجازه می‌دهند از عملکرد آن استفاده کنند. این وب‌سایت‌ها آپلود تصاویر ورودی را امکان‌پذیر می‌کنند که با استفاده از مدل‌های انتشار پایدار برای اعمال سبک‌های هنری مختلف پردازش شوند. پس از تکمیل الگوریتم، تصویر خروجی حاصل را می‌توان دانلود یا به اشتراک گذاشت. سرویس Dream studio به کاربران جدید تا سقف معینی اعتبار هدیه می‌دهد؛ اما برای ادامه بیشتر باید هزینه آن را پرداخت کنید.

چندین مزیت استفاده از Stable Diffusion به صورت آنلاین عبارتند از:

اغلب به صورت رایگان یا با حداقل هزینه در دسترس است و دسترسی همه کاربران را تضمین می‌کند.
استفاده از Stable Diffusion به صورت آنلاین کاربرپسند است، رابط کاربری ساده‌ای دارد و نیازی به تخصص فنی نیست.
در نهایت، بسیاری از خدمات آنلاین طیف متنوعی از سبک‌های هنری را برای انتخاب ارائه می‌دهند و کاربران را قادر می‌سازد تا تکنیک‌ها و زیبایی‌شناسی مختلف را کشف و آزمایش کنند.

نحوه اجرای Stable Diffusion آنلاین

یکی از بهترین راه‌ها برای اجرای رایگان Stable Diffusion، استفاده از Fotor AI Image Generator است که یکی از بهترین مدل‌های Stable Diffusion شناخته می‌شود. این پلتفرم که بر پایه مدل انتشار پایدار ساخته شده، می‌تواند تصاویری را بر اساس توصیفات زبان طبیعی ایجاد کند. قابل توجه‌ترین ویژگی مولد متن به تصویر هوش مصنوعی در Fotor این است که گزینه مناسبی برای مبتدیان به شمار می‌رود.

البته نیازی به مهارت‌های ویرایش یا طراحی نیست و فقط متن اثر هنری مورد نظر خود را تا حد امکان با جزئیات وارد کنید تا به راحتی و با سرعت شاهد آثار هنری خیره‌کننده‌ای مانند شخصیت‌های انیمه هوش مصنوعی، آواتارهای هوش مصنوعی، پس‌زمینه‌های هوش مصنوعی و غیره باشید.

اگر قصد دارید از سرویس‌های تحت وب این هوش مصنوعی بهره ببرید، مجبورید از نسخه پولی Dream studio استفاده کنید. البته این سیستم تا 200 واحد برای کاربران اعتبار در نظر گرفته تا با محیط نرم‌افزار آشنا شوند و اگر از آن لذت بردند نسخه ارتقا یافته را تهیه کنند. در این مورد باید به اکانت پی پال دسترسی داشته باشید که در ایران فقط از طریق سایت‌های واسطه ای همچون آریاپی امکان افتتاح چنین حساب‌هایی وجود دارد.

با مراجعه به وب‌سایت DreamStudio.ai مراحل ثبت‌نام را کامل کنید، خوشبختانه می‌توانید به‌راحتی با اکانت جیمیل خود وارد شوید.
پس از ثبت‌نام و ساخته شدن اکانت در صفحه اصلی Dream studio قرار خواهید گرفت.
اگر دقت کنید در پایین صفحه یک کادر برای شما در نظر گرفته شده تا متن خود را در آن بنویسید. شاید بتوان گفت این کادر، مهم‌ترین قسمت این سایت است.
جزئیات نیاز خود را به صورت یک متن واضح در کادر نوشته و دکمه Dream را بزنید.
در مورد متن شما باید بگوییم که سعی کنید جزئیات اصلی تصویر از قلم نیفتد و به‌علاوه متن شما بیش از حد طولانی نباشد.
برای آموزش نوشتن یک متن خوب می‌توانید سری به سایت art بزنید و مثال‌هایی از پرامپت های نوشته شده و تصاویر خروجی ببینید.
می‌توانید قسمت‌های مهم‌تر متن را که قرار است تصویر شما حول آن تولید شود در پرانتز قرار دهید.
پنل سمت راستی که در سایت Dream studio قرار گرفته به شما امکان مشخص کردن نسخه خروجی که Stable Diffusion یا Stable Inpainting باشد را می‌دهد.
گزینه دیگری که در پنل سمت راست می‌بینید و با عبارت Steps مشخص شده، تعداد مراحل تولید عکس را نشان می‌دهد.
شما می‌توانید این مراحل را بین 10 تا 150 تنظیم کنید. البته لازم است بدانید که هر چه تعداد این مراحل بالاتر باشد، هزینه بیشتری از اعتبار شما کسر می‌گردد.
اگر از نتیجه کار راضی نبودید می‌توانید با زدن مجدد دکمه Dream منتظر خروجی جدید باشید.
همچنین اگر یک عکس به نظر شما راضی کننده بود و فقط نیاز به ویرایش برخی جزئیات داشت می‌تواند با کلیک روی عدد، مراحل ویرایش را افزایش دهید.
دو گزینه Width و Hight در پنل سمت راست به شما کمک می‌کنند تا ابعاد تصویر را بین 512 تا 1024 پیکسل تنظیم نمایید. این اعداد برای هر دو گزینه به صورت پیش فرض روی 512 قرار دارد.
تصاویری که رزولوشن بالاتری دارند، جزئیات جذاب‌تری را نیز نمایش خواهند داد اما خب هزینه بیشتر را به شما تحمیل خواهند کرد.
ویژگی CFG Scale نیز یکی دیگر از ویژگی‌های فوق‌العاده این هوش مصنوعی است که از 0 تا 20 قابل تنظیم بوده و میزان پیروی سیستم از فرمان‌های شما را مشخص می‌کند.
از دیگر امکانات این سایت img2img است که به کمک آن می‌توانید از یک تصویر پیش ساخته برای خلق اثری جدید استفاده کنید. (کافیست گزینه None را روی کادر پایین مشخص کرده گزینه Uplaod image را انتخاب کنید)
با آپلود تصویر و زدن دکمه Dream منتظر خروجی باشید که بی‌شباهت به تصویر اولیه نیست. (البته در گزینه Image Strength می‌توانید میزان این شباهت را نیز تعیین کنید)

سیستم مورد نیاز Stable Diffusion

برای اجرای Stable Diffusion بر روی رایانه شخصی خود، شما به سخت‌افزار و نرم‌افزار مناسبی نیاز دارید. برخی از پیش‌نیازهای اصلی عبارتند از:

یک کارت گرافیک با حداقل 6 گیگابایت حافظه VRAM
10 گیگابایت فضای ذخیره سازی روی هارد دیسک یا درایو حالت جامد
نصب کننده Miniconda3
فایل‌های Stable Diffusion از GitHub
آخرین چک پوینت‌ها از co
نصب کننده Git
سیستم‌عامل Windows 8، 10 یا 11

برای نصب و اجرای Stable Diffusion شما باید ابتدا Git و Miniconda3 را نصب کنید. سپس باید فایل‌های Stable Diffusion را از GitHub دانلود و محیط پایتون مخصوص آن را ایجاد کنید. بعد از آن باید چک پوینت‌های مورد نظر خود را از HuggingFace.co دانلود کرده و در پوشه مربوطه قرار دهید. در نهایت، شما می‌توانید با استفاده از خط فرمان، تصاویر را با استفاده از Stable Diffusion تولید کنید.

آریاپی برای علاقه‌مندان به Stable Diffusion نیز راه‌حل دارد!

در این مقاله در مورد اینکه هوش مصنوعی Stable Diffusion چیست، نحوه عملکرد آن و نحوه استفاده از Stable Diffusion صحبت کرده‌ایم. سعی کردیم با بررسی راه‌هایی برای اجرای Stable Diffusion از جمله یک مسیر بدون هزینه (Fotor Stable Diffusion) و روش پولی تحت وب (Dream studio) به شما کمک کنیم تا این سیستم را آزمایش کنید و پتانسیل آن را برای به نمایش گذاشتن بهترین تصاویر دیجیتالی خود کشف کنید.

اگر با این روش‌ها به Stable Diffusion علاقه‌مند شدید، کافیست تا با افتتاح حساب پی پال در آریاپی، امکان پرداخت هزینه اشتراک پولی این سیستم را برای خود فراهم سازید.

نظرات کاربران

ثبت نظر

هنوز نظری ثبت نشده است.

نظر خود را ثبت کنید