اگر کمی از تکنولوژی و ابزارهای روز سررشته داشته باشید، متوجه میشوید که هوش مصنوعی در حال تغییر دنیای ماست. هر یک از ابزارهای هوش مصنوعی قادرند طبق یک الگوریتم خاص مبتنی بر درک انسانی، فرایند و عملیات پروژهها را به حدی ساده کنند که انسان انگشت به دهان بماند!
این سادهسازی تا جایی ادامه دارد که هوش مصنوعی میتواند در نقش یک برنامهنویس، با سرعت تمام کد بزند یا مثل یک نویسنده ماهر، داستانی جذاب تعریف کند. هوش مصنوعی Stable Diffusion حتی قادر است بر اساس متنی که دریافت میکند، یک تصویر بینقص را در اختیار شما قرار دهد.
برای کار با چنین ابزارهای قدرتمندی کافیست روش کار آنها را یاد بگیرید و با کسب تجربه به خروجیهای مد نظرتان دست یابید؛ بنابراین در ادامه این نوشتار از آریاپی همراه ما باشید تا بگوییم هوش مصنوعی Stable Diffusion چیست؟ چه کاربردی دارد و چطور کار میکند؟
Stable Diffusion؛ هوش مصنوعی open-suorce با قابلیت تبدیل متن به عکس
هوش مصنوعی Stable Diffusion یک مدل یادگیری ماشین است که توانایی تولید تصاویر از توصیفات به زبان طبیعی را دارد. این مدل توسط شرکت Stability AI توسعه داده شده و کد منبع آن به صورت متنباز (open source) در دسترس عموم قرار دارد.
به زبان ساده، وقتی به Stable Diffusion یک اعلان میدهید، مدل آموزش داده میشود تا تصویری واقعی از چیزی ایجاد کند که با توضیحات شما مطابقت داشته باشد. میتوان گفت این یک پیشرفت قابل توجه نسبت به تولیدکنندههای متن – تصویر قبلی است؛ زیرا میتواند توصیفات متنی پیچیده و انتزاعی را مدیریت کند. استیبل دیفیوژن با استفاده از روش جدیدی به نام آموزش پایدار به این امر دست مییابد و به مدل انتشار پایدار اجازه میدهد تا تصاویر با کیفیت بالا و مطابق با ورودی متنی تولید کند.
این مدل که از محدودیتهای مصنوعی برای تولید تصاویر پیروی نمیکند، میتواند تصاویر خلاقانه و جذابی را از متنهای کوتاه ایجاد کند. برای استفاده از این مدل میتوانید از برنامهDreamStudio که یک سرویس تحت وب است استفاده کنید. این برنامه به شما امکان میدهد که با وارد کردن توصیف مورد نظر خود، تصویری را از آن تولید کنید. همچنین می توانید با خرید اکانت چت جی پی تی از خدمات متفاوت و گوناگون آن استفاده کنید.
برای این کار باید به وبسایت Beta.DreamStudio.ai مراجعه و ثبتنام کنید. سپس میتوانید متن خود را در کادر مربوطه نوشته و دکمه Dream را بزنید. برنامه به شما تصویر مورد نظر را نشان میدهد.
روش های استفاده از Stable Diffusion
در سالهای اخیر، پیشرفتهای چشمگیری در مدلهای تولید تصویر با هوش مصنوعی صورت گرفته است. در مقاله بهترین ابزارهای طراحی گرافیک هوش مصنوعی 2024 سعی کردیم برخی از این ابزارهای کاربردی را معرفی کنیم. یکی دیگر از این مدلهای پیشگامانه، Stable Diffusion است؛ یک مدل متن به تصویر متن باز که در سال 2022 از طریق تکنیکهای یادگیری عمیق معرفی شد.
این مدل انتشار پایدار به ما امکان میدهد تصاویر را بر اساس توضیحات متنی تولید کنیم. به عبارت دیگر، میتوانیم متنی را که بهعنوان ورودی ارائه میکنیم به صورت یک نمایش بصری درآوریم؛ اما چگونه این امر محقق میشود؟
برای استفاده از Stable Diffusionمیتوانید یکی از روشهای زیر را انتخاب کنید:
- استفاده از برنامه DreamStudio که یک سرویس تحت وب است و به شما امکان میدهد با وارد کردن متن و توصیف مورد نظر خود، تصویری را از آن تولید کنید. برای این کار باید به وبسایت DreamStudio.ai رفته و ثبتنام کنید. سپس میتوانید با نوشتن توصیف خود در قسمت مشخص شده و زدن دکمه Dream تصویر مورد نظرتان را مشاهده کنید.
- استفاده از پروژه Stable Horde که به شما اجازه میدهد کارتهای گرافیک خود را برای تولید تصویر رایگان با استفاده از منبع باز Stable Diffusion مدل ارسال کنید. برای این کار باید یک حساب کاربری ثبت نمایید. با دریافت یک کلید API و استفاده از کلید API خود با افزودن آن به Options استفاده کنید و برای تصاویر مورد نیازتان خروجی بگیرید.
- استفاده از کد منبع باز Stable Diffusion مدل که میتوانید از PyTorch و TensorFlow استفاده کنید. برای ساخت تصویر با استفاده از Stable Diffusion باید از یک تصویر اولیه شروع کنید و سپس با استفاده از Stable Diffusion، تصویر را به صورت پیوسته تا رسیدن به تصویر مورد نظر خود تغییر دهید.
آیا استفاده از هوش مصنوعی Stable Diffusion رایگان است؟
Stable Horde یک پروژه رایگان و متن باز است که به شما اجازه میدهد از قدرت کارت گرافیک خود برای تولید تصویر با استفاده از Stable Diffusion استفاده کنید. تولیدکننده هوش مصنوعی Stable Diffusion میتواند طیف گستردهای از سبکهای هنری از جمله پرترههای فوتو رئالیستی، مناظر و هنر انتزاعی را تولید کند. البته در ادامه خواهیم گفت که استفاده از هوش مصنوعی Stable diffusion تحت وب نیاز به پرداخت هزینه خواهد داشت.
عملکرد سرویس Stable Diffusion چگونه است؟
این الگوریتم در کاربردهای مختلفی از جمله تولید تصاویر برای تحقیقات علمی، ایجاد هنر دیجیتال و توسعه بازیهای ویدئویی استفاده شده است.
بهعنوان مثال، توسعهدهندگان بازی میتوانند از مدلهایی برای تولید آیتمهای بازی مانند شخصیتها و صحنههای بازی به کمک توضیحات متنی استفاده کنند. بهعلاوه سایتهای تجارت الکترونیکی میتوانند با ارائه توضیحاتی درباره محصول، یک طرح محصول بصری داشته باشند یا حتی برخی افراد زیرک به راحتی میتوانند از تصاویر خروجی در سایتهایی مثل فری پیک به در آمد برسند. در این مورد میتوانید سری به نوشته معرفی سایتهای مشابه فری پیک و بررسی جایگزینهای بزنید و اطلاعات بیشتری کسب کنید.
شاید با خواندن این مطالب از خودتان بپرسید الگوریتم هوش مصنوعی Stable Diffusion چیست؟ بیایید نحوه عملکرد Stable Diffusion را بررسی کنیم.
Stable Diffusion با اعمال مکرر فرایند انتشار بر روی تصویر عمل میکند. در هر تکرار، الگوریتم ضریب انتشار را بر اساس ویژگیهای تصویر محلی، مانند گرادیانها و لبهها، محاسبه میکند. این ضریب قدرت و جهت انتشار را تعیین کرده و به الگوریتم اجازه میدهد تا اثر هموارسازی را در بخشهای مختلف تصویر تنظیم کند.
فرایند انتشار با توزیع مجدد مقادیر پیکسل بر اساس اطلاعات محلی کار میکند. این الگوریتم نویز را با انتشار مقادیر پیکسل در مناطق صاف و در عین حال حفظ انتقالها و لبههای واضح کاهش میدهد. این صاف کردن انتخابی به حفظ جزئیات تصویر و جلوگیری از تار شدن یا از دست دادن ویژگیهای مهم آن کمک میکند.
به زبان سادهتر، هنگامی که کاربر توضیحاتی را با ادبیاتی روان وارد میکند، Stable Diffusion با تفسیر و درک درخواست کار خود را آغاز میکند. با استفاده از هوش مصنوعی، متن مورد تجزیه و تحلیل قرار گرفته و اطلاعات مربوطه به منظور تولید تصویر مورد نظر استخراج میشود.
مدل انتشار Stable Diffusion
Stable Diffusion از مدل انتشاری استفاده میکند که برای حذف نویز گاوسی از تصاویر تار آموزش دیده است. مدل پخش به طور اختصاصی برای تولید تصاویر از مراحل ابتدایی ساخته شده که با یک تصویر اولیه نویز و تار شروع میشود. از طریق پالایش تکراری، مدل به تدریج تصویر را بهبود میبخشد تا زمانی که به نتیجه واضحی دست یابد که با خروجی مورد نظر کاربر همسو شود.
- Stable Diffusion با یادگیری مستمر تصاویر بهتری را به مرور زمان خلق میکند!
با افزایش تعامل کاربر و ارائه توضیحات متنی به Stable Diffusion، سیستم هوش مصنوعی به طور مداوم تلاش میکند با گذشت زمان بیشتر یاد بگیرد و کیفیت خروجیهای خود را افزایش دهد. این فرایند یادگیری مداوم، Stable Diffusion را قادر میسازد تا تصاویری را تولید کند که به تدریج دقیقتر و واقعیتر هستند.
پس از درک متن و اجرای مدل انتشار، مولد هوش مصنوعی Stable Diffusion با استفاده از اطلاعات داده شده و دانش به دست آمده از آموزش آن تصویری تولید میکند و حتی در مواردی خاص، هوش مصنوعی این قابلیت را دارد که تصاویر متعددی تولید کند که بیانگر درک یا تفاسیر مختلفی از توضیحات ارائه شده هستند. - Stable Diffusion امکان ویرایش تصاویر موجود را نیز دارد!
جدا از ایجاد تصاویر از ابتدا، Stable Diffusion این قابلیت را دارد که تصاویر موجود را بر اساس دستورالعملهای کاربر تغییر دهد. این فرایند مستلزم کارهایی مانند افزودن یا حذف اشیا، تغییر رنگها یا تنظیمات دیگر عناصر درون تصویر است. - چگونه Stable Diffusion را اجرا کنیم؟
Stable Diffusion را میتوان در تنظیمات و برنامههای مختلف استفاده کرد. در اینجا سه روش متداول برای استفاده از Stable Diffusion و تجربه موثر هنر Stable Diffusion AI را عنوان کردیم. - از Stable Diffusion در Cloud استفاده کنید!
خدمات مبتنی بر ابر یک رویکرد راحت برای استفاده از Stable Diffusion ارائه میدهد. شرکتهای متعددی خدمات Stable Diffusion را از طریق ابر ارائه میکنند و کاربران را قادر میسازند آثار هنری را مطابق با نیاز خود تولید کنند.
این خدمات معمولا شامل آپلود تصویر ورودی و انتخاب سبک هنری مورد نظر است. سپس این سرویس از Stable Diffusion برای ایجاد تصویر خروجی استفاده میکند که میتواند به صورت آنلاین دانلود یا به اشتراک گذاشته شود.
انتخاب Stable Diffusion مبتنی بر ابر چندین مزیت دارد که عبارتاند از:
- در اغلب موارد در مقایسه با اجرای الگوریتم به صورت محلی، سریعتر عمل میکند.
- این سرویسها توانایی پردازش در مقیاس بزرگ را دارند که در نتیجه منجر به تولید سریع تصاویر با کیفیت بالا خواهد شد.
- در نهایت، استفاده از Stable Diffusion در فضای ابری اغلب مقرونبهصرفهتر است؛ زیرا کاربران فقط برای منابعی که استفاده میکنند هزینه میپردازند و در نتیجه هزینهها را به حداقل میرسانند.
- از Stable Diffusion Locally استفاده کنید!
یک انتخاب جایگزین، اجرای Stable Diffusion در رایانه شخصی شما است. برای این روش که کاملا رایگان است، نیاز دارید نرمافزار Stable Diffusion را بر روی دستگاه خود نصب کنید و پس از نصب نرمافزار، میتوانید برای تولید آثار هنری با استفاده از AI Stable Diffusion نهایت استفاده را ببرید.
Running Stable Diffusion به صورت محلی چندین مزیت دارد که در ادامه نام میبریم:
در مرحله اول، کنترل بیشتری بر فرایند به شما میدهد و شما را قادر میسازد الگوریتم را مطابق با نیازهای خاص خود سفارشی کنید.
ثانیاً اجرای Stable Diffusion در رایانه محلیتان به شما امکان میدهد بدون اتکا به اتصال اینترنت، آثار هنری تولید کنید که میتواند در شرایطی که دسترسی به اینترنت محدود بوده یا اصلا در دسترس نیست مفید باشد.
از Stable Diffusion Online استفاده کنید!
پلتفرمهای آنلاین متعددی مثل dream studio مدل انتشار پایدار را بهعنوان یک سرویس آنلاین ارائه میدهند و به کاربران اجازه میدهند از عملکرد آن استفاده کنند. این وبسایتها آپلود تصاویر ورودی را امکانپذیر میکنند که با استفاده از مدلهای انتشار پایدار برای اعمال سبکهای هنری مختلف پردازش شوند. پس از تکمیل الگوریتم، تصویر خروجی حاصل را میتوان دانلود یا به اشتراک گذاشت. سرویس Dream studio به کاربران جدید تا سقف معینی اعتبار هدیه میدهد؛ اما برای ادامه بیشتر باید هزینه آن را پرداخت کنید.
چندین مزیت استفاده از Stable Diffusion به صورت آنلاین عبارتند از:
- اغلب به صورت رایگان یا با حداقل هزینه در دسترس است و دسترسی همه کاربران را تضمین میکند.
- استفاده از Stable Diffusion به صورت آنلاین کاربرپسند است، رابط کاربری سادهای دارد و نیازی به تخصص فنی نیست.
- در نهایت، بسیاری از خدمات آنلاین طیف متنوعی از سبکهای هنری را برای انتخاب ارائه میدهند و کاربران را قادر میسازد تا تکنیکها و زیباییشناسی مختلف را کشف و آزمایش کنند.
نحوه اجرای Stable Diffusion آنلاین
یکی از بهترین راهها برای اجرای رایگان Stable Diffusion، استفاده از Fotor AI Image Generator است که یکی از بهترین مدلهای Stable Diffusion شناخته میشود. این پلتفرم که بر پایه مدل انتشار پایدار ساخته شده، میتواند تصاویری را بر اساس توصیفات زبان طبیعی ایجاد کند. قابل توجهترین ویژگی مولد متن به تصویر هوش مصنوعی در Fotor این است که گزینه مناسبی برای مبتدیان به شمار میرود.
البته نیازی به مهارتهای ویرایش یا طراحی نیست و فقط متن اثر هنری مورد نظر خود را تا حد امکان با جزئیات وارد کنید تا به راحتی و با سرعت شاهد آثار هنری خیرهکنندهای مانند شخصیتهای انیمه هوش مصنوعی، آواتارهای هوش مصنوعی، پسزمینههای هوش مصنوعی و غیره باشید.
اگر قصد دارید از سرویسهای تحت وب این هوش مصنوعی بهره ببرید، مجبورید از نسخه پولی Dream studio استفاده کنید. البته این سیستم تا 200 واحد برای کاربران اعتبار در نظر گرفته تا با محیط نرمافزار آشنا شوند و اگر از آن لذت بردند نسخه ارتقا یافته را تهیه کنند. در این مورد باید به اکانت پی پال دسترسی داشته باشید که در ایران فقط از طریق سایتهای واسطه ای همچون آریاپی امکان افتتاح چنین حسابهایی وجود دارد.
- با مراجعه به وبسایت DreamStudio.ai مراحل ثبتنام را کامل کنید، خوشبختانه میتوانید بهراحتی با اکانت جیمیل خود وارد شوید.
- پس از ثبتنام و ساخته شدن اکانت در صفحه اصلی Dream studio قرار خواهید گرفت.
- اگر دقت کنید در پایین صفحه یک کادر برای شما در نظر گرفته شده تا متن خود را در آن بنویسید. شاید بتوان گفت این کادر، مهمترین قسمت این سایت است.
- جزئیات نیاز خود را به صورت یک متن واضح در کادر نوشته و دکمه Dream را بزنید.
- در مورد متن شما باید بگوییم که سعی کنید جزئیات اصلی تصویر از قلم نیفتد و بهعلاوه متن شما بیش از حد طولانی نباشد.
- برای آموزش نوشتن یک متن خوب میتوانید سری به سایت art بزنید و مثالهایی از پرامپت های نوشته شده و تصاویر خروجی ببینید.
- میتوانید قسمتهای مهمتر متن را که قرار است تصویر شما حول آن تولید شود در پرانتز قرار دهید.
- پنل سمت راستی که در سایت Dream studio قرار گرفته به شما امکان مشخص کردن نسخه خروجی که Stable Diffusion یا Stable Inpainting باشد را میدهد.
- گزینه دیگری که در پنل سمت راست میبینید و با عبارت Steps مشخص شده، تعداد مراحل تولید عکس را نشان میدهد.
- شما میتوانید این مراحل را بین 10 تا 150 تنظیم کنید. البته لازم است بدانید که هر چه تعداد این مراحل بالاتر باشد، هزینه بیشتری از اعتبار شما کسر میگردد.
- اگر از نتیجه کار راضی نبودید میتوانید با زدن مجدد دکمه Dream منتظر خروجی جدید باشید.
- همچنین اگر یک عکس به نظر شما راضی کننده بود و فقط نیاز به ویرایش برخی جزئیات داشت میتواند با کلیک روی عدد، مراحل ویرایش را افزایش دهید.
- دو گزینه Width و Hight در پنل سمت راست به شما کمک میکنند تا ابعاد تصویر را بین 512 تا 1024 پیکسل تنظیم نمایید. این اعداد برای هر دو گزینه به صورت پیش فرض روی 512 قرار دارد.
- تصاویری که رزولوشن بالاتری دارند، جزئیات جذابتری را نیز نمایش خواهند داد اما خب هزینه بیشتر را به شما تحمیل خواهند کرد.
- ویژگی CFG Scale نیز یکی دیگر از ویژگیهای فوقالعاده این هوش مصنوعی است که از 0 تا 20 قابل تنظیم بوده و میزان پیروی سیستم از فرمانهای شما را مشخص میکند.
- از دیگر امکانات این سایت img2img است که به کمک آن میتوانید از یک تصویر پیش ساخته برای خلق اثری جدید استفاده کنید. (کافیست گزینه None را روی کادر پایین مشخص کرده گزینه Uplaod image را انتخاب کنید)
- با آپلود تصویر و زدن دکمه Dream منتظر خروجی باشید که بیشباهت به تصویر اولیه نیست. (البته در گزینه Image Strength میتوانید میزان این شباهت را نیز تعیین کنید)
سیستم مورد نیاز Stable Diffusion
برای اجرای Stable Diffusion بر روی رایانه شخصی خود، شما به سختافزار و نرمافزار مناسبی نیاز دارید. برخی از پیشنیازهای اصلی عبارتند از:
- یک کارت گرافیک با حداقل 6 گیگابایت حافظه VRAM
- 10 گیگابایت فضای ذخیره سازی روی هارد دیسک یا درایو حالت جامد
- نصب کننده Miniconda3
- فایلهای Stable Diffusion از GitHub
- آخرین چک پوینتها از co
- نصب کننده Git
- سیستمعامل Windows 8، 10 یا 11
برای نصب و اجرای Stable Diffusion شما باید ابتدا Git و Miniconda3 را نصب کنید. سپس باید فایلهای Stable Diffusion را از GitHub دانلود و محیط پایتون مخصوص آن را ایجاد کنید. بعد از آن باید چک پوینتهای مورد نظر خود را از HuggingFace.co دانلود کرده و در پوشه مربوطه قرار دهید. در نهایت، شما میتوانید با استفاده از خط فرمان، تصاویر را با استفاده از Stable Diffusion تولید کنید.
آریاپی برای علاقهمندان به Stable Diffusion نیز راهحل دارد!
در این مقاله در مورد اینکه هوش مصنوعی Stable Diffusion چیست، نحوه عملکرد آن و نحوه استفاده از Stable Diffusion صحبت کردهایم. سعی کردیم با بررسی راههایی برای اجرای Stable Diffusion از جمله یک مسیر بدون هزینه (Fotor Stable Diffusion) و روش پولی تحت وب (Dream studio) به شما کمک کنیم تا این سیستم را آزمایش کنید و پتانسیل آن را برای به نمایش گذاشتن بهترین تصاویر دیجیتالی خود کشف کنید.
اگر با این روشها به Stable Diffusion علاقهمند شدید، کافیست تا با افتتاح حساب پی پال در آریاپی، امکان پرداخت هزینه اشتراک پولی این سیستم را برای خود فراهم سازید.