استیبل دیفیوژن

استیبل دیفیوژن (Stable Diffusion)
	تصویری تولید شده با توضیح "a photograph of an astronaut riding a horse" (تصویر فضانوردی که اسب می‌راند)
نویسنده(های); اصلی	استبیلیتی ای‌آی (Stability AI)
انتشار اولیه	۲ اوت ۲۰۲۲
مخزن	github.com/Stability-AI/generative-models ;
نوع	ترنسفورمر مدل زبانی
وبگاه	github.com/CompVis/stable-diffusion

استیبل دیفیوژن (به انگلیسی: Stable Diffusion) یک مدل یادگیری ماشین است که توسط استبیلیتی ای‌آی برای تولید تصاویر از توصیفات به زبان طبیعی توسعه داده شده است. این مدل بخلاف مدل‌هایی مانند دال-ای متن‌باز است و هیچ محدودیت مصنوعی برای تولید تصاویر قائل نیست. منتقدان در مورد اخلاق هوش‌مصنوعی ابراز نگرانی کرده‌اند از جمله در مورد استفاده از این مدل برای تولید تصاویر دیپ‌فیک. مدل استیبل دیفیوژن می‌تواند بر روی سخت‌افزاری با یک واحد پردازش گرافیکی اجراء شود.

استیبل دیفیوژن یک مدل متن به تصویر با منبع باز است که امکان تولید تصاویر بر اساس توضیحات متنی(پرامپت) را فراهم می‌کند. به عبارت دیگر، این مدل قادر است متن ورودی را به یک نمایش بصری تبدیل نماید. بدین ترتیب، کاربر می‌تواند با توضیح دادن دقیق موضوع مورد نظرش تصویر مرتبطی تولید کند. این امکانات پیشرفته «Stable Diffusion» آن را به یکی از پیشروترین مدل‌های تولید تصویر با هوش مصنوعی تبدیل کرده است. ^[۱]

منابع

↑ «همه چیز درباره هوش مصنوعی Stable Diffusion». ۲۰۲۴-۰۳-۱۰. دریافت‌شده در ۲۰۲۴-۰۳-۱۱.

مشارکت‌کنندگان ویکی‌پدیا. «Stable Diffusion». در دانشنامهٔ ویکی‌پدیای انگلیسی، بازبینی‌شده در ۲ سپتامبر ۲۰۲۲.

[1] «همه چیز درباره هوش مصنوعی Stable Diffusion». ۲۰۲۴-۰۳-۱۰. دریافت‌شده در ۲۰۲۴-۰۳-۱۱.

[۱]

تصویری تولید شده با توضیح "a photograph of an astronaut riding a horse" (تصویر فضانوردی که اسب می‌راند)
نویسنده(های) اصلی	استبیلیتی ای‌آی (Stability AI)
انتشار اولیه	۲ اوت ۲۰۲۲
مخزن	github.com/Stability-AI/generative-models
نوع	ترنسفورمر مدل زبانی
وبگاه	github.com/CompVis/stable-diffusion