استیبل دیفیوژن

استیبل دیفیوژن (به انگلیسی: Stable Diffusion) یک مدل یادگیری ماشین است که توسط استبیلیتی ای‌آی برای تولید تصاویر از توصیفات به زبان طبیعی توسعه داده شده است. این مدل بخلاف مدل‌هایی مانند دال-ای متن‌باز است و هیچ محدودیت مصنوعی برای تولید تصاویر قائل نیست. منتقدان در مورد اخلاق هوش‌مصنوعی ابراز نگرانی کرده‌اند از جمله در مورد استفاده از این مدل برای تولید تصاویر دیپ‌فیک. مدل استیبل دیفیوژن می‌تواند بر روی سخت‌افزاری با یک واحد پردازش گرافیکی اجراء شود.

استیبل دیفیوژن (Stable Diffusion)
تصویری تولید شده با توضیح "a photograph of an astronaut riding a horse" (تصویر فضانوردی که اسب می‌راند)
تصویری تولید شده با توضیح "a photograph of an astronaut riding a horse" (تصویر فضانوردی که اسب می‌راند)
نویسنده(های)
اصلی
استبیلیتی ای‌آی (Stability AI)
انتشار ابتدایی۲ اوت ۲۰۲۲
مخزن
گونهترنسفورمر مدل زبانی
وبگاه

استیبل دیفیوژن یک مدل متن به تصویر با منبع باز است که امکان تولید تصاویر بر اساس توضیحات متنی(پرامپت) را فراهم می‌کند. به عبارت دیگر، این مدل قادر است متن ورودی را به یک نمایش بصری تبدیل نماید. بدین ترتیب، کاربر می‌تواند با توضیح دادن دقیق موضوع مورد نظرش تصویر مرتبطی تولید کند. این امکانات پیشرفته «Stable Diffusion» آن را به یکی از پیشروترین مدل‌های تولید تصویر با هوش مصنوعی تبدیل کرده است. [۱]

منابع ویرایش

  1. «همه چیز درباره هوش مصنوعی Stable Diffusion». ۲۰۲۴-۰۳-۱۰. دریافت‌شده در ۲۰۲۴-۰۳-۱۱.

مشارکت‌کنندگان ویکی‌پدیا. «Stable Diffusion». در دانشنامهٔ ویکی‌پدیای انگلیسی، بازبینی‌شده در ۲ سپتامبر ۲۰۲۲.