فصل چهاردهم: یادگیری بدون نظارت
مقدمه
یادگیری بدون نظارت به مدلهایی اشاره دارد که در غیاب برچسبها، ساختار یک مجموعهداده را میآموزند. برخلاف یادگیری تحت نظارت که در آن مدلها دادههای مشاهدهشده را به مقادیر خروجی نگاشت میکنند، مدلهای بدون نظارت تنها از دادههای مشاهدهشده استفاده میکنند. این مدلها اهداف متنوعی دارند، از جمله:
تولید نمونههای جدید
حذف نویز
درونیابی
فشردهسازی دادهها
کشف ساختار داخلی دادهها (مانند خوشهبندی)
تشخیص نمونههای پرت
1. طبقهبندی مدلهای یادگیری بدون نظارت
متغیرهای پنهان و مدلهای مولد
یک استراتژی رایج در یادگیری بدون نظارت، تعریف یک نگاشت بین دادههای مشاهدهشده و متغیرهای پنهان است. متغیرهای پنهان معمولاً ابعاد کمتری نسبت به دادههای اصلی دارند و ساختار زیربنایی دادهها را نشان میدهند. این متغیرها را میتوان نسخههای فشردهشدهای از دادهها در نظر گرفت که ویژگیهای اساسی آنها را نمایندگی میکنند.
مدلهای مولد، زیرمجموعهای از مدلهای بدون نظارت هستند که میتوانند نمونههای جدیدی تولید کنند. این مدلها با تعریف یک توزیع روی متغیرهای پنهان و سپس نگاشت به فضای دادههای مشاهدهشده عمل میکنند.
چهار مدل مولد پرکاربرد عبارتاند از:
شبکههای متخاصم مولد (GAN)
رمزگذارهای خودکار متغیر (VAE)
جریانهای عادی (Normalizing Flows)
مدلهای انتشار (Diffusion Models)
2. ویژگیهای مطلوب مدلهای مولد
یک مدل مولد خوب باید دارای ویژگیهای زیر باشد:
نمونهبرداری کارآمد: تولید نمونهها باید از نظر محاسباتی مقرونبهصرفه باشد.
نمونهبرداری با کیفیت بالا: نمونهها باید از دادههای واقعی غیرقابل تشخیص باشند.
پوشش توزیع: نمونهها باید کل توزیع دادههای آموزشی را پوشش دهند.
فضای نهان خوشرفتار: تغییرات هموار در باید به تغییرات هموار در منجر شود.
فضای نهان جداشده: هر بعد از باید با ویژگیهای قابل تفسیر در دادهها مطابقت داشته باشد.
محاسبه درستنمایی: در مدلهای احتمالی، محاسبهی احتمال برای نمونهها باید دقیق و کارآمد باشد.
3. معیارهای ارزیابی مدلهای مولد
ارزیابی مدلهای مولد دشوار است اما چند معیار رایج شامل:
احتمال آزمون: اندازهگیری احتمال دادههای آزمایشی تحت مدل – برای مدلهای احتمالی مانند VAE مناسب است.
امتیاز آغازین (Inception Score – IS)
فاصله آغازین فرشته (Fréchet Inception Distance – FID)
دقت و یادآوری منیفولد: همپوشانی منیفولد دادههای واقعی و تولیدی را ارزیابی میکند.
4. شبکههای متخاصم مولد (GAN)
معرفی GAN
GAN از دو شبکه تشکیل شده است:
مولد (Generator): یک بردار نویز تصادفی را به یک نمونه داده نگاشت میکند.
متمایزکننده (Discriminator): سعی دارد بین دادههای واقعی و تولیدی تمایز قائل شود.
آموزش GAN
هدف آموزش، حل یک بازی دومینیمم – بیشینه بین دو بازیکن است.
تابع زیان متمایزکننده:
تابع زیان مولد:
که در آن تابع سیگموید، خروجی مولد و خروجی متمایزکننده است.
چالشهای آموزش GAN
ناپدید شدن گرادیان: زمانی که متمایزکننده بسیار قوی باشد.
فروپاشی حالت (Mode Collapse): مولد فقط نمونههای محدودی تولید میکند.
یافتن تعادل نش: آموزش همزمان دو شبکه پایدار نیست.
بهبود پایداری آموزش
Wasserstein GAN: استفاده از فاصله Wasserstein به جای واگرایی Jensen–Shannon.
رشد پیشرونده (Progressive Growing)
تبعیض دستهای کوچک (Mini-batch Discrimination)
برش متغیر نهان (Truncation Trick)
5. مدلهای مولد پیشرفته
GAN شرطی (Conditional GAN)
در GAN شرطی، مولد و متمایزکننده با شرط تقویت میشوند:
که میتواند برچسب، کلاس یا ویژگی خاصی از دادهها باشد.
StyleGAN
StyleGAN با تزریق نویز در سطوح مختلف شبکه مولد، کنترل بهتر و قابل تفسیرتری بر ویژگیهای تولیدی ارائه میدهد. این مدل از نرمالسازی تطبیقی استفاده میکند تا سبک (Style) تصویر در مقیاسهای مختلف کنترل شود.
6. نتیجهگیری
مدلهای مولد یادگیری بدون نظارت، ابزارهایی قدرتمند برای:
تولید دادههای جدید
درک ساختار دادهها
افزایش داده
بازسازی و کاهش نویز
هستند. انتخاب مناسبترین مدل بسته به کاربرد، نوع داده، نیاز به نمونهبرداری سریع یا دقیق و توانایی درونیابی یا تفسیر متغیرهای پنهان انجام میشود.