فصل دوم: یادگیری تحت نظارت
مقدمه
یادگیری تحت نظارت بهعنوان یکی از ارکان اصلی یادگیری ماشین، چارچوبی نظاممند برای استخراج الگوها از دادههای برچسبدار ارائه میدهد. در این رویکرد، هدف یادگیری تابعی است که بتواند رابطه بین متغیرهای ورودی و خروجی را با دقت مناسبی مدلسازی کند. این فرآیند مستلزم درک سه عنصر اساسی است: ساختار مدل، معیار ارزیابی عملکرد، و روش بهینهسازی پارامترها.
تعریف ریاضی مدل یادگیری نظارتشده
مدل یادگیری نظارتشده را میتوان بهصورت رابطه زیر نمایش داد:
که در آن:
: بردار ورودی با بعد
: بردار خروجی با بعد
: پارامترهای مدل با بعد
: تابع مدل با ساختار از پیش تعیینشده
رگرسیون خطی: مطالعه موردی
فرمولبندی ریاضی
مدل رگرسیون خطی به صورت زیر بیان میشود:
که در آن:
: عرض از مبدأ
: ضریب شیب
: خطای تصادفی با توزیع نرمال
مفاهیم هندسی و آماری
از دیدگاه هندسی، این مدل به دنبال یافتن خطی است که کمترین فاصله را با دادهها داشته باشد. از دیدگاه آماری، این مدل تخمینی از مقدار شرطی تحت فرض خطی بودن رابطه ارائه میدهد.
گسترش به فضای چندبعدی
رگرسیون خطی در فضای چند بعدی به صورت زیر تعمیم مییابد:
تابع هزینه و بهینهسازی پارامترها
تابع هزینه حداقل مربعات
تابع هزینه به صورت زیر تعریف میشود:
ویژگیهای مهم:
محدب بودن: تضمین وجود جواب بهینه سراسری
مشتقپذیری: امکان استفاده از گرادیان
تفسیرپذیری آماری: ارتباط با تابع درستنمایی گوسی
روشهای بهینهسازی
حل تحلیلی (برای مدل خطی):
نزول گرادیانی (روش تکراری):
که در آن نرخ یادگیری است.
روشهای مرتبه دوم مانند نیوتن-رافسون با استفاده از ماتریس هِسیان.
ارزیابی مدل و چالشهای عملی
تقسیمبندی دادهها
آموزش (60-80%): برای یادگیری پارامترها
اعتبارسنجی (10-20%): برای تنظیم ابرپارامترها
آزمون (10-20%): برای ارزیابی نهایی
معیارهای ارزیابی
برای رگرسیون:
MSE: میانگین مربعات خطا
: ضریب تعیین
برای طبقهبندی:
Accuracy: دقت کلی
Precision و Recall
مشکلات متداول
1. کمبرازش (Underfitting)
نشانهها: خطای بالا در هر دو مجموعه آموزش و آزمون
راهکارها:
افزایش پیچیدگی مدل
افزودن ویژگیهای مرتبط
کاهش منظمسازی
2. بیشبرازش (Overfitting)
نشانهها: خطای کم در آموزش، ولی زیاد در آزمون
راهکارها:
جمعآوری داده بیشتر
استفاده از تکنیکهای منظمسازی
کاهش پیچیدگی مدل
مقایسه مدلهای مولد و تمایزی
مدلهای تمایزی
مدلسازی مستقیم
نیاز به داده برچسبدار
کارایی بالا در پیشبینی
مدلهای مولد
مدلسازی
توانایی تولید داده
نیاز به داده بیشتر
درک بهتر ساختار دادهها
پیادهسازی عملی و ملاحظات محاسباتی
پیشپردازش دادهها
نرمالسازی: تبدیل داده به بازه [0,1] یا استانداردسازی
مدیریت داده گمشده: حذف یا جایگزینی
مهندسی ویژگی: استخراج ویژگیهای معنادار
بهینهسازی محاسباتی
محاسبات برداری: بهرهگیری از عملیات ماتریسی
محاسبات موازی: استفاده از چند پردازنده
یادگیری خوشهای: الگوریتمهای خاص برای دادههای حجیم
نتیجهگیری و چشمانداز
یادگیری تحت نظارت یکی از بنیانهای اساسی یادگیری ماشین است. درک صحیح آن زمینهساز فهم مدلهای پیشرفتهتری مانند شبکههای عصبی است. انتخاب ساختار مناسب، تابع هزینه صحیح و روش بهینهسازی مؤثر، عوامل کلیدی در عملکرد نهایی مدل هستند.
نکات کلیدی برای درک عمیقتر
رابطه دیدگاه هندسی و آماری
انتخاب تابع هزینه مناسب
توازن بین پیچیدگی مدل و توان تعمیم
تفاوتهای بنیادین مدلهای مولد و تمایزی
ملاحظات عملی در پیادهسازی و مقیاسپذیری الگوریتمها