فصل سیزدهم: گراف شبکههای عصبی
مقدمه
در این فصل به بررسی شبکههای عصبی گراف (GNN) پرداخته میشود؛ معماریهایی برای پردازش دادههای ساختاریافته به شکل گراف. گرافها از مجموعهای از گرهها (نودها) و یالها (لبهها) تشکیل شدهاند و در بسیاری از مسائل دنیای واقعی مانند شبکههای اجتماعی، مولکولهای شیمیایی و سیستمهای توصیهگر کاربرد دارند. این فصل به چالشهای پردازش گراف، روشهای نمایش آن، و معماریهای مختلف شبکههای عصبی گراف میپردازد.
1. نمودار چیست؟
تعریف و انواع نمودارها
گراف ساختاری است شامل مجموعهای از گرهها و یالها که ارتباط بین آنها را مدل میکند.
انواع گراف:
گراف بدون جهت: یالها بدون جهت هستند (مانند برخی روابط اجتماعی).
گراف جهتدار: یالها دارای جهت هستند (مانند شبکههای استناد).
گراف ناهمگن: گرهها و یالها میتوانند از نوعهای مختلف باشند (مثلاً گراف دانش).
گراف هندسی: گرهها مختصات فضایی دارند (مانند ابر نقاط سهبعدی).
مثالهای دنیای واقعی
شبکههای اجتماعی: افراد بهعنوان گره و روابط اجتماعی بهعنوان یال.
مولکولها: اتمها گره و پیوندهای شیمیایی یال هستند.
مدارهای الکتریکی: اجزای مدار بهعنوان گره و اتصالات الکتریکی بهعنوان یال.
2. نمایش نمودار
ماتریسهای نمایش گراف
ماتریس مجاورت:
نشاندهنده وجود یا عدم وجود یال بین گرههاست.
ماتریس ویژگی گرهها:
که در آن تعداد ویژگیهای هر گره است.
ماتریس ویژگی یالها (در صورت وجود):
برای یال و ویژگی.
ویژگیهای ماتریس مجاورت
توان از ماتریس مجاورت:
تعداد مسیرهای طول بین گره و را نشان میدهد.
جایگشتناپذیری: نمایش باید نسبت به ترتیب گرهها ناوردا باشد، یعنی:
که در آن ماتریس جایگشت است.
3. شبکههای عصبی گراف (GNN)
معماری پایه
در هر لایه، بردار ویژگی گرهها با استفاده از همسایگان بهروزرسانی میشود. فرمول کلی:
که در آن:
: ویژگی گرهها در لایه
: وزنهای قابل یادگیری
: بایاس
: ماتریس مجاورت
: ماتریس همانی (برای افزودن گره به همسایگان خودش)
: تابع فعالسازی
وظایف یادگیری
سطح گراف:
پیشبینی ویژگی کلی گراف (مثلاً سمّیت مولکول)
سطح گره:
پیشبینی برچسب گرهها (مثلاً نوع نود)
پیشبینی یال:
برای تخمین ارتباط دو گره
4. شبکههای کانولوشن گراف (GCN)
عملیات پایه GCN
جاسازی هر گره بهصورت ترکیبی از همسایگان و خودش بهروزرسانی میشود. روشهای تجمیع:
جمع ساده:
میانگین:
حداکثر:
توجه (Attention):
نرمالسازی GCN (Kipf & Welling)
فرمول نهایی برای یک لایه GCN:
که در آن:
: اضافه کردن یال خودی
: ماتریس درجه
5. مدلهای القایی در برابر انتقالی
مدل القایی (Inductive)
مدل از ساختار آموزش، یک نگاشت عمومی یاد میگیرد:
مناسب برای گرافهای دیدهنشده (مثلاً مولکولهای جدید).
مدل انتقالی (Transductive)
مدل بر روی کل گراف آموزش میبیند و فقط برچسب نودهای ناشناخته را پیشبینی میکند:
مثال: شبکه استناد مقالهها.
6. چالشهای آموزش و بهینهسازی
نمونهگیری در گرافهای بزرگ
نمونهگیری همسایهها:
انتخاب تصادفی یا منظمی از همسایگان برای کاهش حافظه و زمان.پارتیشنبندی گراف:
شکستن گراف به زیرگرافهای کوچکتر برای پردازش دستهای.
منظمسازی (Regularization)
DropEdge:
حذف تصادفی برخی یالها در طول آموزش:اتصالات باقیمانده (Residual Connections):
کمک به یادگیری در شبکههای عمیق:
7. گرافهای یال (Edge Graphs)
تعریف
در گراف یال، هر یال به یک گره تبدیل میشود. اگر دو یال در گراف اصلی گره مشترک داشته باشند، در گراف جدید به هم متصل میشوند.
کاربرد
پیشبینی ویژگی یا وجود یالهای جدید
افزایش بیانپذیری مدل در وظایف ارتباطی
8. جمعبندی
شبکههای عصبی گراف ابزاری قدرتمند برای مدلسازی روابط غیرساده بین دادهها هستند. با طراحی معماریهای مبتنی بر انتشار پیام، تجمیع همسایگان، و بهکارگیری مکانیزمهای توجه، GNNها قادر به یادگیری نمایشهای معنیدار برای گرهها، یالها و کل گراف هستند.
پیشرفت در روشهای نمونهگیری، نرمالسازی، و یادگیری القایی موجب گسترش کاربرد آنها در حوزههایی مانند زیستشناسی، شبکههای اجتماعی و توصیهگرها شده است.