بایگانی‌های داده‌کاوی

کاوش الگوی مبتنی بر محدودیت | فصل 5 (بخش سوم)

مقدمه فرآیند کاوش الگو ممکن است هزاران الگو را از یک مجموعه داده مشخص کشف کند، که بسیاری از آنها ممکن است در نهایت بی‌ارتباط یا بی‌علاقه برای کاربران باشند. اغلب، کاربر درک خوبی از اینکه کدام «جهت» کاوش ممکن است به الگوهای جالب و «شکل» الگوها یا قوانینی که می‌خواهد پیدا کند، منجر شود، […]

کاوش الگوهای فشرده یا تقریبی | فصل 5 (بخش دوم)

مقدمه چالش اصلی در کاوش الگوهای پرتکرار، تعداد زیاد الگوهای کشف شده است. استفاده از یک آستانه حداقلی برای کنترل تعداد الگوهای یافت شده، تأثیر محدودی دارد. مقدار خیلی کم می‌تواند منجر به تولید تعداد زیادی الگوی خروجی شود، در حالی که مقدار خیلی زیاد می‌تواند منجر به کشف فقط الگوهای رایج شود. برای کاهش […]

کاوش الگو: روش‌های پیشرفته | فصل 5 (بخش اول)

مقدمه کاوش الگوهای پرتکرار به دلیل تحقیقات قابل توجه، گسترش‌های متعدد دامنه مسئله و مطالعات کاربردی گسترده، فراتر از اصول اولیه رفته است. در این فصل، روش‌هایی را برای کاوش الگوهای پیشرفته خواهیم آموخت. ابتدا روش‌هایی را برای کاوش انواع مختلف الگوها، از جمله کاوش الگوهای چندسطحی، الگوهای چندبعدی، الگوهای موجود در داده‌های پیوسته، الگوهای […]

کدام الگوها جالب هستند؟ | فصل 4 (بخش سوم)

روش‌های ارزیابی الگو اکثر الگوریتم‌های کاوش قوانین ارتباط از یک چارچوب پشتیبانی-اطمینان استفاده می‌کنند. اگرچه حداقل آستانه‌های پشتیبانی و اطمینان به حذف یا حذف کاوش تعداد زیادی از قوانین غیرجذاب کمک می‌کنند، اما بسیاری از قوانین تولید شده هنوز برای بسیاری از کاربران جالب نیستند. این امر به ویژه هنگام کاوش در آستانه‌های پشتیبانی پایین […]

روش‌های کاوش مجموعه اقلام پرتکرار | فصل 4 (بخش دوم)

مقدمه در این بخش، روش‌هایی برای کاوش ساده‌ترین شکل الگوهای پرتکرار، مانند مواردی که برای تحلیل سبد بازار در بخش ۴.۱.۱ مورد بحث قرار گرفت، خواهید آموخت. ما با ارائه Apriori، الگوریتم پایه برای یافتن مجموعه اقلام پرتکرار در بخش ۴.۲.۱، شروع می‌کنیم. در بخش ۴.۲.۲، به چگونگی تولید قوانین وابستگی قوی از مجموعه اقلام […]

الگوکاوی: مفاهیم و روش‌های پایه | فصل 4 (بخش اول)

مقدمه الگوهای پرتکرار، الگوهایی (مثلاً مجموعه اقلام، زیردنباله‌ها یا زیرساختارها) هستند که به طور پرتکرار در یک مجموعه داده ظاهر می‌شوند. به عنوان مثال، مجموعه‌ای از اقلام، مانند شیر و نان، که به طور پرتکرار در یک مجموعه داده تراکنش با هم ظاهر می‌شوند، یک مجموعه اقلام پرتکرار است. یک زیردنباله، مانند خرید اول یک […]

روش‌های محاسبه مکعب داده | فصل 3 (بخش پنجم)

مقدمه محاسبه مکعب داده یک کار ضروری در پیاده‌سازی انبار داده است. پیش‌محاسبه تمام یا بخشی از یک مکعب داده می‌تواند زمان پاسخ را تا حد زیادی کاهش داده و عملکرد پردازش تحلیلی آنلاین را افزایش دهد. با این حال، چنین محاسباتی چالش برانگیز است زیرا ممکن است به زمان محاسباتی و فضای ذخیره‌سازی قابل […]

محاسبه مکعب داده | فصل 3 (بخش چهارم)

مقدمه انبارهای داده حاوی حجم عظیمی از داده‌ها هستند. سرورهای OLAP نیاز دارند که به پرس‌وجوهای پشتیبانی تصمیم‌گیری در عرض چند ثانیه پاسخ داده شود. مکعب‌های داده هسته انبارهای داده هستند. بنابراین، برای سیستم‌های انبار داده بسیار مهم است که از محاسبات، دسترسی و پردازش پرس‌وجو با کارایی بالا در مکعب داده پشتیبانی کنند. در […]

عملیات OLAP | فصل 3 (بخش سوم)

مقدمه یک انبار داده باید از پرس‌وجوهای تحلیلی چندبعدی آنلاین پشتیبانی کند. در این بخش، مجموعه‌ای از عملیات معمول OLAP در انبارهای داده (بخش ۳.۳.۱) و نحوه فهرست‌بندی داده‌ها برای پشتیبانی از برخی پرس‌وجوهای OLAP (بخش ۳.۳.۲) را خواهید آموخت. یک مشکل مهم این است که چگونه می‌توان داده‌ها را به درستی ذخیره کرد تا […]

مدل‌سازی انبار داده: طرحواره و سنجه‌ها | فصل 3 (بخش دوم)

مقدمه همانطور که در بخش قبل بحث شد، یک انبار داده، داده‌های تاریخی و جاری را به شیوه‌ای موضوع‌گرا و غیرفرار ادغام می‌کند. مدل‌های داده‌ای که در انبارهای داده استفاده می‌شوند، داده‌ها را بر اساس موضوعات سازماندهی می‌کنند. در اینجا، یک موضوع، مانند مشتریان، توسط ابعادی مانند جنسیت، گروه سنی و شغل و سنجه‌هایی مانند […]

دکتر محمدرضا عاطفی