کاوش الگوی مبتنی بر محدودیت | فصل 5 (بخش سوم)
مقدمه فرآیند کاوش الگو ممکن است هزاران الگو را از یک مجموعه داده مشخص کشف کند، که بسیاری از آنها ممکن است در نهایت بیارتباط یا بیعلاقه برای کاربران باشند. اغلب، کاربر درک خوبی از اینکه کدام «جهت» کاوش ممکن است به الگوهای جالب و «شکل» الگوها یا قوانینی که میخواهد پیدا کند، منجر شود، […]
کاوش الگوهای فشرده یا تقریبی | فصل 5 (بخش دوم)
مقدمه چالش اصلی در کاوش الگوهای پرتکرار، تعداد زیاد الگوهای کشف شده است. استفاده از یک آستانه حداقلی برای کنترل تعداد الگوهای یافت شده، تأثیر محدودی دارد. مقدار خیلی کم میتواند منجر به تولید تعداد زیادی الگوی خروجی شود، در حالی که مقدار خیلی زیاد میتواند منجر به کشف فقط الگوهای رایج شود. برای کاهش […]
کاوش الگو: روشهای پیشرفته | فصل 5 (بخش اول)
مقدمه کاوش الگوهای پرتکرار به دلیل تحقیقات قابل توجه، گسترشهای متعدد دامنه مسئله و مطالعات کاربردی گسترده، فراتر از اصول اولیه رفته است. در این فصل، روشهایی را برای کاوش الگوهای پیشرفته خواهیم آموخت. ابتدا روشهایی را برای کاوش انواع مختلف الگوها، از جمله کاوش الگوهای چندسطحی، الگوهای چندبعدی، الگوهای موجود در دادههای پیوسته، الگوهای […]
کدام الگوها جالب هستند؟ | فصل 4 (بخش سوم)
روشهای ارزیابی الگو اکثر الگوریتمهای کاوش قوانین ارتباط از یک چارچوب پشتیبانی-اطمینان استفاده میکنند. اگرچه حداقل آستانههای پشتیبانی و اطمینان به حذف یا حذف کاوش تعداد زیادی از قوانین غیرجذاب کمک میکنند، اما بسیاری از قوانین تولید شده هنوز برای بسیاری از کاربران جالب نیستند. این امر به ویژه هنگام کاوش در آستانههای پشتیبانی پایین […]
روشهای کاوش مجموعه اقلام پرتکرار | فصل 4 (بخش دوم)
مقدمه در این بخش، روشهایی برای کاوش سادهترین شکل الگوهای پرتکرار، مانند مواردی که برای تحلیل سبد بازار در بخش ۴.۱.۱ مورد بحث قرار گرفت، خواهید آموخت. ما با ارائه Apriori، الگوریتم پایه برای یافتن مجموعه اقلام پرتکرار در بخش ۴.۲.۱، شروع میکنیم. در بخش ۴.۲.۲، به چگونگی تولید قوانین وابستگی قوی از مجموعه اقلام […]
الگوکاوی: مفاهیم و روشهای پایه | فصل 4 (بخش اول)
مقدمه الگوهای پرتکرار، الگوهایی (مثلاً مجموعه اقلام، زیردنبالهها یا زیرساختارها) هستند که به طور پرتکرار در یک مجموعه داده ظاهر میشوند. به عنوان مثال، مجموعهای از اقلام، مانند شیر و نان، که به طور پرتکرار در یک مجموعه داده تراکنش با هم ظاهر میشوند، یک مجموعه اقلام پرتکرار است. یک زیردنباله، مانند خرید اول یک […]
روشهای محاسبه مکعب داده | فصل 3 (بخش پنجم)
مقدمه محاسبه مکعب داده یک کار ضروری در پیادهسازی انبار داده است. پیشمحاسبه تمام یا بخشی از یک مکعب داده میتواند زمان پاسخ را تا حد زیادی کاهش داده و عملکرد پردازش تحلیلی آنلاین را افزایش دهد. با این حال، چنین محاسباتی چالش برانگیز است زیرا ممکن است به زمان محاسباتی و فضای ذخیرهسازی قابل […]
محاسبه مکعب داده | فصل 3 (بخش چهارم)
مقدمه انبارهای داده حاوی حجم عظیمی از دادهها هستند. سرورهای OLAP نیاز دارند که به پرسوجوهای پشتیبانی تصمیمگیری در عرض چند ثانیه پاسخ داده شود. مکعبهای داده هسته انبارهای داده هستند. بنابراین، برای سیستمهای انبار داده بسیار مهم است که از محاسبات، دسترسی و پردازش پرسوجو با کارایی بالا در مکعب داده پشتیبانی کنند. در […]
عملیات OLAP | فصل 3 (بخش سوم)
مقدمه یک انبار داده باید از پرسوجوهای تحلیلی چندبعدی آنلاین پشتیبانی کند. در این بخش، مجموعهای از عملیات معمول OLAP در انبارهای داده (بخش ۳.۳.۱) و نحوه فهرستبندی دادهها برای پشتیبانی از برخی پرسوجوهای OLAP (بخش ۳.۳.۲) را خواهید آموخت. یک مشکل مهم این است که چگونه میتوان دادهها را به درستی ذخیره کرد تا […]
مدلسازی انبار داده: طرحواره و سنجهها | فصل 3 (بخش دوم)
مقدمه همانطور که در بخش قبل بحث شد، یک انبار داده، دادههای تاریخی و جاری را به شیوهای موضوعگرا و غیرفرار ادغام میکند. مدلهای دادهای که در انبارهای داده استفاده میشوند، دادهها را بر اساس موضوعات سازماندهی میکنند. در اینجا، یک موضوع، مانند مشتریان، توسط ابعادی مانند جنسیت، گروه سنی و شغل و سنجههایی مانند […]