روش‌های کاوش مجموعه اقلام پرتکرار | فصل 4 (بخش دوم)

مقدمه در این بخش، روش‌هایی برای کاوش ساده‌ترین شکل الگوهای پرتکرار، مانند مواردی که برای تحلیل سبد بازار در بخش ۴.۱.۱ مورد بحث قرار گرفت، خواهید آموخت. ما با ارائه Apriori، الگوریتم پایه برای یافتن مجموعه اقلام پرتکرار در بخش ۴.۲.۱، شروع می‌کنیم. در بخش ۴.۲.۲، به چگونگی تولید قوانین وابستگی قوی از مجموعه اقلام […]

الگوکاوی: مفاهیم و روش‌های پایه | فصل 4 (بخش اول)

مقدمه الگوهای پرتکرار، الگوهایی (مثلاً مجموعه اقلام، زیردنباله‌ها یا زیرساختارها) هستند که به طور پرتکرار در یک مجموعه داده ظاهر می‌شوند. به عنوان مثال، مجموعه‌ای از اقلام، مانند شیر و نان، که به طور پرتکرار در یک مجموعه داده تراکنش با هم ظاهر می‌شوند، یک مجموعه اقلام پرتکرار است. یک زیردنباله، مانند خرید اول یک […]

روش‌های محاسبه مکعب داده | فصل 3 (بخش پنجم)

مقدمه محاسبه مکعب داده یک کار ضروری در پیاده‌سازی انبار داده است. پیش‌محاسبه تمام یا بخشی از یک مکعب داده می‌تواند زمان پاسخ را تا حد زیادی کاهش داده و عملکرد پردازش تحلیلی آنلاین را افزایش دهد. با این حال، چنین محاسباتی چالش برانگیز است زیرا ممکن است به زمان محاسباتی و فضای ذخیره‌سازی قابل […]

محاسبه مکعب داده | فصل 3 (بخش چهارم)

مقدمه انبارهای داده حاوی حجم عظیمی از داده‌ها هستند. سرورهای OLAP نیاز دارند که به پرس‌وجوهای پشتیبانی تصمیم‌گیری در عرض چند ثانیه پاسخ داده شود. مکعب‌های داده هسته انبارهای داده هستند. بنابراین، برای سیستم‌های انبار داده بسیار مهم است که از محاسبات، دسترسی و پردازش پرس‌وجو با کارایی بالا در مکعب داده پشتیبانی کنند. در […]

عملیات OLAP | فصل 3 (بخش سوم)

مقدمه یک انبار داده باید از پرس‌وجوهای تحلیلی چندبعدی آنلاین پشتیبانی کند. در این بخش، مجموعه‌ای از عملیات معمول OLAP در انبارهای داده (بخش ۳.۳.۱) و نحوه فهرست‌بندی داده‌ها برای پشتیبانی از برخی پرس‌وجوهای OLAP (بخش ۳.۳.۲) را خواهید آموخت. یک مشکل مهم این است که چگونه می‌توان داده‌ها را به درستی ذخیره کرد تا […]

مدل‌سازی انبار داده: طرحواره و سنجه‌ها | فصل 3 (بخش دوم)

مقدمه همانطور که در بخش قبل بحث شد، یک انبار داده، داده‌های تاریخی و جاری را به شیوه‌ای موضوع‌گرا و غیرفرار ادغام می‌کند. مدل‌های داده‌ای که در انبارهای داده استفاده می‌شوند، داده‌ها را بر اساس موضوعات سازماندهی می‌کنند. در اینجا، یک موضوع، مانند مشتریان، توسط ابعادی مانند جنسیت، گروه سنی و شغل و سنجه‌هایی مانند […]

انبار داده و پردازش تحلیلی آنلاین | فصل 3 (بخش اول)

مقدمه تجزیه و تحلیل داده‌ها، که اغلب به عنوان هوش تجاری نیز شناخته می‌شود، استراتژی‌ها و فناوری‌هایی است که شرکت‌ها را قادر می‌سازد تا بینش عمیق و عملی در مورد داده‌های تجاری به دست آورند. داده‌کاوی نقش اصلی را در تجزیه و تحلیل داده‌ها و هوش تجاری ایفا می‌کند. اساساً، انبارهای داده، داده‌ها را در […]

داده‌کاوی

کتاب داده‌کاوی – Data Mining در دنیای امروز که حجم داده‌ها به‌سرعت در حال رشد است، تبدیل داده‌های خام به دانش ارزشمند ضروری است. داده‌کاوی، فرآیند کشف الگوها، مدل‌ها و دانش ارزشمند در مجموعه داده‌های بزرگ است و ابزار اصلی این کار محسوب می‌شود.کتاب «داده‌کاوی»، یک منبع جامع و آموزشی در زمینهٔ داده‌کاوی است. این […]

کاهش ابعاد | فصل 2 (بخش ششم)

مقدمه کاهش ابعاد فرآیند کاهش تعداد متغیرهای تصادفی یا ویژگی‌ها یا ویژگی‌های مورد بررسی است. روش‌های کاهش ابعاد شامل تحلیل مؤلفه‌های اصلی (PCA) (بخش ۲.۶.۱) است که یک روش خطی است که داده‌های اصلی را به فضای کوچک‌تری تبدیل یا تصویر می‌کند. انتخاب زیرمجموعه ویژگی روشی برای کاهش ابعاد است که در آن ویژگی‌ها یا […]

تبدیل داده‌ها | فصل 2 (بخش پنجم)

مقدمه در تبدیل داده‌ها، داده‌ها به اشکال مناسب برای کاوش تبدیل یا تجمیع می‌شوند. از طریق تبدیل مناسب داده‌ها، فرآیند کاوش حاصل ممکن است کارآمدتر باشد و الگوهای یافت‌شده ممکن است آسان‌تر قابل درک باشند. استراتژی‌های مختلفی برای تبدیل داده‌ها توسعه داده شده است. در این بخش، با معرفی نرمال‌سازی داده‌ها (بخش ۲.۵.۱) شروع می‌کنیم، […]