روشهای کاوش مجموعه اقلام پرتکرار | فصل 4 (بخش دوم)
مقدمه در این بخش، روشهایی برای کاوش سادهترین شکل الگوهای پرتکرار، مانند مواردی که برای تحلیل سبد بازار در بخش ۴.۱.۱ مورد بحث قرار گرفت، خواهید آموخت. ما با ارائه Apriori، الگوریتم پایه برای یافتن مجموعه اقلام پرتکرار در بخش ۴.۲.۱، شروع میکنیم. در بخش ۴.۲.۲، به چگونگی تولید قوانین وابستگی قوی از مجموعه اقلام […]
الگوکاوی: مفاهیم و روشهای پایه | فصل 4 (بخش اول)
مقدمه الگوهای پرتکرار، الگوهایی (مثلاً مجموعه اقلام، زیردنبالهها یا زیرساختارها) هستند که به طور پرتکرار در یک مجموعه داده ظاهر میشوند. به عنوان مثال، مجموعهای از اقلام، مانند شیر و نان، که به طور پرتکرار در یک مجموعه داده تراکنش با هم ظاهر میشوند، یک مجموعه اقلام پرتکرار است. یک زیردنباله، مانند خرید اول یک […]
روشهای محاسبه مکعب داده | فصل 3 (بخش پنجم)
مقدمه محاسبه مکعب داده یک کار ضروری در پیادهسازی انبار داده است. پیشمحاسبه تمام یا بخشی از یک مکعب داده میتواند زمان پاسخ را تا حد زیادی کاهش داده و عملکرد پردازش تحلیلی آنلاین را افزایش دهد. با این حال، چنین محاسباتی چالش برانگیز است زیرا ممکن است به زمان محاسباتی و فضای ذخیرهسازی قابل […]
محاسبه مکعب داده | فصل 3 (بخش چهارم)
مقدمه انبارهای داده حاوی حجم عظیمی از دادهها هستند. سرورهای OLAP نیاز دارند که به پرسوجوهای پشتیبانی تصمیمگیری در عرض چند ثانیه پاسخ داده شود. مکعبهای داده هسته انبارهای داده هستند. بنابراین، برای سیستمهای انبار داده بسیار مهم است که از محاسبات، دسترسی و پردازش پرسوجو با کارایی بالا در مکعب داده پشتیبانی کنند. در […]
عملیات OLAP | فصل 3 (بخش سوم)
مقدمه یک انبار داده باید از پرسوجوهای تحلیلی چندبعدی آنلاین پشتیبانی کند. در این بخش، مجموعهای از عملیات معمول OLAP در انبارهای داده (بخش ۳.۳.۱) و نحوه فهرستبندی دادهها برای پشتیبانی از برخی پرسوجوهای OLAP (بخش ۳.۳.۲) را خواهید آموخت. یک مشکل مهم این است که چگونه میتوان دادهها را به درستی ذخیره کرد تا […]
مدلسازی انبار داده: طرحواره و سنجهها | فصل 3 (بخش دوم)
مقدمه همانطور که در بخش قبل بحث شد، یک انبار داده، دادههای تاریخی و جاری را به شیوهای موضوعگرا و غیرفرار ادغام میکند. مدلهای دادهای که در انبارهای داده استفاده میشوند، دادهها را بر اساس موضوعات سازماندهی میکنند. در اینجا، یک موضوع، مانند مشتریان، توسط ابعادی مانند جنسیت، گروه سنی و شغل و سنجههایی مانند […]
انبار داده و پردازش تحلیلی آنلاین | فصل 3 (بخش اول)
مقدمه تجزیه و تحلیل دادهها، که اغلب به عنوان هوش تجاری نیز شناخته میشود، استراتژیها و فناوریهایی است که شرکتها را قادر میسازد تا بینش عمیق و عملی در مورد دادههای تجاری به دست آورند. دادهکاوی نقش اصلی را در تجزیه و تحلیل دادهها و هوش تجاری ایفا میکند. اساساً، انبارهای داده، دادهها را در […]
دادهکاوی
کتاب دادهکاوی – Data Mining در دنیای امروز که حجم دادهها بهسرعت در حال رشد است، تبدیل دادههای خام به دانش ارزشمند ضروری است. دادهکاوی، فرآیند کشف الگوها، مدلها و دانش ارزشمند در مجموعه دادههای بزرگ است و ابزار اصلی این کار محسوب میشود.کتاب «دادهکاوی»، یک منبع جامع و آموزشی در زمینهٔ دادهکاوی است. این […]
کاهش ابعاد | فصل 2 (بخش ششم)
مقدمه کاهش ابعاد فرآیند کاهش تعداد متغیرهای تصادفی یا ویژگیها یا ویژگیهای مورد بررسی است. روشهای کاهش ابعاد شامل تحلیل مؤلفههای اصلی (PCA) (بخش ۲.۶.۱) است که یک روش خطی است که دادههای اصلی را به فضای کوچکتری تبدیل یا تصویر میکند. انتخاب زیرمجموعه ویژگی روشی برای کاهش ابعاد است که در آن ویژگیها یا […]
تبدیل دادهها | فصل 2 (بخش پنجم)
مقدمه در تبدیل دادهها، دادهها به اشکال مناسب برای کاوش تبدیل یا تجمیع میشوند. از طریق تبدیل مناسب دادهها، فرآیند کاوش حاصل ممکن است کارآمدتر باشد و الگوهای یافتشده ممکن است آسانتر قابل درک باشند. استراتژیهای مختلفی برای تبدیل دادهها توسعه داده شده است. در این بخش، با معرفی نرمالسازی دادهها (بخش ۲.۵.۱) شروع میکنیم، […]