انبار داده و پردازش تحلیلی آنلاین | فصل 3 (بخش اول)

مقدمه تجزیه و تحلیل داده‌ها، که اغلب به عنوان هوش تجاری نیز شناخته می‌شود، استراتژی‌ها و فناوری‌هایی است که شرکت‌ها را قادر می‌سازد تا بینش عمیق و عملی در مورد داده‌های تجاری به دست آورند. داده‌کاوی نقش اصلی را در تجزیه و تحلیل داده‌ها و هوش تجاری ایفا می‌کند. اساساً، انبارهای داده، داده‌ها را در […]

داده‌کاوی

کتاب داده‌کاوی – Data Mining در دنیای امروز که حجم داده‌ها به‌سرعت در حال رشد است، تبدیل داده‌های خام به دانش ارزشمند ضروری است. داده‌کاوی، فرآیند کشف الگوها، مدل‌ها و دانش ارزشمند در مجموعه داده‌های بزرگ است و ابزار اصلی این کار محسوب می‌شود.کتاب «داده‌کاوی»، یک منبع جامع و آموزشی در زمینهٔ داده‌کاوی است. این […]

کاهش ابعاد | فصل 2 (بخش ششم)

مقدمه کاهش ابعاد فرآیند کاهش تعداد متغیرهای تصادفی یا ویژگی‌ها یا ویژگی‌های مورد بررسی است. روش‌های کاهش ابعاد شامل تحلیل مؤلفه‌های اصلی (PCA) (بخش ۲.۶.۱) است که یک روش خطی است که داده‌های اصلی را به فضای کوچک‌تری تبدیل یا تصویر می‌کند. انتخاب زیرمجموعه ویژگی روشی برای کاهش ابعاد است که در آن ویژگی‌ها یا […]

تبدیل داده‌ها | فصل 2 (بخش پنجم)

مقدمه در تبدیل داده‌ها، داده‌ها به اشکال مناسب برای کاوش تبدیل یا تجمیع می‌شوند. از طریق تبدیل مناسب داده‌ها، فرآیند کاوش حاصل ممکن است کارآمدتر باشد و الگوهای یافت‌شده ممکن است آسان‌تر قابل درک باشند. استراتژی‌های مختلفی برای تبدیل داده‌ها توسعه داده شده است. در این بخش، با معرفی نرمال‌سازی داده‌ها (بخش ۲.۵.۱) شروع می‌کنیم، […]

کیفیت، پاکسازی و یکپارچه‌سازی داده‌ها | فصل 2 (بخش چهارم)

مقدمه در این بخش، با بحث در مورد معیارهای کیفیت داده‌ها (بخش ۲.۴.۱) شروع می‌کنیم. سپس، تکنیک‌های رایج برای پاکسازی داده‌ها (بخش ۲.۴.۲) و یکپارچه‌سازی داده‌ها (بخش ۲.۴.۳) را معرفی می‌کنیم. معیارهای کیفیت داده‌ها داده‌ها در صورتی کیفیت دارند که الزامات کاربرد مورد نظر را برآورده کنند. عوامل زیادی شامل کیفیت داده‌ها می‌شوند، از جمله […]

معیارهای شباهت و فاصله | فصل 2 (بخش سوم)

مقدمه در کاربردهای داده‌کاوی، مانند خوشه‌بندی، تحلیل داده‌های پرت و طبقه‌بندی نزدیکترین همسایه، به روش‌هایی برای ارزیابی میزان شباهت یا عدم شباهت اشیاء در مقایسه با یکدیگر نیاز داریم. به عنوان مثال، یک فروشگاه ممکن است بخواهد خوشه‌هایی از اشیاء مشتری را جستجو کند که منجر به گروه‌هایی از مشتریان با ویژگی‌های مشابه (مثلاً درآمد، […]

آمار داده‌ها | فصل 2 (بخش دوم)

مقدمه برای موفقیت‌آمیز بودن پیش‌پردازش داده‌ها، داشتن یک تصویر کلی از داده‌هایتان ضروری است. توصیفات آماری پایه می‌توانند برای شناسایی ویژگی‌های داده‌ها و برجسته کردن اینکه کدام مقادیر داده باید به عنوان نویز یا داده‌های پرت در نظر گرفته شوند، استفاده شوند. این بخش سه حوزه از توصیفات آماری پایه را مورد بحث قرار می‌دهد. […]

داده‌ها، اندازه‌گیری‌ها و پیش‌پردازش داده‌ها | فصل 2 (بخش اول)

مقدمه برای انجام داده‌کاوی موفق، اولین نکته مهم آشنایی با داده‌هایتان است. شاید بخواهید موارد زیر را بدانید: انواع ویژگی‌ها یا فیلدهایی که داده‌های شما را تشکیل می‌دهند چیست؟ هر ویژگی چه نوع مقادیری دارد؟ توزیع مقادیر چگونه است؟ چگونه می‌توانیم شباهت برخی از اشیاء داده را نسبت به سایرین اندازه‌گیری کنیم؟ کسب چنین بینشی […]

داده‌کاوی: تلاقی رشته‌های مختلف | فصل 1 (بخش سوم)

مقدمه به عنوان رشته‌ای که روش‌های کارآمد و مؤثر برای کشف الگوها و دانش از انواع مختلف مجموعه داده‌های عظیم برای بسیاری از کاربردها را مطالعه می‌کند، داده‌کاوی به طور طبیعی تلاقی رشته‌های مختلف از جمله یادگیری ماشین، آمار، تشخیص الگو، پردازش زبان طبیعی، فناوری پایگاه داده، تجسم و تعامل انسان و کامپیوتر (HCI)، الگوریتم‌ها، […]

وظایف داده‌کاوی | فصل 1 (بخش دوم)

استخراج انواع مختلف دانش انواع مختلفی از الگوها و دانش را می‌توان از طریق داده‌کاوی کشف کرد. به طور کلی، وظایف داده‌کاوی را می‌توان در دو دسته قرار داد: داده‌کاوی توصیفی و داده‌کاوی پیش‌بینی‌کننده. داده‌کاوی توصیفی ویژگی‌های مجموعه داده‌های مورد نظر را مشخص می‌کند، در حالی که داده‌کاوی پیش‌بینی‌کننده، استقراء را روی مجموعه داده‌ها انجام […]