انبارداده و دیتامارت چیست؟
بنام حق
درود بر شما
همون طور که شما هم اشاره کردید انبار داده ها یا Data warehouse ها یکی از مهمترین بخش های در هوش کسب و کار هستند و وظیفه نگهداری داده ها را ایفا می کنند.
بنده در این زمینه مطالعاتی رو انجام دادم و چند کیس ایرانی رو مورد مطالعه قرار دادم که در ادامه گزارش تحقیقات خودم رو خدمت شما ارسال می کنم.
تعریف انبار داده از دیدگاه اوراکل:
انبار داده یک پایگاه داده رابطه ای است که برای پرس و جو و تجریه تحلیل طراحی شده است و برای پردازش تراکنش ها مناسب نیست. انبار داده ها معمولا شامل داده های است که از عملیات دیگر نتیجه شده اند و می تواند از منابع دیگر باشد. انبار داده ها فضای مناسبی است تا اطلاعات را نگهداری کرده و آن را در اختیار سیستم های عملیاتی قرار دهد و در نتیجه عملیات روی این داده ها صورت نمی پذیرد.
از دید معماری انبار داده ها چند روش جهت استفاده از انبار داده وجود دارد که به بررسی آن ها می پردازیم.
1. یک منطقه عملیاتی (with a Staging Area):
در این روش تا جایی که بنده متوجه شدم باید قبل از ورود داده ها به انبار داده آن ها را پاک سازی و پردازش نمود. اگر دقت کنید در تصویری که استفاده شده یک بخش به قسمت قبلی اضافه شده و نشان می دهد که داده ها قبل از ورود به داخل انبار داده ها بایستی پاک سازی و پردازش شوند که این کار می تواند از طریق برنامه نویسی انجام شود.
2. یک منطقه عملیاتی و دیتامارت ها (with a Staging Area and Data Marts):
خوب در این روش معماری که یه مرحله از قسمت قبلی دقیق تر به نظر می رسه، ما در واقع داریم خود انبار داده رو به چند دیتا مارت تقسیم بندی می کنیم که طبق تعریف هر کدوم از این دیتا مارت ها داده های مربوط به یه حوزه خاص رو برای ما نگهداری می کنند. در واقع در این شکل کاملا واضح هست که خروجی انبار داده به چند دیتا مارت تقسیم بندی شده و در اختیار کاربر نهایی قرار می گیره برای تجزیه و تحلیل داده ها و با این روش کاربران آنالیز، گزارش و داده کاوی را انجام می دهند.
اما خود دیتامارت ها سه مدل دارند که اطلاعاتی رو هم در مورد اون ها کسب کردم که اینجا براتون ارائه می کنم.
2.1 – دیتامارت های وابسته (Dependent Data Mart):
در این روش داده های عملیاتی شما بر اساس دپارتمان های مختلف در انبار داده ذخیره می شود و خروجی انبار داده دقیقا بر اساس دپارتمان های مختلف تبدیل به دیتامارت ها می شوند.در واقع در این مورد شما داده ها را در انبار داده ذخیره سازی می کنید. شکل زیر به صورت کامل این مسئله را نشان می دهد.
2.2 – دیتامارت های غیر وابسته (Independent Data Marts):
در این حالت انبار داده ای وجود ندارد و داده های عملیاتی پس از بررسی تبدیل به دیتامارت های مختلف می شوند. در شکل زیر به وضوح این مسئله را می بینید.
2-3 دیتامارت های ترکیبی (Hybrid Data Marts):
این دیتامارت ها ترکیبی از دو روش قبلی هستند، در این روش ممکن است مانند روش اول دیتامارت ها از داده های درون انبار داده ساخته شوند و ممکن است دیتامارت ها به صورت غیر وابسته و مستقل از داده های عملیاتی ساخته می شوند. شکل زیر این موضوع را بهتر نمایش می دهد.
3. سیستم تحلیل پردازشی بر خط (Online Analytical Process):
این روش یکی از سریع ترین روش ها جهت پردازش اطلاعات می باشد. در حالت OLAP امکان تحلیل های چند بعدی وجود دارد.
تا اینجا تقریبا اطلاعات جامعی که در مورد انبار داده و انواع معماری های استفاده از آن جهت تحلیل داده ها وجود دارد صحبت کردیم اما به عنوان نمونه (Case Study) هم بنده مطالعه انجام دادم و به موارد زیر برخورد کردم
1. اولین موردی که یافت شد استفاده بانک گردشگری از انبارداده ها جهت سیستم هوش کسب و کار بود
2. در دومین مطالعه در مورد شرکت فرودگاه های کشور بود که در این نمونه در ابتدا یک انبار داده ایجاد شده و سپس برخی از داده ها درون این انبار داده قرار گرفته است.
البته نمونه های دیگه ای هم وجود داره که حس می کنم دیگه خیلی زیاد بشه اگر بخوام توضیح بدم.
با سپاس
یا حق
(1330)
متشکرم