مثال داده کاوی (داده کاوی چیست و کاربرد آن در قالب یک مثال کاربردی)

ش

در اینجا می خواهیم با ذکر یک مثال از داده کاوی همه شما خوانندگان را با نحوه پیشبرد یک مطالعه و تحلیل داده کاوی آشنا نماییم. به عنوان مثال واحد نگهداری و تعمیرات یک پالایشگاه را در نظر بگیرید. در طول ماه های اخیر این واحد گزارشات خرابی بیشتری را نسبت به گذشته دریافت نموده است، به نوعی که کم کم مدیر واحد نگهداری و تعمیرات و سایر مدیران پالایشگاه نگران شده و احساس نمودند که یک اتفاق غیر عادی در حال موقع است. چرا که خرابی ها به صورت چشمگیری افزایش یافته و در برخی از ماه ها حتی به دو یا سه برابر مدت مشابه در سال گذشته رسیده است. این موضوع کم کم منجر به بحث های متعدد بین مدیران شد و در نهایت مقرر گردید که جلسه ای با حضور مدیر واحد نگهداری تعمیرات، معاونت عملیات و مدیرعامل پالایشگاه برگزار شود تا موضوع به صورت تفصیلی و کارشناسی مورد بررسی قرار گیرد. پس از برگزاری جلسه مقرر گردید که مدیر واحد نگهداری و تعمیرات با همکاری واحد فناوری و اطلاعات پالایشگاه یک تجزیه و تحلیل جامع از داده های مربوط به خرابی های صورت گرفته انجام دهند و گزارش کارشناسی آن را در جلسه بعدی ارائه نمایند. بلافاصله پس از پایان جلسه مدیر واحد نگهداری و تعمیرات با مدیر فناوری اطلاعات پالایشگاه که اتفاقاً از دوستان نزدیک او نیز بوده است، تماس گرفته و موضوع را مطرح می نماید. در حین مکالمه تلفنی آنها تصمیم میگیرند که هر کدام یک نفر از کارشناسان توانمند واحد خود را  به این موضوع اختصاص دهند و فردا صبح پس از صرف صبحانه کاری در جلسه مشترک بین دو واحد نگهداری و تعمیرات و فناوری اطلاعات به همراه کارشناسان مربوطه حضور یابند. فردا صبح جلسه تشکیل شده و ۴ فرد مذکور یعنی مدیر و کارشناس نگهداری و تعمیرات و همچنین مدیر و کارشناس فناوری اطلاعات در جلسه حاضر شده و به بحث و تبادل نظر مشغول می‌شوند. به دلیل ابعاد نامشخص  موضوع و ابهامات فراوان، جلسه بسیار بیشتر از حد انتظار طول کشیده و تا نزدیک ظهر ادامه پیدا می‌کند. در نهایت و پس از بحث و کلنجار فراوان در جلسه   تصمیم گرفته می‌شود که کارشناس نگهداری و تعمیرات لیست کل خرابی های دو سال گذشته را از درون سیستم بانک اطلاعاتی نگهداری و تعمیرات گرفته و یک گزارش تحلیلی و مقایسه ای از آن آماده نماید. خوشبختانه مدیران نگهداری و تعمیرات و فناوری اطلاعات برخلاف خیلی از مدیران  به کلی‌گویی اکتفا نکرده و دقیقاً مشخص می نمایند که گزارش بایستی شامل چه بخش هایی باشد. اصلی ترین بخشی که برای گزارش مورد نظر می باشد، استخراج آمار انواع خرابی ها به تفکیک نوع خرابی و تجهیز خراب شده می باشد. پس از استخراج این مورد، کارشناس باید آمار تفکیک شده مربوط به به نوع خرابی و خرابی های مربوط به تجهیزات مختلف را با مدت مشابه در سال گذشته مقایسه نماید. به عنوان مثال خرابی های مربوط به دستگاه کمپرسور در شهریور امسال را با خرابی های مربوط به کمپرسورها در شهریور سال گذشته را در یک جدول مقایسه ای در کنار یکدیگر قرار دهد. هدف مدیران این بود که از در کنار هم قرار دادن این موارد مقایسه‌ای بتوانند به مانند کارگاه های جنایی یک گام به حل معما و باز شدن گره مسئله نزدیک تر شوند. چرا که آنها احتمال می دادند که مشکل افزایش خرابی ها برای تمام تجهیزات برای تمام حالت خرابی رخ نداده و فقط بخشی از تجهیزات پالایشگاه درگیر این مشکل شده باشند، اما این موضوع فقط در حد یک حس اولیه بوده و تحلیل قابل دفاعی برای این موضوع نداشتند. حتی در جلسه مدیران ارشد پالایشگاه نیز این موضوع توسط مدیر واحد نگهداری و تعمیرات مطرح شده بود که با واکنش مخالف معاونت عملیات و مدیرعامل پالایشگاه همراه شده بود. به همین علت مدیر نگهداری و تعمیرات تمایل داشته ها  در جلسه بعد آمار تفکیک شده مربوط به این موضوع را ارائه نمود تا بتواند از فرضیه خود دفاع نماید. لازم به ذکر است که برای پیشبرد بهتر موضوع مقرر گردید که جلسات بین واحد نگهداری و تعمیرات و واحد فناوری اطلاعات به صورت مرتب هر هفته دوشنبه صبح ها برگزار شود. در جلسه هفته بعد آمار استخراج شده توسط کارشناس مورد بررسی قرار گرفت و لیست خرابی‌های مختلف تجهیزات به صورت مقایسه‌ای ارائه گردید. پس از بررسی در جلسه، تجهیزات و حالات خرابی که متحمل بیشترین میزان افزایش خرابی شده بودند مشخص گردید و مقرر گردید تا تجزیه و تحلیل داده ها فعلاً بر روی این تجهیزات متمرکز شود لیست تجهیزات مشخص شده   به شرح زیر می باشد:

  • کمپرسور نوع a 
  • توربین های نوع b و c
  • توربو کمپرسور نوع d
  • پمپ های نوع e, f, g

اکنون جلسه خاتمه یافته و یک خروجی ارزشمند برای تجزیه و تحلیل های داده کاوی فراهم شده است. از این مرحله به بعد از کارشناس واحد فناوری و اطلاعات خواسته شد که بر روی این داده ها شروع به تجزیه و تحلیل و پردازش نموده تا بتواند الگوها و حالت مشکوک منجر به افزایش خرابی در تجهیزات مشخص شده را کشف نمایند. جهت پیشبرد بهتر این موضوع مقرر گردید که کارشناس فناوری و اطلاعات با هماهنگی و مشورت کارشناس نگهداری و تعمیرات تحلیل ها را انجام داده و گزارش را به صورت مشترک آماده نمایند. چرا که کارشناس فناوری اطلاعات صرفاً با تکنیک ها الگوریتم ها و روش های داده کاوی و کار با نرم افزارهای مربوطه مانند پایتون و کلمنتاین آشنا بوده اما دیدی نسبت به مسائل فنی نگهداری و تعمیرات و علل و حالات خرابی تجهیزات مختلف ندارد. از سوی دیگر کارشناس نگهداری و تعمیرات یک مهندس مکانیک با سابقه و فارغ التحصیل یکی از دانشگاه های معتبر بوده که ۱۵ سال سابقه کار در نگهداری و تعمیرات پالایشگاه و پتروشیمی های مختلف کشور را دارا می باشد و به خوبی به چم و خم فنی موضوع آگاه است، اما از روش های تجزیه و تحلیل داده و چگونگی کاربرد تکنیک های داده کاوی چیزی سر در نمی آورد. به خوبی می بینید که ضرب المثل یک دست صدا ندارد در اینجا صادق بوده است. این تجربه و تحلیل ها بسیار زمان بر شده و تقریباً کل روز کاری این دو نفر را مشغول می نماید، تا حدی که برای روز دوشنبه جلسه گزارش آنها آماده نشده و از مدیران شان درخواست می نمایند که جلسه دوشنبه این هفته کنسل شده و به هفته آینده موکول شود تا آنها بتوانند گزارش مبسوط و کامل را برای ارائه در جلسه آماده نمایند. برای آماده سازی داده ها چالش ها و مسائل مختلفی رخ می دهد، از جمله اینکه برخی از داده ها وارد سیستم نشده و مستندات مربوط به آنها درون زونکن های واحد نگهداری و تعمیرات می باشد یا اینکه در هنگام ورود داده ها توسط اپراتورها اشتباهات مختلفی صورت گرفته است. همچنین برخی از داده ها نیز موجود نبود مثلا برخی از اوردرهای تعمیراتی فاقد تاریخ یا ساعت بود  که این موضوع کار تحقیق و تحلیل داده ها را با چالش مواجه می کرد. آنها کار تجزیه و تحلیل را با ممارست و پیگیری مثال‌زدنی ادامه می دهند. در حین به کارگیری تکنیک های داده کاوی کارشناس فناوری و اطلاعات شرکت یک  یک روز عصر با موضوع جالبی مواجه  شده و متوجه می‌شود که پمپ های مختلف شرکت از فواصل زمانی معینی به بعد به صورت غیر عادی خرابی های آنها افزایش پیدا کرده است. مثلا بخشی از پمپ ها از اردیبهشت ماه، بخشی از خرداد و بخشی از مرداد مشمول این افزایش شدند. این موضوع برای وی بسیار عجیب به نظر می آید. از این رو با کارشناس نگهداری و تعمیرات تماس گرفته و از  او می خواهد که به دفتر واحد فناوری و اطلاعات مراجعه نماید تا بر روی مانیتور جزئیات مربوط به خروجی ها و یافته های حاصل را با هم بررسی نمایند. پس از بررسی کارشناس نگهداری و تعمیرات از نتایج حاصله اظهار تعجب می‌کند و می‌گوید اگر موضوع مربوط به عملکرد کل پمپ های شرکت می بود بایستی تمامی پمپ ها در یک زمان موضوعات مشمول موضوع افزایش نرخ خرابی شود اما اینکه از مبدا های زمانی مختلف این موضوع شروع شده و تا الان ادامه داشته عجیب بوده و با اطلاعات فعلی قابل فهم نمی باشد. از این رو آنها تصمیم میگیرند که شروع به جمع آوری داده های تکمیلی و جانبی نمایند و ببینند در بازه های زمانی مشخص شده چه تغییرات موثر و اثرگذاری بر روی عملکرد پمپ ها صورت گرفته که منجر به افزایش شدید خرابی‌های آن ها شده است. کارشناس نگهداری و تعمیرات پس از برگشت از واحد فناوری اطلاعات یک راست به اتاق مدیر خود رفته و موضوع را با وی در میان می‌گذارد. مدیر نگهداری و تعمیرات نیز شروع به نگارش نامه درخواست اطلاعات تکمیلی به واحدهای مختلف پالایشگاه می نماید. اما آنها نمی دانستند که ریشه مشکل از کجاست و از کدام واحدها باید چه اطلاعاتی را بخواهند؟ از این رو بیشتر فکر کرده و سناریو ها و حالات مختلف را با هم بررسی می نمایند.  بحث ها و بررسی ها شبیه جلسات طوفان فکری بین مدیر و کارشناس نگهداری و تعمیرات شده  و هر یک از زاویه ای به مسئله نگاه می نمایند. در نهایت پس از همفکری و جمع بندی تعدادی از احتمالات و سناریوهایی که  احتمال بروز بیشتری داشته‌اند، به شرح زیر به دست می آید:

سناریوی اول تغییر پرسنل مسئول پمپ ها: به این موضوع مشکوک می شوند که شاید تکنسین های مسئول پمپ ها در واحدهای بهره برداری و عملیاتی پالایشگاه تغییر کرده و به دلیل آشنا نبودن تکنسین های جدید یا عدم ارائه آموزش‌های مناسب به آنها، در حین کار با پمپ ها مسائل ملاحظات فنی و ایمنی رعایت نشده و این موضوع منجر به افزایش خرابی ها شده است. در نتیجه تصمیم میگیرند که از واحد های بهره بردار لیست پرسنل مرتبط با  پمپ ها را در دو سال گذشته گرفته و از سوی دیگر به سراغ واحد منابع انسانی نیز بروند تا اطلاعات مربوط به پروفایل صلاحیت و دوره های آموزشی گذرانده شده توسط تکنسین های مسئول کار با پمپ ها و همچنین تکنسین ها و اپراتورهای تعمیرات را استخراج نمایند، تا متوجه شوند که آیا مشکل از تکنسین های عملیاتی و یا تکنسین های تعمیراتی پمپ می باشد یا خیر؟ 

سناریوی دوم مربوط به فعالیتهای نگهداری و نت پیشگیرانه می باشد:  آنها این احتمال را می‌دهند که تعویض قطعات و نگهداری مطابق روال ها و روتین های جاری نگهداری و تعمیرات انجام نشده و این موضوع منجر به افزایش شدید در نرخ خرابی ها شده باشد. از این رو تصمیم می گیرد که داده های دقیق مربوط به نت پیشگیرانه و نتایج فعالیت های صورت گرفته را نیز استخراج و بررسی نمایند. خوشبختانه در این مورد نیاز به مکاتبه و نامه‌نگاری و هماهنگی با واحدهای دیگر پالایشگاه نبود و کلیه اطلاعات در داخل خود واحد نگهداری و تعمیرات موجود بود. 

سناریوهای سوم مربوط به قطعات خریداری شده برای پمپ ها بود:  آنها این احتمال را می‌دادند که شاید منشاء ایجاد خرابی ها تغییر در کیفیت قطعات یدکی و ملزومات مصرفی پمپ ها بوده است.  مدیر نگهداری و تعمیرات این احتمال را  دور از ذهن نمی داند. چرا که در جلسات کاری بین مدیران واحدهای مختلف پالایشگاه ها بارها صحبت از این موضوع شده که در راستای کاهش هزینه ها تلاش شود تا در موضوعات مختلف تا جایی که ممکن است، صرفه‌جویی به عمل آید. در نتیجه شاید به دلیل کاهش هزینه تغییر در کیفیت قطعات خریداری شده برای پمپ آن صورت گرفته باشد و قطعات ارزان تر با هزینه کمتر جایگزین شده باشند. 

 بر اساس سه سناریوی فوق، مخاطب نامه درخواست اطلاعات و همکاری به واحدهای دیگر پالایشگاه مشخص شده کارشناس نگهداری و تعمیرات   ۳ نامه مجزا خطاب به واحدهای منابع انسانی، خرید و تدارکات و بهره برداری تنظیم نموده و پس از امضای مدیر نگهداری و تعمیرات به واحدهای مذکور ارسال می‌شود. در این نامه ها علت درخواست اطلاعات به صورت کامل شرح داده شده و دقیقاً موارد درخواستی از هر واحد جهت جلوگیری از سردرگمی و اتلاف زمان مشخص می شود. همچنین در نامه کارشناس نگهداری و تعمیرات  به عنوان فرد مسئول پیگیری و طرف تماس مشخص می شود تا انجام پیگیری ها و پاسخگویی ها به طرز مشخصی پیش برود. پس از ارسال نامه ها برای واحدهای  سه گانه مشخص شده و کش و قوس‌های فراوان، سرانجام با وجود بروز تاخیر های زیاد اطلاعات دریافت شده و در یک قالب یکپارچه  جمع بندی و دسته بندی می گردد. اکنون کارشناس نگهداری و تعمیرات بسیار خوشحال و خرسند شده چراکه  پس از پیگیری های چند هفته‌ای  تلاش های وی به ثمر نشسته و آنها یک گام بزرگ به سمت حل مسئله داده کاوی که چند ماه است ذهن آنها را به خود مشغول کرده است، نزدیک شدند. پس از این فتح‌الفتوح بزرگ کارشناس نگهداری و تعمیرات از طریق اتوماسیون اداری شرکت داده ها را برای کارشناس فناوری اطلاعات ارسال نموده و به وی تاکید می نماید که این داده ها را در اختیار هیچ کس دیگری غیر از مدیر فناوری اطلاعات قرار ندهد و فقط  خود او  به کار تحلیل بر روی آنها مشغول شود. کارشناس فناوری اطلاعات تحلیل و استفاده از انواع الگوریتم های داده کاوی را ادامه داده  تا ببیند آیا می‌تواند متوجه کشف یک الگو و حالتی که منجر به  افزایش خرابیها از زمانهای معین در  پمپهای پالایشگاه گردد یا خیر؟ پس از بررسی های فراوان او اعلام کفایت تجزیه و تحلیل داده ها را می نماید و درخواست می نماید که در اولین دوشنبه پیش رو جلسه مشترک کاری بین نگهداری و تعمیرات و فناوری اطلاعات تشکیل شود. مدیران این دو واحد از اعلام این خبر  خوشحال می شوند، چراکه نسبت به کارشناس فناوری اطلاعات شناخت کافی دارند و حساسیت و دقت او را به خوبی می ستایند در نتیجه اطمینان حاصل می نمایند که که حتماً به نتایج قابل اتکا و قابل دفاعی دست پیدا کرده که در خواست جلسه نموده است. امروز شنبه است و تا روز دوشنبه برای برگزاری جلسه  دو روز فرصت وجود دارد. کارشناسان فناوری اطلاعات و نگهداری و تعمیرات شرکت از این فرصت استفاده کرده و دو نفری کل دو روز را  به آماده سازی گزارشات و پاورپوینت های مربوطه اختصاص می دهند. تعداد پاورپوینت ها برای ارائه کم بوده اما بر روی کیفیت آن ها زمان زیادی را اختصاص می‌دهند تا از نظر ترکیب اشکال، رنگ بندی و قابل فهم بودن تا حد امکان اسلایدهای آماده شده معنی دار بوده و بتوانند  ذهنیات مدیران در سطوح مختلف پالایشگاه را به خوبی حساس و  فعال نمایند. چرا که  می دانند که پس از جلسه روز دوشنبه و ارائه به مدیران  نگهداری و تعمیرات و فناوری اطلاعات،  به احتمال زیاد از همین پاورپوینت ها برای جلسه مدیران ارشد پالایشگاه با حضور مدیرعامل و معاونین نیز استفاده خواهد شد. از این رو دقت نظر ویژه ای را بر روی آماده سازی اسلایدهای  اعمال می نمایند. در روز دوشنبه جلسه برگزار شده و مشخص می شود که اصلی ترین علت بروز خرابی در پمپ ها تغییر تامین کننده مربوط به قطعات یدکی و ملزومات مصرفی  پمپ ها بوده است. تامین کننده جدید با استفاده از قطعات با  سطح کیفیت پایین با هزینه کم مدیران خرید و تدارکات را به انجام خرید تشویق نموده است. اما از سوی دیگر با افزایش خرابی ها بار مالی سنگین تری را به صورت نامحسوس به پالایشگاه  تحمیل نموده است. کشف این موضوع به هیچ وجه به سرعت و بدون چالش انجام نشده چرا که بلافاصله پس از تغییر تامین کننده، تغییر در نرخ خرابی صورت نگرفته و این موضوع با یک فاصله زمانی خود را نشان  داده است.  جلسه به خوبی خاتمه یافته و برق شادی و موفقیت و به نتیجه رسیدن تلاش های چندماه و یافتن پاسخ سوال در چشمان  مدیر نگهداری و تعمیرات آشکار و هویدا شده است. وی در جلسه بعدی شورای معاونین نتایج کار خود را گزارش داده و درخواست می نماید که در  سیاست های مربوط به خریدهای قطعات یدکی و لوازم مصرفی تجهیزات کلیدی و حساس پالایشگاه تجدید نظر به عمل آید که این موضوع  به کمیته خرید و تدارکات پالایشگاه ارجاع شده  تا نسبت به تغییر سیاست ها و ابلاغ آن به واحدهای مربوطه در سریعترین زمان ممکن اقدام نمایند. 

در پایان لازم به ذکر است که ماجرای بیان شده خیالی نبوده و کاملاً برگرفته از تجربیات و مشاهدات واقعی تیم تهیه محتوای سایت نگرش هوشمند و مشاورین صنعتی می باشد. در پایان چند محور برای تفکر شما مخاطبین پیرامون داستان بیان شده مطرح می شود:

  • فعالیت های صورت گرفته به چه صورت بر اساس متدولوژی ها و مراحل داده کاری قابل تبیین می باشند؟
  • نقش های مختلف درگیر در پروژه داده کاوی به چه صورت بوده به هر یک از آنها به چه نحوی  فعالیت نموده اند؟
  •  چالشهای اصلی پیش روی تیم انجام تحلیل داده چه مواردی بوده است؟
  • همچنین لازم به ذکر است که مطالب فوق به شکل بسیار بسیار خلاصه ارائه شده است. چرا که تجربه نشان داده بسیاری از مخاطبین حوصله خواندن متن های طولانی را ندارند. هر چند که تا همین جا هم نسبتاً یک متن طولانی در این صفحه ارائه شده است. بر این اساس برخی از جنبه های مربوط به موضوع به صورت مشروح بیان نشده است که  شما مخاطبین می‌توانید با مرور دوباره متن به مانند یک داستان جنایی گره  های این معما را بیشتر باز نمایید. به عنوان مثال به یکی از این موارد اشاره می شود: در قسمتی از  متن بیان شد که مدت زمان شروع افزایش خرابی ها در پمپ های مختلف متفاوت بوده و بخشی از پمپ ها از اردیبهشت‌ماه، بخش دیگری از خردادماه و گروه آخر از مردادماه مشمول افزایش محسوس نرخ خرابی‌ها شدند. با توجه به موارد بیان شده و استنباط خود شما به نظر شما دلیل این موضوع چه بوده است؟

نظرات و دیدگاه های خود در رابطه با سوالات فوق را میتوانید در قسمت کامنت های پایین صفحه مطرح نمایید تا به مرور بحث و بررسی پیرامون این داستان کاربردی ادامه پیدا کند.

موفق و پیروز باشید.

رای دادن به این post

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *