ویژگی ها (Features) در داده کاوی

ش

یکی از اصطلاحات پرکاربرد در فضای داده کاوی ویژگی یا بعد مربوط به داده ها می باشد برای فهم بهتر و ساده تر ویژگی ها در داده کاوی یک جدول ساده از اطلاعات را در نظر بگیرید. مثلاً فرض نمایید که مجموعه ای از دانشجویان را داریم که اطلاعات آنها را در درون یک جدول ذخیره کرده ایم. سطرها یا همان رکوردهای این جدول دانشجویان را تشکیل داده یعنی هر کدام از دانشجویان یک سطر یا رکورد  منحصر به فرد به خود اختصاص داده است. ستون ها یا فیلدها یا ویژگی ها یا همان ابعاد مربوط به داده‌ها نیز مشخصات مربوط به هر کدام از دانشجویان می باشد. مثلاً در رابطه با دانشجویان می توان نام، نام خانوادگی، شماره دانشجویی، جنسیت، سال ورود به دانشگاه، معدل، سال فارغ التحصیلی و نام پدر را به عنوان ویژگی ها یا فیلدها یا همان ستون ها در نظر گرفت. عملیات داده کاوی بر روی همین داده‌های شکل داده شده در قالب رکورد ها و ویژگی ها انجام می‌گیرد. مثلاً می خواهیم بررسی نماییم که بین دانشجویان دختر و پسر از نظر معدل چه تفاوتی وجود دارد؟ یا اینکه فاصله زمانی بین بین سال ورود و سال فارغ التحصیلی در ورودی های مختلف به چه صورت است؟ هر نوع تحلیل یا هر نوع یافته که در رابطه با داده ها در داده کاوی بیان می شود بر پایه همین ویژگی ها بوده و ویژگی ها هستند که شالوده و اساس و مبنایی را برای انجام عملیات داده کاوی و تجزیه و تحلیل های بعدی فراهم می آورند. 

تقسیم بندی ویژگی ها در داده کاوی 

ویژگی های موجودیت های مختلف داده ای را می توان به چند گروه تقسیم بندی نمود:

گروه اول شامل ویژگی های ماهیتی می باشند، یعنی ویژگی هایی که مربوط به خصوصیات موجودیت‌های مورد بررسی می باشند. به عنوان مثال اگر موجودیت مورد بررسی مشتری باشد، ویژگی‌های ماهیتی مشخصات دموگرافیک مشتریان را در بر می‌گیرد، از قبیل: سن، جنسیت، محل تولد، محل زندگی 

گروه دوم ویژگی های رفتاری می باشند که در رابطه با رفتار و عملکرد موجودیت‌های داده ای اطلاعاتی را به ما ارائه می دهند. به عنوان مثال در رابطه با مشتریان ویژگی های رفتاری را می توان به میزان خرید، تاریخ آخرین خرید، میزان رضایت از محصول خریداری شده و نوع محصولات درخواستی را در نظر گرفت.

گروه سوم ویژگی های تعامل  بوده که این دسته از ویژگی ها مربوط به رابطه بین موجودیت با کسب و کار مورد نظر می باشند. به عنوان مثال در رابطه با مشتریان تاریخ آخرین شکایت صورت گرفته، مدت زمان رسیدگی به شکایت و تاریخ بسته شدن شکایت را می توان به عنوان ویژگی های  نمونه از ویژگی های تعاملی در نظر گرفت، چرا که در این حالت این ویژگی ها مرتبط با نوع تعامل بین سازمان و مشتری می باشند و در اثر تعامل بین سازمان و مشتری این ویژگی ها ایجاد شده اند که در اینجا نحوه تعامل مربوط به شکایتی بوده که مشتری ابراز داشته است.

رای دادن به این post

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.