داده چیست؟ اطلاعات چیست؟ دانش چیست؟

داده چیست؟

اولین چیزهایی که در هنگام مواجه به کلمه داده به ذهن متبادر می شود، به صورت زیر است:

  • یک مرحله قبل از اطلاعات است
  • مجموعه­ای از حروف و اعداد و چیز­هایی هستند که خام هستند و هیچ پردازشی روشون انجام‌ نشده است.
  • داده بعد از پردازش تبدیل به اطلاعات می شود.
  • در واقع داده ها یک سری اطلاعات خام هستند.

واقعیت این است که مثل هر مفهوم دیگری در جهان علم برای داده (data) نیز تعاریف متفاوتی ارایه شده است. به صورت کلی می توان گفت که داده ها موارد حاصله از مشاهدات، بررسی ها و تحقیقات به عمل آمده هستند. مشاهده و بررسی و تحقیق می تواند از ساده ترین چیزها مثل اندازه گیری میزان درجه حرارت بدن ما تا پیچیده ترین و گسترده ترین پروژه های تحقیقاتی مثل پرتاب یک شاتل به فضا باشد. ماموریت داده ها، ایجاد نمودهای قابل فهم و تحلیل از رخدادها، پدیده­ها و مفاهیم محیط پیرامونی ما می­باشد. برای امکان پذیر کردن فرآیند ذخیره سازی و پردازش داده، دوست داریم که داده ها به صورتی بیان شده و بدست آیند که بتوان آنها را به سرعت ثبت و ضبط کرده و منتقل نمود. این کار در فضای تکنولوژی های اطلاعاتی امروزه از طریق نمایش دودویی (باینری یا همان صفر و یکی) و ذخیره سازی در حافظه کامپیوترها انجام می شود. داده ها معمولا خود را به صورت ویژگی ها و صفات موجودیت های تحت بررسی نشان می دهند، مثل نمره دانش آموزان در درس های ریاضی، علوم و تاریخ که در این حالت موجودیت های ما دانش آموزان بوده که سه ویژگی از آنها یعنی نمره ریاضی، نمره علوم و نمره تاریخ مورد نظر قرار گرفته است. از نظر واژگان شناسی ریشه کلمه داده به عبارت لاتین datum (به معنای اطلاع) برمی گردد. در اصل کلمه data جمع واژه datum بوده هرچند که امروزه در هنگام استفاده عموما وقتی می گوییم data منظورمان حالت مفرد آن بوده و جمع آن را به شکل داده ها بیان می کنیم.

اطلاعات چیست؟

داده دربردارنده مواردی است که مخاطب می تواند آنها را به صورت کامل یا حداقل تقریبی فهم و درک کرده و به وی برای انجام یک فعالیت یا اتخاذ یک تصمیم کمک می کند. این فعالیت می تواند یک اقدام فیزیکی (مثل تنظیم آینه خودرو بر اساس قد راننده)، الکترونیکی (کلیک بر روی یک آیکون) یا ذهنی (بررسی میزان فاصله تا خودروی مقابل در حین رانندگی) باشد. اطلاعات (information)از پردازش داده بدست می آید. مثلا از اندازه گیری و کنار هم قرار دادن دمای بدن بیمار در طی زمان (در اینجا دمای بدن بیمار داده است) متوجه می شویم که روند بیماری در حال شدت گرفتن یا بهبود بوده یا اینکه تغییر خاصی در وضعیت بیمار هنوز اتفاق نیفتاده است.

نمایی از مفهوم تبدیل داده به اطلاعات در شکل زیر نشان داده شده است. این شکل به خوبی نشان می دهد که اطلاعات حاصل از معنی دار کردن و روح بخشیدن به داده ها می باشند. یعنی داده ها مثل یک جسم بی­جانی هستند که به اون جسم بی­جان می آییم روح می­دهیم و در نتیجه براساس این روحی که می­دهیم اطلاعات متولد می­شود و خودش را نشان می دهد.  

1

پس هر وقت که با داده مواجه شدیم باید این سوال کلیدی را از خودمان بپرسیم که چطور می توانیم به این داده ها روح بدهیم و جان و معنای تازه ای به آنها ببخشیم. برای این کار بهتر است که به ترتیب از مهم ترین و جالب ترین چیزها شروع کنیم. مثلا فرض کنید امروز قیمت بیت کوین را چک می کنیم و می بینیم که قیمت ۱۰۰ هزار دلار است. خب یک حالت این است که همین عدد رو گزارش کنیم و بگیم در فلان تاریخ و ساعت و دقیقه و ثانیه قیمت بیت کوین ۱۰۰ هزار دلار بود. یک حالت اینه که بیاییم بر اساس روند قیمتی گذشته کندو کاو و بررسی کنیم و ببینیم وضعیت ۱۰۰ هزار نسبت به اعداد قبلی به چه صورت بوده است. مثلا فرض کنید طی بررسی ها متوجه می شویم که این برای اولین بار است که در تاریخ، قیمت بیت کوین به ۱۰۰ هزار دلار رسیده است. حالا همه سنسورها و شاخک ها فعال می شود و چشم همه برق می زند. پس دیگه ۱۰۰ هزار برای ما صرفا یک عدد نیست بلکه یک معنا و مفهوم مهم (اینکه بالاترین قیمت تاریخی بوده و برای اولین بار است که به این قیمت رسیده) از آن برداشت شد که برای مخاطب جالب و واجد ارزش افزوده است. این مورد رو حتما در اخبار هم باهاش مواجه شدید که این تیپ یافته ها و اطلاعات سریع تبدیل به تیترهای خبری میشن چرا که جذابیت دارند و یک روح و معنا و مفهوم مهم از داده ها و ارقام را برای ما بیان می نمایند. پس در حین مواجهه با داده ها یک حالت فعالانه و اصطلاحا عصاره کشی و به زبان خودمان چلوندن باید در ذهن مان باشد و مدام دنبال این باشیم که چطور می توانیم بیشترین اطلاعات ممکن را از این داده ها برداشت کنیم و سریعا به یکی دو برداشت اکتفا نکنیم. مثلا در رابطه با همین قیمت بیت کوین، علاوه بر مورد گفته شده می توان دهها نوع اطلاعات جدید را بدست آورد مثلا میزان تغییر قیمت نسبت به یک ساعت، یک روز، یک هفته و یک ماه قبل را نیز می توان در بررسی ها وارد کرد.

هدف از بدست آوردن اطلاعات چیست؟

می توان دیدگاه های زیر را در رابطه با هدف از کسب اطلاعات بیان نمود:

  • تصمیم­گیری
  • شناخت بهتر و پیش­بینی آینده و تصمیم­گیری بر اساس اون شناخت
  • استفاده از اطلاعات جهت تصمیم­ گیری بهتر

به عنوان نمونه در رابطه با همین قیمت بیت کوین از اطلاعات کسب شده می خواهیم به تصمیم برسیم. طیف تصمیماتی که سرمایه گذاران و معامله گران می توانند اتخاذ کنند گسترده بوده و برخی از آنها عبارتند از:

  • زمان ورود به بازار
  • زمان مناسب برای فروش
  • قیمت مطلوب برای خرید یا فروش
  • حجم سرمایه­ گذاری
  • میزان خرید یا فروش

حالا سوالی که مطرح می شود آیا در این مثال صرف دانستن اینکه در حال حاضر قیمت این است و تغییرات آن هم به چه صورت بوده است آیا برای اتخاذ تصمیمات فوق و بدست آوردن قیمت و زمان و حجم مناسب برای خرید یا فروش کفایت می کند؟ پاسخ واضح است. این داده ها به هیچ وجه کفایت نمی­کنند برای این تصمیمات. این­ها یک سری داده اولیه هستند و برای تصمیم­گیری به هیچ وجه این داده دید کافی را به ما نمی­دهد آیا وقت مناسبی برای خرید یا فروش است و اینکه قرار است چه اتفاقی رخ دهد؟ پس این موضوع ما را سوق می دهد به سمت اینکه داده بیشتری جمع آوری کنیم. حالا موضوعی که جلب نظر می کند این است که دقیقا چه داده های دیگری برای اتخاذ بهینه تصمیمات مذکور نیاز داریم و چطور می توانیم این داده ها را جمع آوری و تحلیل کنیم؟ این سوال معمولا جز چالشی ترین سوالات مطرح در مباحث داده کاوی و تحلیل داده است.

بر خلاف تصور همگان که فکر می کنند مهم ترین کار تمرکز بر روی انواع و اقسام الگوریتم های رنگارنگ و متنوع است، اما پیش از رسیدن به مرحله مدل سازی و استفاده از تکنیک های کمی، بایستی بسیاری از مقدمات و پیش نیازها را به درستی آماده کرده باشیم. در غیر این صورت نمی توانیم به هدف مطلوب و دستاورد اصلی مورد نظر از تحلیل داده و داده کاوی که همان استخراج اطلاعات مناسب برای تصمیم گیری است، برسیم.  خصوصا در دنیای امروز که ما در یک اقیانوسی از انواع داده ها غوطه­ور هستیم، ضرورت داشتن دیدگاه سیستماتیک بیش از پیش آشکار می گردد. یعنی در فضای فعلی اینقدر داده است که نمی­دانیم کدام را انتخاب کنیم و روی چه بخشی از داده ها متمرکز شویم؟ البته هنوز در موقعیت های متعددی چالش فقدان داده کاوی و یا عدم امکان دسترسی به داده نیز همچنان وجود دارد. اما در خیلی از مواقع نیز قضیه کاملا عکس بوده و چالش این است که حجم داده زیادی در دسترس بوده و ما باید تصمیم بگیریم که کدوم داده مناسب است و می تواند به من در راستای تحلیل مورد نظر و فراهم آوری اطلاعات مورد نیاز برای تصمیم گیری کمک نماید. این موضوع کلیدی در بسیاری از اوقات مغفول مانده و برخی از تحلیل گران (خصوصا در فضای پروژه های آکادمیک) مایلند تا داده ای را به هر صورتی جمع آوری کرده و به سرعت فرآیند تحلیل و داده کاوی را آغاز نمایند. بسیاری از فعالان این حوزه به صورت عمیق به این موضوع نمی پردازند که چه مدل داده ای نیاز است و این دیتا چه کمک­هایی به ذینفعان اصلی و مشتریان تحلیل می­تواند بنماید.

در اینجا مناسب است که یادی کنیم از یک نام مطرح در داده کاوی به نام آقای اسامه فیاد. احتمالا بخشی از خوانندگان این مطلب اسم ایشان را از قبل شنیده اند. ایشان مدیر سابق دپارتمان داده­کاوی یاهو بودند آن هم در زمانی که یاهو در اوج فعالیت و شهرت قرار داشت. ایشون یه جمله خیلی معروفی داره (که البته این جمله مربوط به دو دهه قبل است). وی می گوید زمانی که من صبح به دفتر کارم مراجعه می­کردم و و سیستم رو روشن می­کردم با ده ترابایت داده جدید مواجه می­شدم که در طول بیست و چهار ساعت گذشته تولید شده بود و به حجم اون انبار داده ما اضافه شده بود و ما باید روی این داده تحلیل می­کردیم. این حجم عظیم از داده ها در زمان حاضر هم عدد بزرگی به حساب می آید. ولی در آن زمان، واقعاً عدد وحشتناکی بوده است. در عین عظیم بودن این حجم داده یک ثروت بی انتها را به شرط بهره مندی و استفاده صحیح در اختیار سازمان قرار می دهد. چرا که با تحلیل این داده ها و از درون آن قطعات ارزشمند پازلی که می­تواند به کسب و کار­ها کمک کند استخراج می شود. در تصویر زیر اسکرین ­شات از صغحه ­بیوگرافی اسامه فیاد در ویکی ­پدیا نمایش داده شده است:

2

پس بحث اینکه حجم زیاد داده ها چه ­طور مورد تحلیل قرار گیرند یک بحث دنباله دار و قدیمی است. در همین مثال رمزارز بیت کوین که در این مطلب بیان شد واقعیت این است که قبل از افزایش قیمت و شکل گیری روند صعودی پرقدرت در آن، در داده های اخذ شده نشانه­های صعود و افزایش قیمت نشان داده شده بود. خیلی از افرادی که با تحلیل درست نشانه­ها را به موقع و قبل از افزایش قیمت زیاد، شناسایی کرده بودند اقدام به خرید و سرمایه گذاری بر روی این رمزارز نموده و از روند صعودی منتفع شدند. دقت نمایید که در اینجا هیچ گونه توصیه ای نسبت به خرید، فروش یا نگهداری این رمزارز در شرایط فعلی نداریم و موارد بیان شده در این مطلب در رابطه با بیت کوین صرفا به عنوان یک مثال ملموس از تحلیل داده بیان شده است. پس با جمع آوری داده، استخراج اطلاعات و اتخاذ تصمیمات بر اساس آن می توان ضریب موفقیت را در هر کسب و کاری افزایش داد. گروه زیادی از افراد و سازمان ها صرفا با داده ها مواجه شده و حداکثر نسبت به جمع آوری این داده ها اقدام می نمایند که پرواضح است که این گروه نمی توانند از مزایای پرشمار تحلیل داده و اتخاذ تصمیمات اثربخش و هدفمند مبتنی بر اطلاعات بهره مند شوند. واقعیت این است که بهره گیری از حجم داده عظیم و رو به تزاید در دنیای امروز نیازمند یک نظام فکری و اطلاعاتی منسجم بوده تا در چارچوب این نظام مشخص شود که:

  • چه نوع داده ای نیاز داریم؟
  • چطور می توانیم به این داده روح بدهیم و معنا ببخشیم؟
  • چه­طوری می­توانیم از درون اطلاعات تصمیم سازی کنیم؟
  • چطور می توانیم از این تصمیمات منتفع بشویم؟

دستیابی به این نظام و چارچوب منسجم واجد اهمیت زیادی است و علاوه بر موفقیت در کسب و کار در زندگی شخصی تحلیل گران هم موثر بوده و به آنها یک نگرش و دید هوشمند می دهد. این امر می تواند در شکل گیری موفقیت در مسیر حرفه ای شخصی تحلیل گران (چه از بعد علمی و آکادمیک و چه از بعد مالی و کاری) نقش شایانی ایفا نماید.

دانش چیست؟

زمانیکه اطلاعات تجمیع شده و در یک دامنه و زمینه معنادار قرار گیرند ما را به سمت دانش (knowledge) رهنمون می نماید. به عنوان نمونه در مثال بیان شده در این قسمت از اطلاعات جمع آوری شده در مورد تب و میزان دمای بدن بیماران در طی زمان متوجه شده ایم که مصرف فلان ماده غذایی در روند بهبودی و کاهش تب تاثیر مثبت دارد.

تحلیل داده به چه معناست؟

بعد باید ببینیم تحلیل داده چیست؟ شاید بیان جملات زیر بتواند ما را در راستای فهم و درک بهتر مفهوم تحلیل داده یاری رساند:

  • مجموعه فعالیت ها برای افزایش تحلیل پذیری داده ها
  • تلاش های صورت گرفته برای ارتقای میزان درک و فهم مخاطب از داده ها
  • اقدام به منظور افزایش عمق درک حاصله از داده ها
  • فرآیندی که روی داده­ها انجام می­شود تا آنها را تبدیل به خروجی ارزشمند (که همان اطلاعات است) بنماید.

رای دادن به این post

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *