برآوردگر
در آمار، به دنبال ذهنیت و برآوردی از واقعیت مسائل هستیم. از آنجا که واقعیت مسائل مورد توجه در آمار بطور دقیق مشخص نبوده و مجهول هستند، بنابراین به دنبال برآوردگرها که نگاشتی از مشاهدات هستند میرویم تا این تصور و ذهنیت را از مجهول ارائه دهند. برای مثال در رانندگی در مه، دو متر جلوتر مشخص است اما صد متر جلوتر واضح نیست و دید دو متری، برآوردی از صد متر بعدی است که بر اساس آن، مسیر درست تشخیص داده میشود.
برآوردگر، یک مقدار ثابت نیست، بلکه یک متغیر تصادفی است. نمونهگیری یک رفتار مستمر است و با هر بار نمونهگیری، مشاهدات و مقدار برآوردگر میتواند متفاوت باشد. در مثال رانندگی در مه، با هر دو متر پیشروی در مسیر، نظر ما در مورد جهت مسیر میتواند تغییر کند که نشان از تصادفی بودن این برآوردگر دارد. راه ساده دیگری برای تجسم این موضوع به شرح زیر است. فرض کنید نمونهای شامل ۱۰ مشاهده از یک جامعه میگیریم و میانگین نمونه را محاسبه می کنیم و نتیجه نشان بدهد که میانگین نمونه ۵/۱۰ است. حالا این فرآیند را تکرار می کنیم، نمونه ۱۰ تایی دیگری را از همان جامعه میگیریم و این بار مشاهده میکنیم که میانگین نمونه حاصل ۳/۱۰ است. میانگین نمونه به مشاهدات در نمونه بستگی دارد و از نمونه ای به نمونهی دیگر متفاوت است، زیرا آنها متغیرهای تصادفی هستند. در نتیجه، میانگین نمونه یا هر برآوردگر دیگری نیز یک متغیر تصادفی است.
برآوردگر باید بتواند تا حد امکان به مجهول نزدیک باشد تا مناسب ارزیابی شود. در مثال رانندگی در مه، یک مسیر پیچ در پیچ را در نظر بگیرید. آیا دید سمت راست میتواند برآوردگر مناسبی از ادامه مسیر باشد؟
از نگاه ریاضی این مورد این گونه تعبیر میشود:
چرا امید ریاضی؟ همانطور که گفته شد، برآوردگر نیز متغیری تصادفی است و نمیتوان ادعا کرد که یک نمونه به تنهایی برآوردی دقیق از مجهول را ارائه میدهد، اما هرچه تعداد نمونه گیری افزایش یابد، درصورت نااریب بودن، میانگین برآوردگر به پارامتر مجهول نزدیک تر میشود. مقدار تفاوتی که بین امید ریاضی برآوردگر و پارامتر مجهول وجود دارد، میزان اریب بودن آن را نشان میدهد. بنابراین نااریب بودن به این معنی است که برآوردگر نسبت به پارامتر مجهول، انحراف ندارد و همان رفتار پارامتر مجهول را منعکس میکند.
میانگین و واریانس در آمار، دو پارامتر اساسی و مورد نیاز در مطالعه یک پدیده میباشند. در مسائل آماری و شرایط دنیای واقعی، این دو پارامتر اکثرا مجهولاند و در صورت ندانستن آنها باید با تخمین، مطالعه را پیش ببریم. بنابراین برآوردگرهای مناسب و بدون اریب آنها از اهمیت بالایی برخوردارند.
اما تخمین مناسب از میانگین و واریانس مجهول چیست؟ یک کشتی با بار کیسههای برنج را در نظر بگیرید. اگر امکان وزن کردن تمام کیسهها میسر نباشد برای پی بردن به میانگین کیسههای برنج، با یک مساله آماری روبرو هستیم. آیا میتوان با وزن کردن نزدیک ترین کیسه به ذهنیت درستی از میانگین وزن کیسهها دست یافت؟ جواب خیر است. اما انتخاب تصادفی تعداد قابل قبولی از کیسهها و محاسبه میانگین این مقادیر، برآورد خوبی از میانگین خواهد بود.
برآوردگرهای نااریب این دو پارامتر در زیر آمده است که در ادامه مسیر بدست آمدن آنها بررسی و شرح داده خواهد شد.
بررسی برآوردگر میانگین، میانگین نمونه:
مثال: آیا عبارت زیر یک برآورد برای میانگین میباشد؟
جواب: بله این عبارت میتواند یک برآوردگر باشد اما برآوردگر خوبی نیست. زیرا امید ریاضی آن مخالف μ است.