ویرایش: ابوالفضل ملکی – آرزو رحیمزاده
مترجم: ترانه حجتپناه
تابع توزیع تجمعی
در بسیاری از اوقات میخواهیم به ازای بعضی مقادیر معین x، احتمال این که مقدار مشاهده شده از متغیر تصادفی X، حداکثر x باشد را محاسبه کنیم. برای مثال فرض کنید X تعداد تختهای پُر در بخش اورژانس یک بیمارستان در زمان مشخصی از روز باشد که تابع جرم احتمال آن به صورت زیر است:
احتمال این که حداکثر دو تخت اشغال شده باشند برابر است با:
P(X ≤ ۲) = p(0) + p(1) + p(2) = 0.75
علاوه بر این، از آنجا که X ≤ ۲.۷ ، اگر و فقط اگر که X ≤ ۲ باشد، در این صورت داریم P(X ≤ ۲.۷) = ۰.۷۵ و مشابه آن P(X ≤۲.۹۹۹) = ۰.۷۵.
چون ۰ کوچک ترین مقدار ممکن برای X است، P(X ≤ -۱.۵) = ۰، P(X ≤ -۱۰) = ۰ و در واقع برای هر عدد منفیای P(X ≤ x) = 0. و چون ۴ بزرگترین مقدار ممکن X است P(X ≤ ۴) = ۱ و P(X ≤ ۹.۸) = ۱و به همین ترتیب… . توجه داشته باشید که:
(P(X < 2) = p(0) + P(1) = 0.45 <0.75 = P(X ≤ ۲
چرا که P(X ≤ ۲)، شامل احتمال رخداد مقدار ۲ برای x هم میشود، اما احتمال اول این موضوع را شامل نمیشود. به صورت کلیتر، هر جا که x خود مقدار ممکنی از X باشد،( P(X < x) < P(X ≤ x. علاوه بر آن (P(X ≤ x یک احتمال قابل محاسبه برای هر مقداری از x است.
تعریف: تابع توزیع تجمعی (CDF) F(x) یک متغیر تصادفی X با تابع جرم احتمال (P(x برای هر مقداری از x به صورت زیر تعریف میشود:
برای هر مقداری از F(X) ،x احتمال این است که مقدار مشاهده شده X، حداکثر x باشد.
مثال۱: فروشگاهی، فلشمموریهایی با حجم حافظهی ۱ گیگابایت، ۲ گیگابایت، ۴ گیگابایت، ۸ گیگابایت و ۱۶ گیگابایت دارد. جدول زیر توزیع احتمال y، میزان حافظهی یک فلش خریداری شده را نشان میدهد.
اول باید (F(y را برای هر ۵ مقدار احتمالی Y پیدا کنیم:
F(1) = P(Y ≤ ۱) = P(Y = 1) = p(1) = 0.05
F(2) = P(Y ≤ ۲) = P(Y = 1 یا ۲) = p(1) + p(2) = 0.15
F(4) = P(Y ≤ ۴) = P(Y = 1 یا ۲ یا ۴) = p(1) + p(2) + p(4) = 0.50
F(8) = P(Y ≤ ۸) = p(1) + p(2) + p(4) + p(8) = 0.90
F(16) = P(Y ≤ ۱۶) = ۱
حال برای هر مقدار دیگری از F(y) ،y برابر است با مقدار تابع F در نزدیکترین مقدارممکن Y و همچنین در مقادیرسمت چپ y (مقادیر کوچکتر و یا مساوی نزدیکترین مقدار ممکن برای Y). برای مثال:
F(2/7) = P(Y ≤ ۲/۷) = P(Y ≤ ۲) = F(2) = 0.15
F(7/999) = P(Y ≤ ۷/۹۹۹) = P(Y ≤ ۴) = F(4) =0.50
اگر y کوچک تر از ۱ باشد، آنگاه F(y) = 0 (مثلا F(0/58) = 0) و اگر y حداقل ۱۶ باشد، F(y) = 1 (مثلا F(25) = 1).
تابع توزیع تجمعی این مثال هم به شکل زیر تعریف میشود:
شکل زیر نیز نموداری را برای این تابع توزیع تجمعی نشان میدهد:
برای X متغیر تصادفی گسسته، نمودار (F(x بر روی هر مقدار احتمالی X، یک پرش خواهد داشت و میان دو مقدار ممکن X خطی خواهد بود. اینچنین نموداری را پلهای(تابع پلهای) میخوانیم.
مثال ۲: تابع جرم احتمال متغیر تصادفیِ X = تعداد نوزادان تازه متولد شده تا تولد اولین نوزاد پسر به صورت زیر است:
برای هر عدد صحیح مثبت:
برای احتساب این مجموع، مجموع سری هندسی را به یاد آورید:
اگر از این فرمول با a = 1 – p و k = x – 1 استفاده کنیم، خواهیم داشت:
و از آنجاییکه که تابع F در بازهی بین اعداد صحیح مثبت، تابعی ثابت است:
[x] بزرگترین عدد صحیح کوچکتر مساوی x است (مثلا ۲=[۲/۷]). در نتیجه، مشابه مثال متولدین اگر p = 0/51، آنگاه احتمال بررسی حداکثر پنج تولد برای رسیدن به اولین نوزاد پسر ۰.۹۷۱۸ =(۰.۴۹)(۰.۴۹)(۰.۴۹)(۰.۴۹)(۰.۴۹) – F(5) = 1 میباشد. در حالیکه: ۱ ≅(F(10
این تابع توزیع تجمعی در شکل زیر نمایش داده شده است:
در تمام مثالهایی که تاکنون بررسی کردیم تابع توزیع تجمعی از تابع جرم احتمال نتیجه گرفته میشد. میتوانیم معکوس این فرآیند را برای به دستآوردن تابع جرم احتمال با استفاده از تابع توزیع تجمعی به کار بگیریم. (در شرایطیکه تابع توزیع تجمعی را داشته باشیم.) برای مثال X برابر تعداد کامپیوترهای در حال استفاده در یک آزمایشگاه را در نظر بگیرید. مقادیر ممکن برای X ، ۰,۱,۲,۳,۴,۵,۶ هستند و داریم:
P(3) = P(X = 3)
= [p(0) + p(1) + p(2) + p(3)] – [p(0) + p(1) + p(2)]
= P(X≤۳ ) – P(X≤۲ )
= F(3) – F(2)
به بیان کلیتر، احتمال اینکه X در یک بازهی مشخص قرار گیرد به راحتی با استفاده از تابع توزیع تجمعی قابل محاسبه است. برای مثال:
P(2≤ X ≤۴) = p(2) + p(3) + p(4)
[(p(0) + … + p(4)] – [p(0) + p(1)] =
(P(X ≤ ۴) – P(X ≤ ۱ =
(F(4) – F(1 =
دقت کنید که (P(2 ≤ X ≤ ۴) ≠ F(4) – F(2). زیرا مقدار ۲ در بازه مربوطه قرار دارد. پس نباید احتمال وقوع آن را حذف کرد. اما (P(2 < X ≤ ۴) = F(4) – F(2 چون X = 2 در بازه قرار نمیگیرد.
نکته: برای هر دو عدد فرضی a و b به صورتی که a ≤ b
P(a ≤ X ≤ b) = F(b) – F(a–)
که در آن”¯a” بزرگترین مقدار ممکن X را نشان میدهد که اکیداً کوچکتر از a باشد. به طور خاص، اگر مقادیر ممکن برای متغیر تصادفی،تنها شامل اعداد صحیح باشد و a و b نیز عدد صحیح باشند، آنگاه:
P(a ≤ X ≤ b) = P(X = a یا a+1 یا … یا b)
= F(b) – F(a-1)
که با فرض a = b، آنگاه (P(X = a) = F(a) – F(a-1 درست است.
دلیل کمکردن (¯F(a در روابط فوق این است که (P(x=a را نیز میخواهیم. (F(b)-F(a برابر است با (p(a<x≤b ؛که خود a را شامل نمیشود.
مثال ۳: اگر X تعداد مرخصیهای کارمند شرکتی بزرگ در طول یک سال باشد که به صورت تصادفی انتخاب شده است، و حداکثر دفعات مجاز برای مرخصی در این شرکت ۱۴ روز در سال باشد. مقادیر احتمالی X عبارتند از . میدانیم که F(0) = 0/58، F(1) = 0/72، F(2) = 0/76، F(3) = 0/81، F(4) = 0/88، F(5) = 0/94.
P(2 ≤ X ≤ ۵) = P(X = 2, 3, 4, یا ۵) = F(5) – F(1) =0.22
P(X = 3) = F(3) – F(2) =0.05