تابع توزیع تجمعی در احتمال

تابع توزیع تجمعی

ویرایش: ابوالفضل ملکی – آرزو رحیم‌زاده

مترجم: ترانه حجت‌پناه

تابع توزیع تجمعی

در بسیاری از اوقات می‌خواهیم به ازای بعضی مقادیر معین x، احتمال این که مقدار مشاهده شده از متغیر تصادفی X، حداکثر x باشد را محاسبه کنیم. برای مثال فرض کنید X تعداد تخت‌های پُر در بخش اورژانس یک بیمارستان در زمان مشخصی از روز باشد که تابع جرم احتمال آن به صورت زیر است:

جدول1

احتمال این که حداکثر دو تخت اشغال شده باشند برابر است با:

P(X ≤ ۲) = p(0) + p(1) + p(2) = 0.75

علاوه بر این، از آنجا که X ≤ ۲.۷ ، اگر و فقط اگر که X ≤ ۲ باشد، در این صورت داریم P(X ≤ ۲.۷) = ۰.۷۵ و مشابه آن P(X ≤۲.۹۹۹) = ۰.۷۵.

چون ۰ کوچک ترین مقدار ممکن برای X است، P(X ≤ -۱.۵) = ۰،  P(X ≤ -۱۰) = ۰ و در واقع برای هر عدد منفی‌ای  P(X ≤ x) = 0. و چون ۴ بزرگترین مقدار ممکن X است P(X ≤ ۴) = ۱ و P(X ≤ ۹.۸) = ۱و به همین ترتیب… . توجه داشته باشید که:

(P(X < 2) = p(0) + P(1) = 0.45 <0.75 = P(X ≤ ۲

چرا که P(X ≤ ۲)، شامل  احتمال رخداد مقدار ۲ برای x هم می‌شود، اما احتمال اول این موضوع را شامل نمی‌شود. به صورت کلی‌تر، هر جا که x خود مقدار ممکنی از X باشد،( P(X < x) < P(X ≤ x. علاوه بر آن (P(X ≤ x یک احتمال قابل محاسبه برای هر مقداری از x است.

تعریف: تابع توزیع تجمعی (CDF) F(x) یک متغیر تصادفی X با تابع جرم احتمال (P(x برای هر مقداری از x به صورت زیر تعریف می‌شود:

فرمول1

 

 

برای هر مقداری از F(X) ،x احتمال این است که مقدار مشاهده شده X، حداکثر x باشد.

مثال۱: فروشگاهی، فلش‌مموری‌هایی با حجم حافظه‌ی ۱ گیگابایت، ۲ گیگابایت، ۴ گیگابایت، ۸ گیگابایت و ۱۶ گیگابایت دارد. جدول زیر توزیع احتمال y، میزان حافظه‌ی یک فلش خریداری شده را نشان می‌دهد.

جدول2

اول باید (F(y را برای هر ۵ مقدار احتمالی Y پیدا کنیم:

F(1) = P(Y ≤ ۱) = P(Y = 1) = p(1) = 0.05

F(2) = P(Y ≤ ۲) = P(Y = 1 یا ۲) = p(1) + p(2) = 0.15

F(4) = P(Y ≤ ۴) = P(Y = 1 یا ۲ یا ۴) = p(1) + p(2) + p(4) = 0.50

F(8) = P(Y ≤ ۸) = p(1) + p(2) + p(4) + p(8) = 0.90

F(16) = P(Y ≤ ۱۶) = ۱

حال برای هر مقدار دیگری از F(y) ،y برابر است با مقدار تابع F در نزدیک‌ترین مقدارممکن Y و همچنین در مقادیرسمت چپ y (مقادیر کوچک‌تر و یا مساوی نزدیک‌ترین مقدار ممکن برای Y). برای مثال:

F(2/7) = P(Y ≤ ۲/۷) = P(Y ≤ ۲) = F(2) = 0.15

F(7/999) = P(Y ≤ ۷/۹۹۹) = P(Y ≤ ۴) = F(4) =0.50

اگر y کوچک تر از ۱ باشد، آنگاه F(y) = 0 (مثلا F(0/58) = 0) و  اگر y حداقل ۱۶ باشد، F(y) = 1 (مثلا F(25) = 1).

تابع توزیع تجمعی این مثال هم به شکل زیر تعریف می‌شود:

فرمول2

شکل زیر نیز نموداری را برای این تابع توزیع تجمعی نشان می‌دهد:

نمودار1

برای X متغیر تصادفی گسسته، نمودار (F(x بر روی هر مقدار احتمالی X، یک پرش خواهد داشت و میان دو مقدار ممکن  X خطی خواهد بود. این‌چنین نموداری را پله‌ای(تابع پله‌ای) می‌خوانیم.

مثال ۲: تابع جرم احتمال متغیر تصادفیِ X = تعداد نوزادان تازه متولد شده تا تولد اولین نوزاد پسر به صورت زیر است:

فرمول3

برای هر عدد صحیح مثبت:

فرمول4

برای احتساب این مجموع، مجموع سری هندسی را به یاد آورید:

فرمول5

اگر از این فرمول با a = 1 – p و k = x – 1 استفاده کنیم، خواهیم داشت:

فرمول6

و از آنجاییکه که تابع F در بازه‌ی بین اعداد صحیح مثبت، تابعی ثابت است:

فرمول7

[x] بزرگترین عدد صحیح کوچک‌تر مساوی x است (مثلا ۲=[۲/۷]). در نتیجه، مشابه مثال متولدین اگر p = 0/51، آنگاه احتمال بررسی حداکثر پنج تولد برای رسیدن به اولین نوزاد پسر ۰.۹۷۱۸ =(۰.۴۹)(۰.۴۹)(۰.۴۹)(۰.۴۹)(۰.۴۹) – F(5) = 1 می‌باشد. در حالیکه: ۱ ≅(F(10

این تابع توزیع تجمعی در شکل زیر نمایش داده شده است:

نمودار2

در تمام مثال‌هایی که تاکنون بررسی کردیم تابع توزیع تجمعی از تابع جرم احتمال نتیجه گرفته می‌شد. می‌توانیم معکوس این فرآیند را برای به دست‌آوردن تابع جرم احتمال با استفاده از تابع توزیع تجمعی به کار بگیریم. (در شرایطی‌که تابع توزیع تجمعی را داشته باشیم.) برای مثال X برابر تعداد کامپیوتر‌های در حال استفاده در یک آزمایشگاه را در نظر بگیرید. مقادیر ممکن برای X ، ۰,۱,۲,۳,۴,۵,۶ هستند و داریم:

P(3) = P(X = 3)

        = [p(0) + p(1) + p(2) + p(3)] – [p(0) + p(1) + p(2)]

        = P(X≤۳ ) – P(X≤۲ )

        = F(3) – F(2)

به بیان کلی‌تر، احتمال اینکه X در یک بازه‌ی مشخص قرار گیرد به راحتی با استفاده از تابع توزیع تجمعی قابل محاسبه است. برای مثال:

P(2≤ X ≤۴) = p(2) + p(3) + p(4)

  [(p(0) + … + p(4)] – [p(0) + p(1)] =

(P(X ≤ ۴) – P(X ≤ ۱ =

 (F(4) – F(1 =

دقت کنید که (P(2 ≤ X ≤ ۴) ≠ F(4) – F(2). زیرا مقدار ۲ در بازه مربوطه قرار دارد. پس نباید احتمال وقوع آن را حذف کرد. اما (P(2 < X ≤ ۴) = F(4) – F(2 چون X = 2 در بازه قرار نمی‌گیرد.

نکته: برای هر دو عدد فرضی a و b به صورتی که a ≤ b

P(a ≤ X ≤ b) = F(b) – F(a)

که در آن”¯a” بزرگترین مقدار ممکن X را نشان می‌دهد که اکیداً کوچکتر از a باشد. به طور خاص، اگر مقادیر ممکن برای متغیر تصادفی،تنها شامل اعداد صحیح باشد و a و b نیز عدد صحیح باشند، آن‌گاه:

P(a ≤ X ≤ b) = P(X = a یا a+1 یا … یا b)

                  =  F(b) – F(a-1)

که با فرض a = b، آنگاه (P(X = a) = F(a) – F(a-1 درست است.

دلیل کم‌کردن (¯F(a در روابط فوق این است که (P(x=a را نیز می‌خواهیم. (F(b)-F(a برابر است با (p(a<x≤b ؛که خود a  را شامل نمی‌شود.

مثال ۳: اگر X تعداد مرخصی‌های کارمند شرکتی بزرگ در طول یک سال باشد که به صورت تصادفی انتخاب شده است، و حداکثر دفعات مجاز برای مرخصی در این شرکت ۱۴ روز در سال باشد. مقادیر احتمالی X عبارتند از . می‌دانیم که F(0) = 0/58، F(1) = 0/72، F(2) = 0/76، F(3) = 0/81، F(4) = 0/88، F(5) = 0/94.

P(2 ≤ X ≤ ۵) = P(X = 2, 3, 4, یا ۵) = F(5) – F(1) =0.22

P(X = 3) = F(3) – F(2) =0.05

رای دادن به این post

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.