כיצד לחשב שונות?
כדי לחשב שונות, התחל בחישוב הממוצע או הממוצע של המדגם שלך. לאחר מכן, חיסר את הממוצע מכל נקודת נתונים, וכיכר את ההפרשים. לאחר מכן, הוסף את כל ההבדלים בריבוע. לסיום, חלק את הסכום ב- n מינוס 1, כאשר n שווה למספר הכולל של נקודות הנתונים במדגם שלך. כדי ללמוד כיצד לחשב את השונות של אוכלוסייה, גלול מטה!

כשעובדים עם ערכות נתונים לדוגמה, השתמש בנוסחה הבאה לחישוב השונות: האם השונות היא.
שיטה 1 מתוך 2: חישוב שונות של מדגם
- 1כתוב את קבוצת הנתונים לדוגמה שלך. ברוב המקרים, לסטטיסטיקאים יש רק גישה למדגם, או לקבוצת משנה של האוכלוסייה שהם לומדים. לדוגמא, במקום לנתח את "עלות כל מכונית בגרמניה", יכול סטטיסטיקאי למצוא את העלות של מדגם אקראי של כמה אלפי מכוניות. הוא יכול להשתמש במדגם זה כדי לקבל הערכה טובה של עלויות הרכב הגרמניות, אך סביר להניח שהוא לא יתאים בדיוק למספרים בפועל.
- דוגמא: ניתוח מספר המאפינס הנמכרים בכל יום בקפיטריה, מדגמים שישה ימים באופן אקראי ומקבלים תוצאות אלה: 38, 37, 36, 28, 18, 14, 12, 11, 10,7, 9,9. זהו מדגם, לא אוכלוסייה, מכיוון שאין לך נתונים על כל יום הקפיטריה הייתה פתוחה.
- אם יש לך כל נקודת נתונים באוכלוסייה, דלג למטה לשיטה למטה במקום זאת.
- 2רשמו את נוסחת השונות לדוגמא. השונות של מערך נתונים מספרת לך כמה נקודות הנתונים פרושות. ככל שהשונות קרובה לאפס, כך נקודות הנתונים מקובצות יחד. בעבודה עם ערכות נתונים לדוגמה, השתמש בנוסחה הבאה לחישוב השונות:
- s2 {\ displaystyle s ^ {2}} = ∑ [( xi {\ displaystyle x_ {i}} - x) 2 {\ displaystyle ^ {2}} ] / (n - 1)
- s2 {\ displaystyle s ^ {2}} הוא השונות. השונות נמדדת תמיד ביחידות בריבוע.
- xi {\ displaystyle x_ {i}} מייצג מונח במערכת הנתונים שלך.
- ∑, שפירושו "סכום", אומר לך לחשב את המונחים הבאים עבור כל ערך של xi {\ displaystyle x_ {i}} , ואז להוסיף אותם יחד.
- x הוא הממוצע של המדגם.
- n הוא מספר נקודות הנתונים.
- 3חשב את ממוצע המדגם. הסמל x או "סרגל x" מתייחס לממוצע של מדגם. חשב את זה כמו שאתה מתכוון: הוסף את כל נקודות הנתונים יחד, ואז חלק את מספר נקודות הנתונים.
- דוגמה: ראשית, הוסף את נקודות הנתונים שלך יחד: 17 + 15 + 23 + 7 + 9 + 13 = 84
לאחר מכן, חלק את התשובה שלך במספר נקודות הנתונים, במקרה זה שש: 84 ÷ 6 = 14.
ממוצע לדוגמא = x = 14. - אתה יכול לחשוב על הממוצע כ"נקודת המרכז "של הנתונים. אם הנתונים מקובצים סביב הממוצע, השונות נמוכה. אם הוא פרוש רחוק מהממוצע, השונות גבוהה.
כיצד מחשבים את שונות האוכלוסייה? - דוגמה: ראשית, הוסף את נקודות הנתונים שלך יחד: 17 + 15 + 23 + 7 + 9 + 13 = 84
- 4הפחת את הממוצע מכל נקודת נתונים. עכשיו הגיע הזמן לחשב את xi {\ displaystyle x_ {i}} - x, כאשר xi {\ displaystyle x_ {i}} הוא כל מספר בערכת הנתונים שלך. כל תשובה אומרת לך סטיית המספר מהממוצע, או בשפה פשוטה, עד כמה היא רחוקה מהממוצע.
- דוגמה:
x1 {\ displaystyle x_ {1}} - x = 17 - 14 = 3
x2 {\ displaystyle x_ {2}} - x = 15 - 14 = 1
x3 {\ displaystyle x_ {3}} - x = 23 - 14 = 9
x4 {\ displaystyle x_ {4}}- x = 7 - 14 = -7
x5 {\ displaystyle x_ {5}} - x = 9 - 14 = -5
x6 {\ displaystyle x_ {6}} - x = 13 - 14 = -1 - קל לבדוק את עבודתך מכיוון שהתשובות שלך צריכות להסתכם באפס. זה נובע מהגדרת הממוצע, מכיוון שהתשובות השליליות (מרחק מממוצע למספרים קטנים יותר) מבטלות בדיוק את התשובות החיוביות (מרחק מממוצע למספרים גדולים יותר).
- דוגמה:
- 5ריבוע כל תוצאה. כפי שצוין לעיל, רשימת הסטיות הנוכחית שלך ( xi {\ displaystyle x_ {i}} - x) מסתכמת באפס. פירוש הדבר ש"הסטייה הממוצעת "תמיד תהיה גם אפסית, כך שאינו אומר שום דבר לגבי התפשטות הנתונים. כדי לפתור בעיה זו, מצא את הריבוע של כל סטייה. זה יהפוך את כולם למספרים חיוביים, כך שהערכים השליליים והחיוביים כבר לא מבוטלים לאפס.
- דוגמה:
( x1 {\ displaystyle x_ {1}} - x) 2 = 32 = 9 {\ displaystyle ^ {2} = 3 ^ {2} = 9}
(x2 {\ displaystyle (x_ {2}} - x) 2 = 12 = 1 {\ displaystyle ^ {2} = 1 ^ {2} = 1}
92 = 81
(-7) 2 = 49
(-5) 2 = 25
(-1) 2 = 1 - כעת יש לך את הערך ( xi {\ displaystyle x_ {i}} - x) 2 {\ displaystyle ^ {2}} עבור כל נקודת נתונים במדגם שלך.
- דוגמה:
- 6מצא את סכום הערכים בריבוע. עכשיו הגיע הזמן לחשב את כל המונים של הנוסחה: ∑ [( xi {\ displaystyle x_ {i}} - x) 2 {\ displaystyle ^ {2}} ]. הסיגמה באותיות רישיות, ∑, אומרת לך לסכם את הערך של המונח הבא עבור כל ערך של xi {\ displaystyle x_ {i}} . כבר חישבת ( xi {\ displaystyle x_ {i}} - x) 2 {\ displaystyle ^ {2}} עבור כל ערך של xi {\ displaystyle x_ {i}} במדגם שלך, אז כל מה שאתה צריך לעשות זה להוסיף את התוצאות יחד.
- דוגמה: 9 + 1 + 81 + 49 + 25 + 1 = 166.
- 7חלקו ב- n - 1, כאשר n הוא מספר נקודות הנתונים. מזמן, סטטיסטיקאים פשוט מחולק n בעת החישוב השונה של המדגם. זה נותן לך את הערך הממוצע של הסטייה בריבוע, שהיא התאמה מושלמת לשונות של אותו מדגם. אך זכרו, מדגם הוא רק אומדן של אוכלוסייה גדולה יותר. אם היית לוקח מדגם אקראי אחר ומבצע את אותו חישוב, היית מקבל תוצאה אחרת. כפי שמתברר, חלוקה ב- n - 1 במקום n נותנת לך אומדן שונות יותר של השונות של האוכלוסייה הגדולה יותר, וזה מה שאתה באמת מעוניין בו. תיקון זה כל כך נפוץ, עד שזו כעת ההגדרה המקובלת על השונות של המדגם..
- דוגמה: יש שש נקודות נתונים במדגם, אז n = 6.
שונות של המדגם = s2 = 1666−1 = {\ displaystyle s ^ {2} = {\ frac {166} {6-1}} =} 33,2
- דוגמה: יש שש נקודות נתונים במדגם, אז n = 6.
- 8להבין שונות וסטיית תקן. שים לב, מכיוון שהיה נוסע בנוסחה, השונות נמדדת ביחידה בריבוע של הנתונים המקוריים. זה יכול לעשות את זה קשה להבין באופן אינטואיטיבי. במקום זאת, לעתים קרובות שימושי להשתמש בסטיית התקן. לא בזבזת את המאמץ שלך, מכיוון שסטיית התקן מוגדרת כשורש הריבועי של השונות. זו הסיבה ששונות המדגם נכתבת s2 {\ displaystyle s ^ {2}} , וסטיית התקן של המדגם היא s {\ displaystyle s} .
- לדוגמא, סטיית התקן של המדגם למעלה = s = √33,2 = 5,76.

כיצד אוכל לחשב שונות עבור נתונים מקובצים?
שיטה 2 מתוך 2: חישוב שונות של אוכלוסייה
- 1התחל עם מערך נתוני אוכלוסייה. המונח "אוכלוסייה" מתייחס למכלול התצפיות הרלוונטיות. לדוגמה, אם אתה לומד את גיל תושבי טקסס, האוכלוסייה שלך תכלול את הגיל של כל תושב טקסס. בדרך כלל היית יוצר גיליון אלקטרוני עבור מערך נתונים גדול כזה, אך הנה ערכת נתונים לדוגמא קטנה יותר:
- דוגמא: בחדר האקווריום יש בדיוק שישה מיכלי דגים. ששת הטנקים מכילים את המספרים הבאים של דגים:
x1 = 5 {\ displaystyle x_ {1} = 5}
x2 = 5 {\ displaystyle x_ {2} = 5}
x3 = 8 {\ displaystyle x_ {3} = 8}
x4 = 12 {\ displaystyle x_ {4} = 12}
x5 = 15 {\ displaystyle x_ {5} = 15}
x6 = 18 {\ displaystyle x_ {6} = 18}
- דוגמא: בחדר האקווריום יש בדיוק שישה מיכלי דגים. ששת הטנקים מכילים את המספרים הבאים של דגים:
- 2רשמו את נוסחת שונות האוכלוסייה. מכיוון שאוכלוסייה מכילה את כל הנתונים שאתה צריך, נוסחה זו נותנת לך את השונות המדויקת של האוכלוסייה. על מנת להבדיל אותה משונות המדגם (שהיא הערכה בלבד), הסטטיסטים משתמשים במשתנים שונים:
- σ 2 {\ displaystyle ^ {2}} = (∑ ( xi {\ displaystyle x_ {i}} - μ) 2 {\ displaystyle ^ {2}} ) / n
- σ 2 {\ displaystyle ^ {2}} = שונות האוכלוסייה. זוהי סיגמא באותיות קטנות, בריבוע. השונות נמדדת ביחידות בריבוע.
- xi {\ displaystyle x_ {i}} מייצג מונח במערכת הנתונים שלך.
- המונחים בתוך ∑ יחושבו עבור כל ערך של xi {\ displaystyle x_ {i}} , ואז יסוכמו.
- μ הוא ממוצע האוכלוסייה
- n הוא מספר נקודות הנתונים באוכלוסייה
- 3מצא את ממוצע האוכלוסייה. בעת ניתוח אוכלוסייה, הסמל μ ("מו") מייצג את הממוצע החשבוני. כדי למצוא את הממוצע, הוסף את כל נקודות הנתונים יחד, ואז חלק את מספר נקודות הנתונים.
- אתה יכול לחשוב על הממוצע כ"ממוצע ", אך היזהר מכיוון שלמילה זו יש הגדרות מרובות במתמטיקה.
- דוגמה: ממוצע = μ = 5 + 5 + 8 + 12 + 15 + 186 {\ displaystyle {\ frac {5 + 5 + 8 + 12 + 15 + 18} {6}}} = 10,5
- 4הפחת את הממוצע מכל נקודת נתונים. נקודות נתונים הקרובות לממוצע יביאו להפרש קרוב יותר לאפס. חזור על בעיית החיסור עבור כל נקודת נתונים, ותוכל להתחיל להבין עד כמה הנתונים פרוסים.
- דוגמה:
x1 {\ displaystyle x_ {1}} - μ = 5 - 10,5 = -5,5
x2 {\ displaystyle x_ {2}} - μ = 5 - 10,5 = -5,5
x3 {\ displaystyle x_ {3}} - μ = 8 - 10,5 = -2,5
x4 {\ displaystyle x_ {4}}- μ = 12 - 10,5 = 1,5
x5 {\ displaystyle x_ {5}} - μ = 15 - 10,5 = 4,5
x6 {\ displaystyle x_ {6}} - μ = 18 - 10,5 = 7,5
- דוגמה:
- 5ריבוע כל תשובה. כרגע, חלק מהמספרים שלך מהשלב האחרון יהיו שליליים, וחלקם יהיו חיוביים. אם אתה מצייר את הנתונים שלך בשורת מספרים, שתי קטגוריות אלה מייצגות מספרים משמאל לממוצע ומספרים מימין לממוצע. זה לא טוב לחישוב השונות, מכיוון ששתי קבוצות אלה יבטלו זו את זו. ריבוע כל מספר כך שכולם יהיו חיוביים במקום.
- דוגמה:
( xi {\ displaystyle x_ {i}} - μ) 2 {\ displaystyle ^ {2}} עבור כל ערך i מ -1 עד 6:
(-5,5) 2 {\ displaystyle ^ {2}} = 30,25
(-5,5) 2 {\ displaystyle ^ {2}} = 30,25
(-2,5) 2 {\ displaystyle ^ {2}} = 6,25
(1,5) 2 {\ displaystyle ^ {2}} = 2,25
(4,5) 2 {\ displaystyle ^ {2}} = 20,25
(7,5) 2 {\ displaystyle ^ {2}} = 56,25
על מנת להבדיל אותו משונות מדגם (שהיא הערכה בלבד), הסטטיסטים משתמשים במשתנים שונים: σ = שונות האוכלוסייה. - דוגמה:
- 6מצא את ממוצע התוצאות שלך. כעת יש לך ערך עבור כל נקודת נתונים, הקשור (בעקיפין) עד כמה נקודת הנתונים רחוקה מהממוצע. קח את הממוצע של הערכים האלה על ידי הוספת כולם יחד, ואז חלק עם מספר הערכים.
- דוגמה:
שונות האוכלוסייה = 30,25 + 30,25 + 6,25 + 2,25 + 20,25 + 56,256 = 145,56 = {\ displaystyle {\ frac {30,25 + 30,25 + 6, 25 + 2,25 + 20,25 + 56,25} {6}} = {\ frac {145,5} {6}} =} 24,25
- דוגמה:
- 7קשר את זה בחזרה לנוסחה. אם אינך בטוח כיצד זה תואם לנוסחה בתחילת שיטה זו, נסה לכתוב את הבעיה כולה ביד ארוכה:
- לאחר מציאת ההבדל מהממוצע והריבוע, יש לך את הערך ( x1 {\ displaystyle x_ {1}} - μ) 2 {\ displaystyle ^ {2}} , ( x2 {\ displaystyle x_ {2}} - μ) 2 {\ displaystyle ^ {2}} וכן הלאה עד ( xn {\ displaystyle x_ {n}} - μ) 2 {\ displaystyle ^ {2}} , כאשר xn {\ displaystyle x_ {n}} הוא נקודת נתונים אחרונה בערכה.
- כדי למצוא את הממוצע של הערכים הללו, אתה מסכם אותם ומחלק ב n: (( x1 {\ displaystyle x_ {1}} - μ) 2 {\ displaystyle ^ {2}} + ( x2 {\ displaystyle x_ {2} } - μ) 2 {\ displaystyle ^ {2}} +... + ( xn {\ displaystyle x_ {n}} - μ) 2 {\ displaystyle ^ {2}} ) / n
- לאחר שכתוב המונה בסימנה סיגמא, יש לך (∑ ( xi {\ displaystyle x_ {i}} - μ) 2 {\ displaystyle ^ {2}} ) / n, הנוסחה לשונות.
- מכיוון שקשה לפרש את השונות, ערך זה מחושב בדרך כלל כנקודת התחלה לחישוב סטיית התקן.
- שימוש ב "n-1" במקום "n" במכנה בעת ניתוח דגימות הוא טכניקה הנקראת תיקון של Bessel. המדגם הוא אומדן של כלל האוכלוסייה, וממוצע המדגם מוטה כך שיתאים לאומדן זה. תיקון זה מסיר את ההטיה הזו. זה קשור לעובדה, פעם שרשמת n - 1 נקודה נתונים, בגמר n th נקודה מוגבלת כבר, מאז ערכים מסוימים בלבד יגרמו לממוצע המדגם (X) השתמש בנוסחא השונה.
קרא גם: איך מזהים קיסוס ארסי?
שאלות ותשובות
- אם סטיית התקן היא 4, השונות היא מה?16. הריבוע של 4 הוא 16, והשונות היא הריבוע של סטיית התקן.
- כיצד מחשבים את שונות האוכלוסייה?ראשית מצא ממוצע לאוכלוסייה, ואז חיסור ממוצע מכל תשובת ערך בריבוע מחלק את מספר המשתנים באוכלוסיה.
- אם מקדם השונות הוא 16 והממוצע הוא 25, כיצד אוכל למצוא את השונות?מקדם השונות = (std dev / mean) * 100. 16 = (std dev / 25) * 100. Std dev = 4. Variance = (std dev) ^ 2 = 16.
- כיצד אוכל לחשב את סטיית התקן?סטיית התקן היא השורש הריבועי של השונות.
- מה הפירוש של טווח בין רבעוני?זה ההבדל בין הרביעייה העליונה לרבע התחתון.
- כיצד אוכל לחשב את השונות של טבלת חלוקת תדרים?שיטה 1 לעיל מראה לך מה לעשות. כלומר: 1. חישוב ממוצע הדגימה, 2. גרע את ממוצע הדגימה לכל מספר שקיבלת, 3. ריבוע כל תוצאה, 4. הוסף את כל הערכים, 5. חלק את זה בממוצע לדוגמא מינוס 1.
- מהו מקדם שונות?מקדם השונות הוא היחס בין סטיית התקן לממוצע. CV% = SD / ממוצע * 100.
- כיצד אוכל למצוא את השונות של מספר גדול?אם יש לך הרבה דמויות, הדרך הטובה ביותר למצוא את השונות היא שימוש ב- Excel. לכן, אתה יכול לחפש ישירות אחר סטיית התקן שכן השימוש היחיד בשונות הוא לחשב סטיית תקן מדי.
- כיצד אוכל לחשב את השונות של ארבעה מספרים?בצע את הצעדים הבאים: חישב את הממוצע (הממוצע הפשוט של המספרים.) ואז, עבור כל מספר, חיסר את הממוצע בריבוע התוצאה (ההפרש בריבוע). לבסוף, חישבו על ממוצע ההבדלים בריבוע.
- כיצד אוכל לשפר את כישורי המתמטיקה?נסה את השיטות בשיפור מיומנויות המתמטיקה.
שאלות ללא מענה
- מה הדרך הקלה ביותר ללמוד סטטיסטיקה בסיסית?
- כיצד אוכל למצוא שונות בין השהות האחרונות לשנה האחרונה לתאריך השהייה הנוכחי?
- כיצד אוכל לחשב שונות עבור נתונים מקובצים?
תגובות (30)
- שלטתי כיצד להתמודד עם שונות, סטיית תקן ושונות אוכלוסין. תודה.
- זה עזר לי להשלים את שיעורי הבית של AP Statistics. תודה על מאמר כה כתוב, תמציתי ומועיל כל כך!
- דרך שיטתית ומושכת מאוד להדריך מתחילים.
- זה היה מאוד שימושי, שכן החישוב הסביר שלב אחר שלב.
- עוזר מאוד בהבנת ובחישוב בעיות שיעורי בית.
- הפרטים שלב אחר שלב כיצד לחשב את סכום הסטיות בריבוע הוא מה שמצאתי מועיל ביותר, אך הכל היה מועיל באופן כללי.
- זה מוסבר יפה.
- זה עזר לי להבין מדוע הבדל כזה התרחש בחישוב שונות האוכלוסייה ואחרות לפי מדגם.
- הערכתי את שיעור ההסבר / היסטוריה מאחורי n-1. זה עוזר לי לזכור ולהבין את זה.
- מאמר זה הוא הסבר טוב מאוד. מאוד עוזר לי להבין בקלות על חישוב שונות וסטיית תקן.
- לא היה לי מושג כיצד לחשב את השונות. המאמר הזה ממש עזר לי.
- אני אוהב מתמטיקה כי אני כל כך אוהב מתמטיקה שאעשה אלגברה!
- זה היה מדהים! טוב מאוד והסבר מפורט על כל התהליכים. איוב נהדר ומוערך.
- מאמרים אלה סייעו לי להחזיר ליכולות החשיבה שלי נטיות מרכזיות.
- זה מאוד עוזר לי מכיוון שהשיטה מאוד פשוטה, קלה, שלב אחר שלב. כל אדם יכול להבין בקלות את הנוסחה ואת יישומה.
- התהליך שלב אחר שלב ופירוק הנוסחה והבעיות במילים פשוטות עזרו.
- מתרשם מהצעדים שניתנו. הם ישר לעניין.
- המצגת הייתה מאוד מקצועית, נקייה וקלה לביצוע.
- מאמר זה מועיל מאוד! התיאור צעד אחר צעד והתמונות עזרו לי להבין את הנושא לעומק! תודה רבה לך על זה!
- זה באמת עזר מאוד! זה הסביר את השונות יפה. אני לגמרי מבין את זה עכשיו!
- הייתי באמצע הכנת שיעורי הבית שלי כשצץ ספק. המדריך היה יותר מועיל. אגודל למעלה!
- הסברים כתובים היטב לחישוב ה- SD והשונות. תודה.
- לא לקחתי נתונים סטטיסטיים מזה 30 שנה, ולכן הפירוט הזה של משוואת השונות היה כל כך מועיל. זה הגיוני שבור, עכשיו אני צריך ליישם את זה לבעיה שלי.
- ששת השלבים הברורים בחישוב השונות עזרו, גרמו לי להבין בבירור כיצד לחשב שונות.
- הסבר טוב. תמיד התבלבלתי עם סטיית מדגם וסטיית אוכלוסין.
- כרגע אני פותר בעיית גידור לא מושלמת בין אשכולית למיץ תפוזים, שם אני צריך לחשב את השונות כדי לברר בכמה חוזים יש להשתמש. מאמר זה עזר לי להבין שלב אחר שלב כיצד לעשות זאת.
- מצאתי שזה באמת מועיל בטכניקות אומדן עתודות עפרות. תודה.
- מלמד את עצמי סטטיסטיקה דרך שיעור מקוון, אתה עוזר (מבהיר) כל כך הרבה יותר מהספר. תודה!
- למדתי כיצד למצוא שונות וסטיית תקן בשיטה פשוטה יותר.
- היו לי בעיות במציאת סטיית תקן, תודה רבה.