Măsuri de tendință centrală pentru date grupate

Măsurile de tendință centrală a datelor grupate sunt utilizate în statistici pentru a descrie anumite comportamente ale unui grup de date furnizate, cum ar fi valoarea la care sunt apropiate, care este media datelor colectate, printre altele.

Când se iau o mare cantitate de date, este util să le grupăm pentru a avea o ordine mai bună a acestora și, astfel, să putem calcula anumite măsuri ale tendinței centrale.

Printre măsurile de tendință centrală cele mai utilizate sunt media aritmetică, mediana și modul. Aceste numere spun anumite calități cu privire la datele colectate într-un experiment dat.

Pentru a utiliza aceste măsuri, este necesar să cunoaștem mai întâi cum să grupăm un set de date.

Date grupate

Pentru a grupa mai întâi datele, trebuie să calculați intervalul de date, care este obținut prin scăderea celei mai mari valori minus valoarea cea mai scăzută a datelor.

Apoi alegeți un număr "k", adică numărul de clase în care doriți să grupați datele.

Continuăm să împărțim intervalul dintre "k" pentru a obține amplitudinea claselor care vor fi grupate. Acest număr este C = R / k.

În cele din urmă, începe gruparea, pentru care este aleasă un număr mai mic decât cea mai mică valoare a datelor obținute.

Acest număr va fi limita inferioară a primei clase. La aceasta se adaugă C. Valoarea obținută va fi limita superioară a primei clase.

Apoi, C se adaugă la această valoare și se obține limita superioară a clasei a doua. În acest fel vom continua până când vom obține limita superioară a ultimei clase.

După ce datele sunt grupate, puteți să calculați media, mediana și modul.

Pentru a ilustra modul în care se calculează media aritmetică, mediana și modul, vom proceda cu un exemplu.

exemplu

Prin urmare, atunci când grupați datele, veți obține un tabel ca:

Cele trei măsuri principale de tendință centrală

Acum vom proceda pentru a calcula media aritmetică, mediana și modul. Exemplul anterior va fi folosit pentru a ilustra această procedură.

1 - media aritmetică

Media aritmetică constă în înmulțirea fiecărei frecvențe cu media intervalului. Apoi, toate aceste rezultate sunt adăugate, iar în final este împărțită între datele totale.

Folosind exemplul anterior obținem că media aritmetică este egală cu:

(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5, 11111

Aceasta indică faptul că valoarea medie a datelor din tabel este 5.11111.

2 - Mediu

Pentru a calcula mediana unui set de date, mai întâi toate datele sunt ordonate de la cel mai mic la cel mai mare. Se pot prezenta două cazuri:

- Dacă numărul de date este ciudat, atunci valoarea mediană este data exactă în centru.

- Dacă numărul de date este egal, atunci mediana este media celor două date care rămân în centru.

Când vine vorba de date grupate, calculul medianului se face în felul următor:

- se calculează N / 2, unde N reprezintă datele totale.

- Se caută primul interval în care frecvența acumulată (suma frecvențelor) este mai mare decât N / 2, iar limita inferioară a acestui interval, numită Li, este selectată.

Mediana este dată de următoarea formulă:

Me = Li + (Ls-Li) * (N / 2 - Frecventa acumulata inainte de Li) / Frecventa [Li, Ls)

Ls este limita superioară a domeniului menționat mai sus.

Dacă se utilizează tabelul de date de mai sus, avem N / 2 = 18/2 = 9. Frecvențele acumulate sunt 4, 8, 14 și 18 (câte unul pentru fiecare rând din tabel).

Prin urmare, trebuie selectat al treilea interval, deoarece frecvența acumulată este mai mare decât N / 2 = 9.

Deci Li = 5 și Ls = 7. Aplicând formula descrisă mai sus, trebuie să:

Me = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5, 3333.

3- Modă

Moda este valoarea care are cea mai mare frecvență între toate datele grupate; adică este valoarea care se repetă de cele mai multe ori în setul de date inițial.

Când aveți o cantitate foarte mare de date, pentru calcularea modului de grupare a datelor se folosește următoarea formulă:

(Frecvența Li - Frecventa L (i-1)) / (Frecventa Frecventa Li a L (i-1) i + 1)))

Intervalul [Li, Ls) este intervalul în care se găsește frecvența cea mai mare. Pentru exemplul făcut în acest articol, avem acea modă dată de:

Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.

O altă formulă care este folosită pentru a obține o valoare aproximativă modului este următoarea:

Mo = Li + (Ls-Li) * (frecvența L (i + 1)) / (frecvența L (i-1) + frecvența L (i + 1)).

Cu această formulă, conturile sunt următoarele:

Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.