jueves, 31 de mayo de 2012

mediana (estadistika)

Estatistikan, mediana aldagai bati buruzko datuak txikienetik handienera ordenaturik daudela, erdian dagoen datua da. Beraz, medianak alde banatara datuen %50ak uzten ditu. Probabilitate banakuntza baterako ere kalkula daiteke eta orduan alde banatara eta orduan azpitik eta gainetik 0.5eko probabilitatea uzten duen balioa da. Mediana zentro neurri bat da, batezbesteko aritmetiko sinplea bezala esaterako, eta neurri aproposa datuetan muturreko datuak daudenean .

Kalkulua lagin baterako

Lagin baterako, datu koantitatiboak txikienetik handienera ordenatuta daudela, erdian kokatzen den datua da mediana. Horrela, kalkulua ezberdina da n datu kopurua zenbaki bakoitia edo zenbaki bikoitia den.
Lagin-tamaina edo datu-kopurua bakoitia bada, datuak ordenaturik daudela, mediana erdiko datuak hartzen duen balioa da. Adibidez, datu hauetarako
1 2 2 3 5 6 8
Me=3\,
Datu-kopurua bikoitia bada, datuak ordenaturik daudela, erdiko datu bi dagoenez, mediana erdiko bi datu hauen batezbestekoa dela esan daiteke. Datu hauetarako adibidez,
2 3 4 5 7 7 8 10
Me=\frac{5+7}{2}=6
Ohartarazi behar da mediana zenbatesteko bestelako jardunbideak ere asmatu direla.

Kalkulua tartetan bildutako datuetarako

Datuak tartean bildurik daudenean, mediana hurbilketaz kalkulatzen da, aurretik mediana kokatzen den tartea zehaztuz. Kalkulurako erabiltzen den formula hau da:

Me=L_i+a_i\frac{\frac{n}{2}-N_{i-1}}{n_i}
Adibidez, herri bateko biztanleen adinari buruzko datu hauk harturik,
Biztanleen adinak Biztanleak Maiztasun metatuak
0-20 9 9
20-40 18 27
40-60 26 53
60-80 7 60
80-100 4 64
Maiztasun metatuak kalkulatu ondoren, hirugarren zutabean, datu kopurua 64 dela ikusten da. Beraz, mediana 64/2=32garren datuaren balioa izango da. Maiztasun metatuen zutabeari erreparatuz, 32garren datua 40-60 tartean kokatzen da. Beraz, bertan izango da mediana:
Me=40+20 \times \frac{32-27}{26}=43.84\ urte
Beraz, biztanleen erdiek 43.84 urte baino gutxiago dauzkate. Ohartarazi behar da, ordea, emaitza hau hurbilketa baten ondorioa dela eta emaitza zehatza izateko hobe dela jatorrizko datu zerrenda hartzea.
Medianaren kalkulua datuak tartetan bilduta daudenean, interpolazio linealez egiten da. Mediana kokaturik dagoen tartea 40-60 da. Medianatik behera (marra eten gorriz) 32 datu daude, datuen erdiak alegia. 40 urtetik behera 27 biztanle daude. 60 urtetik behera 53 biztanle daude. Bi puntuak lotuz, OAB eta OCD hirukiak baliokideak dira eta, beraz, katetoen arteko erlazio berdina dute. OAB triangeluan, OB=x eta AB=5. OCD triangeluan OD=20 eta CD=26. Hiruko erregela sinple batez x=3.82 eta beraz, mediana 40+x=43.82 dela ondorioztatzen da.

Mediana probabilitate banakuntzetan

Probabilitate banakuntzetan, bere azpitik %50eko probabilitatea (eta ondorioz, bere gainetik ere %50eko probabilitatea) uzten duen balioa da. Beraz, banakuntza jarraia bada hau betetzen duen Me balioa da mediana:
\operatorname{P}(X\leq Me) \geq \frac{1}{2}\text{ eta }\operatorname{P}(X\geq Me) \geq \frac{1}{2}\,\!

Propietateak

Abantaila gisa, balio osoko aldagaietan, medianaren emaitza ere zenbaki osoa da. Adibidez, familiako haur kopuruaren batezbesteko aritmetiko sinplea 2.37 haur izan daitekeen bitartean, medianak beti balio oso bat emango du (1, 2, 3), interpretazioa erraztuz horrela.
Aldi berean, muturreko datuak daudenean zentro neurri egokiagoa da batezbesteko aritmetiko sinplea baino. Adibidez, { 1, 2, 2, 2, 3, 9 } datuetarako, mediana 2 da, zentroaren balio adierazgarri bat, batezbesteko aritmetiko sinplea zentroaren adierazgarri ez den 3,166… delarik. Muturreko datuek medianaren balioan eragin nabarmenik ez dutela eta, mediana estatistiko jasankorra dela esaten da. Alborapen handiko banakuntzetan ere, batezbestekoa baion neurri egokiagoa da.
Eragozpen gisa, datu guztiak kontuan hartzen ez dituela aipatu behar da. Bere kalkulua formula bidez adierazteko oztopoak izateaz gainera, ez da matematikoki garatzen erraza.
Propietate matematikoei buruz,
  • x_i lagin datuetarako ondoko adierazpena txikien egiten duen m balioa da mediana:
\sum_{i=1}^n|x_i-m|;
  • bi datu-multzo bateratzen badira, baterako mediana aurreko medianen tartean izango da.

No hay comentarios:

Publicar un comentario