Ályktanir í einum hópi
Tilgátuprófun fer þannig fram að upplýsingar úr úrtaki eru notaðar til að ákvarða hvort ákveðnar staðhæfingar um þýðið—tilgátur—séu réttar. Oftast höfum við áhuga á meðaltalinu og notuð því úrtaksmeðaltalið til þess að ákvarða hvort hugmyndir okkar um þýðismeðaltalið séu réttar. Ályktanir í einum hópi miðast að unnið sé með eitt meðaltal, eitt hlutfall eða einhverja eina slíka úrtakstölu í stað þess að bera saman t.d. tvö meðaltöl eða hlutföll, eitt fyrir hvorn hópinn.
Árið 1991 birtist rannsókn á Wechsler greindarprófinu handa skólabörnum í Sálfræðiritinu. Tilgangur hennar var að athuga hvort frammistaða íslenskra skólabarna væri í samræmi við meðaltal bandarískra skólabarna. Prófið er hannað þannig að bandarískt meðalbarn fær 100 á prófinu; gagnsemi prófsins fyrir íslensk börn fer meðal annars eftir því hvort sama niðurstaða fáist þegar það er lagt fyrir íslensk skólabörn.
Það hafði lengi verið grunur um að prófið mældi of hátt hérlendis. Í því fælist að meðalbarnið á Íslandi fengi hærra en 100 á prófinu, þ.e. að meðalbarnið á Íslandi mældist ekki sem meðalgreint. Engar haldbærar upplýsingar voru til frammistöðu íslenskra barna á prófinu og því var ekki hægt að fullyrða að þau mældust hærra en bandarísk börn. Því var ákveðið að kanna einungis hvort íslensk börn fengju annað meðaltal á prófinu heldur en bandarísk börn.
Þetta er dæmi um tilgátuprófun í einum hópi. Hér er spurt tiltekinnar spurningar: Er meðaltal íslenskra barna á prófinu annað en 100, þ.e. annað en meðaltal bandarískra barna?
Það er mikilvægt að gera sér grein fyrir því að spurningin snýst um þýðið. Rannsóknin snerist um meðalframmistöðu allra íslenskra barna en ekki aðeins hluta þeirra. Það var engin áhugi á meðalframmistöðu barnanna sem tóku þátt í rannsókninni sem slíkri. Rannsóknaniðurstöðurnar voru aðeins áhugaverðar að sem miklu leyti sem þær myndu upplýsa um meðalframmistöðu í þýðinu öllu—meðalframmistöðu allra íslenskra barna.
Til að álykta um meðaltal allra íslenskra barna—þýðismeðaltalið—notum við marktektarpróf. Marktektarprófið gerir okkur kleift að prófa tilgátur. Í dæminu var tilgáta okkar sú að meðaltal íslenskra barna væri hærra en 100. Til að prófa þetta þurfum við setja fram formlegar tilgátur og prófa þær með marktektarprófi.
[Hér kemur einhvern tíma meira efni. ]
[Hér kemur einhvern tíma meira efni. ]
Tölfræðipróf byggist á því að kanna hvort úrtaksmeðaltalið sé í samræmi við núlltilgátuna. Núlltilgátan gefur upp ákveðið viðmiðsgildi, þ.e. þýðismeðaltalið ef núlltilgátan er rétt. Yfirleitt er úrtaksmeðaltalið ólíkt viðmiðsgildinu. Við erum í reynd að athuga hvort það sé sennilegt að fá þetta mikið eða meira frávik frá viðmiðsgildinu ef núlltilgátan er rétt.
Við þurfum því að reikna líkur þess að fá þetta eða ýktara úrtaksmeðaltal ef núlltilgátan er rétt. Til þess að reikna það þurfum við að vita breidd (stærð) úrtakadreifingarinnar og staðsetningu hennar. Viðmiðsgildið gefur okkur staðsetninguna en staðalvilla meðaltala gefur breidd dreifingarinnar. Ef úrtaksmeðaltalið er utarlega í þessari dreifingu, mælt í staðalvillum, er ólíklegt að fá það ef núlltilgátan er rétt og því er það rök gegn sanngildi hennar.
Þegar staðalfrávik þýðisins er þekkt getum við metið stærð úrtakadreifingarinnar. Með hjálp núlltilgátunnar getum við einnig staðsett úrtakadreifinguna. Þetta tvennt gerir okkur kleift að reikna (a) hversu mikið frávik úrtaksmeðaltalið er frá núlltilgátunni og (b) hversu líklegt sé að fá þetta mikið frávik frá núlltilgátunni ef hún er rétt.
Þetta er gert með z-prófi, niðurstöðunni úr því er flett upp í normaltöflu og þannig fást líkurnar á þetta miklu eða meira fráviki frá núlltilgátunni. Ef tilgátan er tvíhliða þarf að tvöfalda þessi líkindi til að fá líkindi þess að fá þetta mikið frávik í aðra hvora áttina.
p | z |
0,900 | 1,282 |
0,950 | 1,644 |
0,975 | 1,960 |
0,990 | 2,326 |
0,995 | 2,576 |
Athugaðu að normaltöfluna (tafla A í Agresti) mætti setja upp öðru vísi. Hún gæti litið svona út
Þá myndi ég fletta upp vendigildinu miðað við ákveðin líkindi. Ef t.d. marktektarstigið væri 0,05 myndi ég fletta upp miðað við líkindin 0,975 og fá út vendigildið 1,96. Ef niðurstaða z-prófsins væri 1,96 eða hærri vissi ég að líkindin á þetta miklu fráviki frá T0 væri 5% eða minni; ef niðurstaðan væri lægri en 1,96 vissi ég að líkindin væru meiri en 5%.
Þegar þýðisstaðalfrávikið er óþekkt er staðan lítillega breytt. Við gefum okkur staðsetningu úrtakadreifingarinnar með núlltilgátunni eins og áður. En nú vitum við ekki nákvæmlega hver breidd úrtakadreifingarinnar er.
Þýðisstaðalfrávikið getum við áætlað á grundvelli úrtaksstaðalfráviksins. Það gerir okkur síðan kleift að áætla staðalvilluna. Við fáum því spátölu fyrir staðalvilluna í stað staðalvillunnar sjálfrar, þ.e. í stað nákvæms tölugildis fáum við áætlað gildi staðalvillunnar (þ.e. það verður óvissa um stærð hennar).
Sem fyrr ræðst breidd úrtakadreifingarinnar af staðalvillunni. Þar sem ákveðin óvissa er um stærð staðalvillunnar, er ákveðin ónákvæmni í mati okkar á breidd úrtakadreifingarinnar.
Eftir sem áður metum við hversu líklegt er að fá jafnmikið eða meira frávik frá núlltilgátunni með því að deila með staðalvillunni upp í frávikið frá núlltilgátunni. Það sem þó hefur breyst er að það er ákveðin óvissa um stærð staðalvillunnar. Við gætum verið að ofmeta hana eða hafa vanmetið hana.
Til að taka tillit til þessarar óvissu þurfum við að gera ráð fyrir stærri frávikum frá núlltilgátunni. Ástæðan fyrir því er sú að við höfum tvenns konar breytileika í dæminu. Annars vegar er óvissa vegna úrtakadreifingarinnar en hins vegar óvissa vegna þess að við spáum fyrir um staðalvilluna. Þessi tvenns konar breytileiki leggst saman. Því er heildarbreytileikinn meiri þegar þýðisstaðalfrávikið er óþekkt heldur en þegar það er þekkt. Við tökum tillit til þess með því að gera ráð fyrir því með því að reikna líkindin fyrir frávikinu frá núlltilgátunni með því að nota t-dreifingu í stað normaldreifingar. Munurinn á dreifingunum tveimur felst í því að t-dreifing er breiðari (með lengri/feitari hala) en normaldreifingin.
df | t0,025 |
1 | 12,71 |
2 | 4,30 |
3 | 3,18 |
4 | 2,78 |
5 | 2,57 |
… | |
10 | 2,23 |
… | |
20 | 2,09 |
… | |
30 | 2,04 |
… | |
∞ | 1,96 |
Niðurstöðu prófsins flettum við því upp í t-töflu í stað normaltöflu. Við notum sem sé töflu B í Agresti í stað töflu A. Þannig tökum við tillit til aukinnar óvissu. Þegar flett er upp í töflu B þarf að taka tillit til þess að óvissan er því meiri sem úrtakið er minna. Því þurfum við að fletta upp samkvæmt frígráðunum, þ.e. N–1.
Yfirleitt eru t-töflur settar upp öðru vísi en normaltöflur. Við þurfum fyrst að ákvarða marktektarstigið og síðan fletta upp vendigildi samkvæmt því. Marktektarstigið ákvarðar hvaða dálk ég nota í töflunni, frígráðurnar ákvarða hvaða línu töflunnar ég nota. Ef ég miða við 0,05 og tvíhliða tilgátu, myndi viðkomandi dálkur líta einhvern veginn svona út.
Hér fletti ég sem sé upp vendigildinu, en ekki nákvæmum líkindum eins og í normaltöflunni. Annar munur er sá að ég fletti ekki upp t-tölunni og finn líkindin heldur ákvarða ég marktektarstigið og frígráðurnar og finn vendigildið samkvæmt því. Þetta er því líkara uppsetningunni á normaltöflunni hér að ofan heldur en töflu A í Agresti.
[Hér kemur einhvern tíma meira efni. ]
[Hér kemur einhvern tíma meira efni. ]
© 2002 Guðmundur B. Arnkelsson