Vigezo na mbinu za kujaribu nadharia tete za takwimu, mifano

Orodha ya maudhui:

Vigezo na mbinu za kujaribu nadharia tete za takwimu, mifano
Vigezo na mbinu za kujaribu nadharia tete za takwimu, mifano
Anonim

Jaribio la dhahania ni utaratibu muhimu katika takwimu. Jaribio la dhahania hutathmini taarifa mbili za kipekee ili kubaini ni taarifa ipi inaungwa mkono vyema na sampuli ya data. Ugunduzi unaposemekana kuwa muhimu kitakwimu, ni kutokana na jaribio la dhahania.

Njia za uthibitishaji

Mbinu za kupima dhahania za takwimu ni mbinu za uchanganuzi wa takwimu. Kwa kawaida, seti mbili za takwimu hulinganishwa, au seti ya sampuli ya data inalinganishwa na seti ya data sanisi kutoka kwa muundo bora. Data lazima itafsiriwe kwa namna ya kuongeza maana mpya. Unaweza kuzitafsiri kwa kuchukulia muundo fulani wa matokeo ya mwisho na kutumia mbinu za takwimu kuthibitisha au kukataa dhana. Dhana inaitwa dhana, na majaribio ya takwimu yanayotumiwa kwa madhumuni haya yanaitwa nadharia tete za takwimu.

H0 na H1 dhana

Kuna mambo mawili kuudhana ya upimaji wa takwimu wa dhana - kinachojulikana "kuu, au hypothesis null" na "hypothesis mbadala". Pia huitwa nadharia za Neyman-Pearson. Dhana ya jaribio la takwimu inaitwa dhana potofu, dhana kuu, au H0 kwa ufupi. Mara nyingi hujulikana kama dhana chaguo-msingi au dhana kwamba hakuna kilichobadilika. Ukiukaji wa kukisia mtihani mara nyingi hujulikana kama dhana ya kwanza, dhana mbadala, au H1. H1 ni mkato wa dhana nyingine, kwa sababu tunachojua kuihusu ni kwamba data ya H0 inaweza kutupwa.

mtihani wa nadharia tupu
mtihani wa nadharia tupu

Kabla ya kukataa au kutokataa dhana potofu, matokeo ya jaribio lazima yatafsiriwe. Ulinganisho unachukuliwa kuwa muhimu kitakwimu ikiwa uhusiano kati ya hifadhidata hauwezekani kuwa utekelezaji wa dhana potofu kulingana na uwezekano wa kizingiti - kiwango cha umuhimu. Pia kuna vigezo vya ubora wa majaribio ya nadharia tete ya takwimu. Hili ni jina la kigezo cha jaribio la dhahania, ambalo linahusishwa na sheria inayodhaniwa ya usambazaji usiojulikana. Hiki ni kipimo cha nambari cha tofauti kati ya mgawanyo wa kimajaribio na wa kinadharia.

Utaratibu na vigezo vya kupima nadharia tete za takwimu

Njia zinazojulikana zaidi za uteuzi wa nadharia tete zinatokana na kigezo cha maelezo cha Akaike au mgawo wa Bayesian. Upimaji wa nadharia ya takwimu ni mbinu muhimu katika uelekezaji na uelekezaji wa Bayesian, ingawa aina hizo mbili zina tofauti kubwa. Vipimo vya Dhana ya Kitakwimufafanua utaratibu unaodhibiti uwezekano wa kuamua kimakosa juu ya msingi usio sahihi au dhana potofu. Utaratibu unategemea jinsi uwezekano wa kufanya kazi. Uwezekano huu wa kufanya uamuzi mbaya ni uwezekano kwamba nadharia tupu ni kweli na kwamba hakuna nadharia mbadala maalum. Jaribio haliwezi kuonyesha kama ni kweli au si kweli.

Mbinu za kupima hypotheses za takwimu
Mbinu za kupima hypotheses za takwimu

Mbinu mbadala za nadharia ya uamuzi

Mbinu mbadala za nadharia ya uamuzi zipo, ambapo dhana potofu na za kwanza zinazingatiwa kwa usawa zaidi. Mbinu zingine za kufanya maamuzi, kama vile nadharia ya Bayesian, hujaribu kusawazisha matokeo ya maamuzi mabaya katika uwezekano wote badala ya kuzingatia nadharia moja tupu. Njia zingine kadhaa za kuamua ni dhahania gani ni sahihi zinatokana na data, ni ipi kati yao inayo mali inayotaka. Lakini upimaji dhahania ndiyo mbinu kuu ya uchanganuzi wa data katika nyanja nyingi za sayansi.

Kujaribu nadharia tete ya takwimu

Wakati wowote seti moja ya matokeo inatofautiana na seti nyingine, ni lazima mtu ategemee majaribio ya dhahania ya takwimu au majaribio ya dhahania ya takwimu. Ufafanuzi wao unahitaji uelewa sahihi wa maadili ya p na maadili muhimu. Pia ni muhimu kuelewa kwamba, bila kujali kiwango cha umuhimu, majaribio bado yanaweza kuwa na makosa. Kwa hivyo, hitimisho huenda lisiwe sahihi.

Mchakato wa majaribio unajumuishahatua nyingi:

  1. Nadharia ya awali inaundwa kwa ajili ya utafiti.
  2. Nadharia zisizofaa na mbadala zinaonyeshwa.
  3. Inafafanua mawazo ya takwimu kuhusu sampuli katika jaribio.
  4. Kubainisha ni jaribio gani linafaa.
  5. Chagua kiwango cha umuhimu na kizingiti cha uwezekano kilicho chini yake ambapo nadharia potofu itakataliwa.
  6. Usambazaji wa takwimu za jaribio la nadharia potovu huonyesha thamani zinazowezekana ambapo nadharia potofu imekataliwa.
  7. Hesabu inaendelea.
  8. Uamuzi unafanywa kukataa au kukubali dhana potofu ili kupendelea njia mbadala.

Kuna njia mbadala inayotumia thamani ya p.

Mifano ya majaribio ya nadharia za takwimu
Mifano ya majaribio ya nadharia za takwimu

Majaribio ya umuhimu

Data safi haina matumizi ya vitendo bila tafsiri. Katika takwimu, linapokuja suala la kuuliza maswali kuhusu data na matokeo ya ukalimani, mbinu za takwimu hutumiwa ili kuhakikisha usahihi au uwezekano wa majibu. Wakati wa kupima hypotheses za takwimu, darasa hili la mbinu huitwa upimaji wa takwimu, au vipimo vya umuhimu. Neno "hypothesis" linawakumbusha mbinu za kisayansi, ambapo nadharia na nadharia zinachunguzwa. Katika takwimu, jaribio la dhahania husababisha kiasi kutokana na dhana fulani. Inakuruhusu kutafsiri kama dhana ni kweli au ukiukaji umefanywa.

Tafsiri ya takwimu ya majaribio

Vipimo vya Hypothesishutumika kubainisha ni matokeo gani ya utafiti yatapelekea kukataliwa kwa nadharia potofu kwa kiwango kilichoamuliwa mapema cha umuhimu. Matokeo ya mtihani wa nadharia ya takwimu lazima yafasiriwe ili kazi iweze kuendelea juu yake. Kuna aina mbili za kawaida za vigezo vya upimaji wa nadharia ya takwimu. Hizi ni thamani ya p na thamani muhimu. Kulingana na kigezo kilichochaguliwa, matokeo yaliyopatikana lazima yatafsiriwe tofauti.

Thamani ya p ni nini

Pato linaelezwa kuwa muhimu kitakwimu wakati wa kufasiri thamani ya p. Kwa kweli, kiashiria hiki kinamaanisha uwezekano wa kosa ikiwa nadharia isiyofaa imekataliwa. Kwa maneno mengine, inaweza kutumika kutaja thamani ambayo inaweza kutumika kutafsiri au kukadiria matokeo ya jaribio, na kubainisha uwezekano wa makosa katika kukataa nadharia tete. Kwa mfano, unaweza kufanya mtihani wa hali ya kawaida kwenye sampuli ya data na kugundua kuwa kuna uwezekano mdogo wa kutoa nje. Walakini, nadharia tupu sio lazima kukataliwa. Jaribio la nadharia tete ya takwimu linaweza kurudisha thamani ya p. Hii inafanywa kwa kulinganisha thamani ya p dhidi ya thamani ya juu iliyoamuliwa mapema inayoitwa kiwango cha umuhimu.

Upimaji wa kitakwimu wa dhana potofu
Upimaji wa kitakwimu wa dhana potofu

Kiwango cha Umuhimu

Kiwango cha umuhimu mara nyingi huandikwa kwa herufi ndogo ya Kigiriki "alpha". Thamani ya jumla inayotumika kwa alpha ni 5%, au 0.05. Thamani ndogo ya alfa inapendekeza tafsiri ya kuaminika zaidi ya nadharia potofu. Thamani ya p inalinganishwa nathamani ya alfa iliyochaguliwa mapema. Matokeo yake ni muhimu kitakwimu ikiwa p-thamani ni chini ya alpha. Kiwango cha umuhimu kinaweza kugeuzwa kwa kuiondoa kutoka kwa moja. Hii inafanywa ili kubaini kiwango cha kujiamini cha dhahania kutokana na data ya sampuli iliyozingatiwa. Wakati wa kutumia njia hii ya kupima hypotheses za takwimu, thamani ya P ni uwezekano. Hii ina maana kwamba katika mchakato wa kutafsiri matokeo ya mtihani wa takwimu, mtu hajui ni nini kweli au uongo.

Nadharia ya majaribio ya nadharia ya takwimu

Kukataliwa kwa dhana potofu kunamaanisha kuwa kuna ushahidi wa kutosha wa takwimu kwamba inaonekana kuna uwezekano. Vinginevyo, ina maana kwamba hakuna takwimu za kutosha za kukataa. Mtu anaweza kufikiria vipimo vya takwimu katika suala la dichotomy ya kukataa na kukubali nadharia tupu. Hatari ya upimaji wa takwimu wa nadharia tupu ni kwamba, ikikubaliwa, inaweza kuonekana kuwa kweli. Badala yake, itakuwa sahihi zaidi kusema kwamba dhana potofu haijakataliwa kwa sababu hakuna ushahidi wa kutosha wa takwimu kuikataa.

Dhana ya takwimu inajaribu ubora wa vigezo vinavyofaa
Dhana ya takwimu inajaribu ubora wa vigezo vinavyofaa

Wakati huu mara nyingi huchanganya nyongeza za wanaoanza. Katika hali kama hii, ni muhimu kujikumbusha kuwa matokeo ni ya uwezekano na kwamba hata kukubali dhana potofu bado kuna nafasi ndogo ya makosa.

Nadharia isiyo ya kweli au isiyo ya kweli

Tafsiri ya thamani ya p haimaanishi kuwa sufurihypothesis ni kweli au uongo. Hii ina maana kwamba uchaguzi umefanywa kukataa au kutokataa nadharia tete katika kiwango fulani cha umuhimu wa takwimu kulingana na data ya majaribio na jaribio la takwimu lililochaguliwa. Kwa hivyo, thamani ya p inaweza kuzingatiwa kama uwezekano wa data iliyotolewa chini ya dhana iliyoamuliwa mapema iliyopachikwa katika majaribio ya takwimu. Thamani ya p ni kipimo cha uwezekano wa sampuli ya data kuzingatiwa ikiwa dhana potofu ni ya kweli.

Tafsiri ya maadili muhimu

Baadhi ya majaribio hayarudi uk. Badala yake, wanaweza kurudisha orodha ya maadili muhimu. Matokeo ya utafiti kama huo yanatafsiriwa kwa njia sawa. Badala ya kulinganisha thamani ya p moja na kiwango cha umuhimu kilichobainishwa mapema, takwimu za jaribio hulinganishwa na thamani muhimu. Ikiwa inageuka kuwa kidogo, inamaanisha kuwa haikuwezekana kukataa nadharia isiyo na maana. Ikiwa ni kubwa kuliko au sawa, dhana potofu inapaswa kukataliwa. Maana ya algorithm ya upimaji wa nadharia ya takwimu na tafsiri ya matokeo yake ni sawa na thamani ya p. Kiwango cha umuhimu kilichochaguliwa ni uamuzi unaowezekana wa kukataa au kutokataa dhana ya jaribio la msingi kutokana na data.

Hitilafu katika majaribio ya takwimu

Tafsiri ya jaribio la nadharia tete ya takwimu ni ya uwezekano. Kazi ya kupima dhahania za takwimu sio kupata taarifa ya kweli au ya uwongo. Ushahidi wa majaribio unaweza kuwa na makosa. Kwa mfano, ikiwa alpha ilikuwa 5%, hii inamaanisha kuwa kwa sehemu kubwa 1 kati ya 20nadharia tupu itakataliwa kimakosa. Au haitakuwa kwa sababu ya kelele ya takwimu katika sampuli ya data. Kwa kuzingatia hatua hii, bei ndogo ya p ambayo kukataa nadharia isiyofaa inaweza kumaanisha kuwa ni ya uwongo au kwamba kosa limefanywa. Ikiwa aina hii ya makosa inafanywa, matokeo huitwa chanya ya uwongo. Na kosa kama hilo ni kosa la aina ya kwanza wakati wa kujaribu nadharia za takwimu. Kwa upande mwingine, ikiwa thamani ya p ni kubwa vya kutosha kumaanisha kukataliwa kwa dhana potofu, inaweza kumaanisha kuwa ni kweli. Au sio sahihi, na tukio lisilowezekana lilitokea kwa sababu hitilafu ilifanywa. Aina hii ya hitilafu inaitwa hasi ya uwongo.

Upimaji wa kitakwimu wa dhana potofu
Upimaji wa kitakwimu wa dhana potofu

Uwezekano wa makosa

Unapojaribu nadharia tete za takwimu, bado kuna nafasi ya kufanya mojawapo ya aina hizi za makosa. Data ya uwongo au hitimisho la uwongo ni uwezekano mkubwa. Kwa hakika, kiwango cha umuhimu kinapaswa kuchaguliwa ambacho kinapunguza uwezekano wa mojawapo ya makosa haya. Kwa mfano, upimaji wa takwimu wa dhana potofu unaweza kuwa na kiwango cha chini sana cha umuhimu. Ingawa viwango vya umuhimu kama vile 0.05 na 0.01 ni vya kawaida katika nyanja nyingi za sayansi, kiwango cha umuhimu kinachotumiwa sana ni 310^-7, au 0.0000003. Mara nyingi hujulikana kama "5-sigma". Hii ina maana kwamba hitimisho lilikuwa la nasibu na uwezekano wa marudio 1 kati ya milioni 3.5 huru ya majaribio. Mifano ya majaribio ya nadharia za takwimu mara nyingi hubeba makosa kama haya. Hii pia ndiyo sababu ni muhimu kuwa na matokeo ya kujitegemea.uthibitishaji.

Mifano ya kutumia uthibitishaji wa takwimu

Kuna mifano kadhaa ya kawaida ya majaribio ya dhahania katika mazoezi. Moja ya maarufu zaidi inajulikana kama "Kuonja Chai". Dk. Muriel Bristol, mfanyakazi mwenzake wa mwanzilishi wa biometriska Robert Fisher, alidai kuwa na uwezo wa kusema kwa uhakika ikiwa iliongezwa kwanza kwenye kikombe cha chai au maziwa. Fisher alijitolea kumpa vikombe nane (vinne vya kila aina) bila mpangilio. Takwimu ya mtihani ilikuwa rahisi: kuhesabu idadi ya mafanikio katika kuchagua kikombe. Eneo muhimu lilikuwa mafanikio pekee kati ya 4, ikiwezekana kulingana na kigezo cha kawaida cha uwezekano (< 5%; 1 kati ya 70 ≈ 1.4%). Fisher alisema kuwa nadharia mbadala haihitajiki. Mwanamke huyo alitambua kwa usahihi kila kikombe, ambacho kilizingatiwa kuwa matokeo muhimu ya kitakwimu. Uzoefu huu ulipelekea kitabu cha Fisher's Statistical Methods for Researchers.

Mfano wa mshtakiwa

Taratibu za kesi za takwimu zinalinganishwa na mahakama ya jinai ambapo mshtakiwa anachukuliwa kuwa hana hatia hadi itakapothibitishwa kuwa ana hatia. Mwendesha mashtaka anajaribu kuthibitisha hatia ya mshtakiwa. Wakati tu kuna ushahidi wa kutosha kwa shtaka ndipo mshtakiwa anaweza kupatikana na hatia. Mwanzoni mwa utaratibu, kuna dhana mbili: "Mshtakiwa hana hatia" na "Mshtakiwa ana hatia." Dhana ya kutokuwa na hatia inaweza kukataliwa tu wakati kosa haliwezekani sana kwa sababu mtu hataki kumhukumu mshtakiwa asiye na hatia. Hitilafu kama hiyo inaitwa kosa la Aina ya I, na kutokea kwakekudhibitiwa mara chache. Kutokana na tabia hii isiyolinganishwa, hitilafu ya Aina ya II, yaani, kuachiliwa kwa mkosaji, ni ya kawaida zaidi.

Mifano ya Uthibitishaji wa Kitakwimu
Mifano ya Uthibitishaji wa Kitakwimu

Takwimu ni muhimu wakati wa kuchanganua kiasi kikubwa cha data. Hii inatumika kwa usawa katika majaribio ya nadharia, ambayo inaweza kuhalalisha hitimisho hata kama hakuna nadharia ya kisayansi iliyopo. Katika mfano wa kuonja chai, ilikuwa "dhahiri" kwamba hapakuwa na tofauti kati ya kumwaga maziwa kwenye chai au kumwaga chai kwenye maziwa.

Utumiaji halisi wa kiutendaji wa majaribio ya dhahania ni pamoja na:

  • kuchunguza kama wanaume wana ndoto nyingi zaidi kuliko wanawake;
  • sifa ya hati;
  • Kutathmini athari za mwezi mzima kwenye tabia;
  • kubainisha masafa ambayo popo anaweza kutambua mdudu kwa kutumia mwangwi;
  • kuchagua njia bora zaidi za kuacha kuvuta sigara;
  • Kuangalia kama vibandiko vya bamper vinaonyesha tabia ya mmiliki wa gari.

Jaribio la nadharia tete ya takwimu lina jukumu muhimu katika takwimu kwa ujumla na katika makisio ya takwimu. Upimaji wa thamani hutumika kama mbadala wa ulinganisho wa kimapokeo wa thamani iliyotabiriwa na matokeo ya majaribio katika msingi wa mbinu ya kisayansi. Wakati nadharia ina uwezo wa kutabiri ishara ya uhusiano pekee, majaribio ya nadharia iliyoelekezwa yanaweza kusanidiwa kwa njia ambayo ni matokeo muhimu tu ya kitakwimu yanayounga mkono nadharia hiyo. Nadharia hii ya tathmini ndiyo gumu zaidiukosoaji wa matumizi ya upimaji dhahania.

Ilipendekeza: