Mawazo yaliyojumuishwa katika uundaji wa takwimu yanaelezea seti ya ugawaji wa uwezekano, ambao baadhi yao huchukuliwa kukadiria usambazaji ipasavyo. Seti maalum ya data imechaguliwa kutoka kwa ufafanuzi. Usambazaji wa uwezekano uliopo katika uundaji wa takwimu ndio unaotofautisha miundo ya takwimu kutoka kwa miundo mingine, isiyo ya takwimu, ya hisabati.
Muunganisho na hisabati
Mbinu hii ya kisayansi imekita mizizi katika hisabati. Uundaji wa takwimu wa mifumo kwa kawaida hutolewa na milinganyo ya hisabati ambayo inahusiana na kigeu kimoja au zaidi cha nasibu na ikiwezekana vigeu vingine visivyo vya nasibu. Kwa hivyo, modeli ya takwimu ni "uwakilishi rasmi wa nadharia" (Hermann Ader, akimnukuu Kenneth Bollen).
Majaribio yote ya nadharia tete ya takwimu na makadirio yote ya takwimu yanatokana na miundo ya takwimu. Kwa ujumla zaidi, miundo ya takwimu ni sehemu ya msingi wa makisio ya takwimu.
Njia za takwimuuundaji
Kwa njia isiyo rasmi, muundo wa takwimu unaweza kuzingatiwa kama dhana ya takwimu (au seti ya mawazo ya takwimu) yenye sifa fulani: dhana hii huturuhusu kukokotoa uwezekano wa tukio lolote. Kwa mfano, fikiria jozi ya kete za kawaida za pande sita. Tutasoma dhana mbili tofauti za takwimu kuhusu mfupa.
Wazo la kwanza la takwimu linajumuisha muundo wa takwimu, kwa sababu kwa dhana moja pekee tunaweza kukokotoa uwezekano wa tukio lolote. Dhana mbadala ya takwimu haijumuishi muundo wa takwimu, kwa sababu kwa dhana moja tu hatuwezi kuhesabu uwezekano wa kila tukio.
Katika mfano ulio hapo juu wenye dhana ya kwanza, ni rahisi kukokotoa uwezekano wa tukio. Walakini, katika mifano mingine, hesabu inaweza kuwa ngumu au isiyowezekana (kwa mfano, inaweza kuhitaji mamilioni ya miaka ya hesabu). Kwa dhana inayounda muundo wa takwimu, ugumu huu unakubalika: kufanya hesabu si lazima kufanyike kivitendo, iwezekanavyo kinadharia.
Mifano ya miundo
Tuseme tuna idadi ya watoto wa shule walio na watoto waliogawanywa kwa usawa. Urefu wa mtoto utakuwa stochastically kuhusiana na umri: kwa mfano, tunapojua kwamba mtoto ana umri wa miaka 7, hii inathiri uwezekano kwamba mtoto atakuwa na urefu wa futi 5 (karibu 152 cm). Tunaweza kurasimisha uhusiano huu kwa mtindo wa urejeshaji wa mstari, kwa mfano: ukuaji=b0 + b1agei+ εi, ambapo b0 ni makutano, b1 ni kigezo ambacho umri huzidishwa wakati wa kupata utabiri wa ukuaji, εi ni neno la makosa. Hii ina maana kwamba urefu unatabiriwa na umri na makosa fulani.
Muundo sahihi lazima ulingane na pointi zote za data. Kwa hivyo mstari ulionyooka (heighti=b0 + b1agei) hauwezi kuwa equation kwa mfano wa data - isipokuwa inafaa alama zote za data haswa, i.e. vidokezo vyote vya data viko kwenye mstari kikamilifu. Neno la hitilafu εi lazima lijumuishwe katika mlingano ili muundo utoshee pointi zote za data.
Ili kufanya makisio ya takwimu, tunahitaji kwanza kuchukulia ugawaji wa uwezekano wa εi. Kwa mfano, tunaweza kudhani kwamba ugawaji wa εi ni Gaussian, na maana sifuri. Katika hali hii, muundo utakuwa na vigezo 3: b0, b1 na tofauti ya usambazaji wa Gaussian.
Maelezo ya Jumla
Muundo wa takwimu ni darasa maalum la muundo wa hisabati. Kinachotofautisha kielelezo cha takwimu kutoka kwa miundo mingine ya hisabati ni kwamba si ya kuamua. Inatumika kuiga data ya takwimu. Kwa hivyo, katika mfano wa takwimu unaofafanuliwa na milinganyo ya hisabati, vigeu vingine havina maadili maalum, lakini badala yake vina mgawanyo wa uwezekano; yaani baadhi ya vigezo ni stochastic. Katika mfano hapo juu, ε ni tofauti ya stochastic; bila kutofautisha hii, mfano ulikuwaitakuwa ya kuamua.
Miundo ya takwimu mara nyingi hutumiwa katika uchanganuzi wa takwimu na uundaji, hata kama mchakato halisi unaowekwa ni wa kubainisha. Kwa mfano, kutupa sarafu kimsingi ni mchakato wa kuamua; lakini kwa kawaida huigwa kama stochastic (kupitia mchakato wa Bernoulli).
Miundo Parametric
Miundo Parametric ndiyo miundo inayotumika sana ya takwimu. Kuhusu mifano ya nusu-parametric na isiyo ya parametric, Sir David Cox alisema: "Kwa ujumla hujumuisha mawazo machache kuhusu muundo na sura ya usambazaji, lakini kwa kawaida huwa na mawazo yenye nguvu ya uhuru." Kama miundo mingine yote iliyotajwa, pia hutumiwa mara nyingi katika mbinu ya takwimu ya uundaji wa hisabati.
Miundo ya viwango vingi
Miundo ya viwango vingi (pia hujulikana kama modeli za mstari wa daraja, miundo ya data iliyoorodheshwa, miundo mseto, vikomo vya nasibu, miundo ya madoido nasibu, miundo ya vigezo nasibu, au miundo iliyogawanywa) ni miundo ya vigezo vya takwimu ambayo hutofautiana kwa zaidi ya kiwango kimoja. Mfano ni muundo wa ufaulu wa wanafunzi ambao una vipimo vya wanafunzi binafsi pamoja na vipimo vya madarasa ambamo wanafunzi wamewekwa katika makundi. Miundo hii inaweza kuzingatiwa kama ujumuishaji wa miundo ya mstari (haswa, urejeshaji wa mstari), ingawa inaweza pia kupanuliwa kwa miundo isiyo ya mstari. Mifano hizi zimekuwamaarufu zaidi mara nguvu ya kutosha ya kompyuta na programu ilipopatikana.
Miundo ya viwango vingi hufaa hasa kwa miradi ya utafiti ambapo data ya washiriki hupangwa katika ngazi zaidi ya moja (yaani, data iliyoorodheshwa). Vitengo vya uchanganuzi kawaida ni watu binafsi (katika kiwango cha chini) ambao huwekwa ndani ya vitengo vya muktadha/jumla (katika kiwango cha juu). Ingawa kiwango cha chini kabisa cha data katika miundo ya viwango vingi ni cha mtu binafsi, vipimo vinavyorudiwa vya watu binafsi vinaweza pia kuzingatiwa. Kwa hivyo, mifano ya ngazi nyingi hutoa aina mbadala ya uchanganuzi kwa uchanganuzi wa hatua zisizobadilika au nyingi zinazorudiwa. Tofauti za kibinafsi katika curves za ukuaji zinaweza kuzingatiwa. Kwa kuongeza, miundo ya ngazi nyingi inaweza kutumika kama mbadala wa ANCOVA, ambapo alama za kutofautiana tegemezi hurekebishwa kwa covariates (kwa mfano, tofauti za mtu binafsi) kabla ya kupima tofauti za matibabu. Miundo ya viwango vingi inaweza kuchanganua majaribio haya bila dhana ya miteremko sare ya urejeshaji inayohitajika na ANCOVA.
Miundo ya viwango vingi inaweza kutumika kwa data iliyo na viwango vingi, ingawa miundo ya ngazi mbili ndiyo inayojulikana zaidi na makala mengine yote yanaangazia haya. Kigezo tegemezi kinafaa kuchunguzwa katika kiwango cha chini kabisa cha uchanganuzi.
Uteuzi wa muundo
Uteuzi wa muundoni kazi ya kuchagua kutoka kwa seti ya mifano ya wagombea kutokana na data, iliyofanywa ndani ya mfumo wa uundaji wa takwimu. Katika hali rahisi, seti ya data iliyopo tayari inazingatiwa. Hata hivyo, kazi hiyo inaweza pia kuhusisha kubuni majaribio ili data iliyokusanywa ifae vyema kazi ya uteuzi wa kielelezo. Kwa kuzingatia vielelezo vya watahiniwa vilivyo na uwezo sawa wa kutabiri au kueleza, mtindo rahisi zaidi unaweza kuwa chaguo bora zaidi (wembe wa Occam).
Konishi & Kitagawa anasema, "Matatizo mengi ya makisio ya takwimu yanaweza kuchukuliwa kuwa matatizo yanayohusiana na uundaji wa takwimu." Vile vile, Cox alisema, “Jinsi tafsiri ya mada katika modeli ya takwimu inavyofanywa mara nyingi ndiyo sehemu muhimu zaidi ya uchanganuzi.”
Uteuzi wa miundo pia unaweza kurejelea tatizo la kuchagua miundo wakilishi machache kutoka kwa kundi kubwa la miundo ya ukokotoaji kwa ajili ya maamuzi au uboreshaji bila uhakika.
Miundo ya picha
Muundo wa mchoro, au muundo wa picha unaowezekana, (PGM) au muundo wa uwezekano wa muundo, ni muundo wa uwezekano ambao grafu huonyesha muundo wa uhusiano wa masharti kati ya vigeuzo nasibu. Zinatumika kwa kawaida katika nadharia ya uwezekano, takwimu (hasa takwimu za Bayesian), na kujifunza kwa mashine.
Miundo ya kiuchumi
Miundo ya kiuchumi ni miundo ya takwimu inayotumikauchumi. Muundo wa kiuchumi hufafanua uhusiano wa kitakwimu unaoaminika kuwepo kati ya kiasi mbalimbali za kiuchumi zinazohusiana na hali fulani ya kiuchumi. Muundo wa uchumi unaweza kutolewa kutoka kwa modeli ya kiuchumi ya kuamua ambayo inazingatia kutokuwa na uhakika, au kutoka kwa mfano wa kiuchumi ambao yenyewe ni stochastic. Hata hivyo, inawezekana pia kutumia miundo ya kiuchumi ambayo haijafungamanishwa na nadharia yoyote mahususi ya kiuchumi.