Kuongeza viwango vingi: ufafanuzi, malengo, malengo na mfano

Orodha ya maudhui:

Kuongeza viwango vingi: ufafanuzi, malengo, malengo na mfano
Kuongeza viwango vingi: ufafanuzi, malengo, malengo na mfano
Anonim

Kuongeza viwango vingi (MDS) ni zana ya kuibua kiwango cha ufanano wa visa mahususi katika seti ya data. Inarejelea seti ya mbinu zinazohusiana za uwekaji amri zinazotumiwa katika kuibua taarifa, hasa kuonyesha taarifa iliyo katika matrix ya umbali. Hii ni aina ya upunguzaji wa mwelekeo usio na mstari. Kanuni ya MDS inalenga kuweka kila kitu katika nafasi ya N-dimensional kwa njia ambayo umbali kati ya vitu huhifadhiwa vizuri iwezekanavyo. Kisha kila kitu hupewa viwianishi katika kila vipimo vya N.

Idadi ya vipimo vya grafu ya MDS inaweza kuzidi 2 na imebainishwa kipaumbele. Kuchagua N=2 kunaboresha uwekaji wa kitu kwa 2D scatterplot. Unaweza kuona mifano ya kuongeza multidimensional kwenye picha kwenye makala. Mifano iliyo na alama katika Kirusi ni ya kielelezo haswa.

Upanuzi wa multidimensional
Upanuzi wa multidimensional

Essence

Njia ya kuongeza ukubwa wa pande nyingi (MMS,MDS) ni seti iliyopanuliwa ya zana za kitamaduni ambazo zinajumlisha utaratibu wa uboreshaji kwa seti ya vitendakazi vya upotezaji na hesabu za pembejeo za umbali unaojulikana na uzani na kadhalika. Katika muktadha huu, kipengele muhimu cha utendakazi cha kupoteza huitwa mfadhaiko, ambao mara nyingi hupunguzwa kwa utaratibu unaoitwa kukuza mkazo.

Mwongozo

Kuna chaguo kadhaa za kuongeza ukubwa wa pande nyingi. Programu za MDS hupunguza mzigo kiotomatiki ili kupata suluhisho. Msingi wa algorithm isiyo ya kipimo ya MDS ni mchakato wa uboreshaji mara mbili. Kwanza, mabadiliko bora ya ukaribu wa monotoni lazima yapatikane. Pili, pointi za usanidi lazima ziwekwe vyema zaidi ili umbali wao ulingane na thamani za ukaribu zilizopimwa kwa karibu iwezekanavyo.

Mfano wa kuongeza ukubwa wa pande nyingi
Mfano wa kuongeza ukubwa wa pande nyingi

Upanuzi

Ongezeko la kuongeza ukubwa wa metric dimensional katika takwimu ambapo nafasi inayolengwa ni nafasi laini isiyo ya Euclidean kiholela. Ambapo tofauti ni umbali kwenye uso na nafasi inayolengwa ni uso tofauti. Programu za mada hukuruhusu kupata kiambatisho kilicho na upotoshaji mdogo wa uso mmoja hadi mwingine.

Hatua

Kuna hatua kadhaa katika kufanya utafiti kwa kutumia kipimo cha aina nyingi:

  1. Uundaji wa tatizo. Je, ungependa kulinganisha vigeu gani? Je, ungependa kulinganisha vigeu vingapi? Je, utafiti utatumika kwa madhumuni gani?
  2. Kupata data ya ingizo. Wajibu huulizwa mfululizo wa maswali. Kwa kila jozi ya bidhaa, wanaulizwa kukadiria kufanana (kawaida kwa mizani ya Likert ya alama 7 kutoka kwa kufanana sana hadi tofauti sana). Swali la kwanza linaweza kuwa la Coca-Cola/Pepsi, kwa mfano, linalofuata kwa bia, linalofuata kwa Dk. Pilipili, n.k. Idadi ya maswali inategemea idadi ya chapa.
Kuongeza umbali
Kuongeza umbali

Njia mbadala

Kuna mbinu nyingine mbili. Kuna mbinu inayoitwa "Data ya Mtazamo: Mbinu Iliyotokana" ambayo bidhaa hutungwa kuwa sifa na tathmini inafanywa kwa kiwango cha tofauti cha kisemantiki. Mbinu nyingine ni "mbinu ya upendeleo wa data," ambapo wahojiwa huulizwa kuhusu mapendeleo badala ya kufanana.

Inajumuisha hatua zifuatazo:

  1. Inazindua mpango wa takwimu wa MDS. Programu ya kufanya utaratibu inapatikana katika vifurushi vingi vya programu za takwimu. Mara nyingi kuna chaguo kati ya MDS ya kipimo (inayoshughulikia data ya kiwango cha muda au uwiano) na MDS isiyo ya kipimo (ambayo inashughulikia data ya kawaida).
  2. Kubainisha idadi ya vipimo. Mtafiti lazima atambue idadi ya vipimo ambavyo anataka kuunda kwenye kompyuta. Vipimo vingi ndivyo inavyofaa zaidi takwimu, lakini ndivyo inavyokuwa vigumu kutafsiri matokeo.
  3. Onyesha matokeo na ubainishe vipimo - programu ya takwimu (au sehemu inayohusiana) itaonyesha matokeo. Ramani itaonyesha kila bidhaa (kawaida katika 2D).nafasi). Ukaribu wa bidhaa kwa kila mmoja unaonyesha ama kufanana au upendeleo wao, kulingana na njia gani iliyotumiwa. Walakini, jinsi vipimo vinavyohusiana na vipimo vya tabia ya mfumo sio wazi kila wakati. Hukumu ya kuzingatia ya kuzingatia inaweza kutolewa hapa.
  4. Angalia matokeo ya kutegemewa na uhalali - kokotoa R-mraba ili kubaini uwiano wa tofauti za data zilizopimwa ambazo zinaweza kuhesabiwa na utaratibu wa MDS. Mraba R 0.6 inachukuliwa kuwa kiwango cha chini kinachokubalika. R ya mraba 0.8 inachukuliwa kuwa nzuri kwa kuongeza vipimo, huku 0.9 inachukuliwa kuwa nzuri kwa kipimo kisicho kipimo.
Matokeo ya kuongeza viwango vingi
Matokeo ya kuongeza viwango vingi

Majaribio mbalimbali

Majaribio mengine yanayowezekana ni majaribio ya mfadhaiko ya aina ya Kruskal, majaribio ya data ya mgawanyiko, majaribio ya uthabiti wa data na majaribio ya kutegemewa tena. Andika kwa undani kuhusu matokeo katika mtihani. Pamoja na uchoraji ramani, angalau kipimo cha umbali (kwa mfano, faharasa ya Sorenson, faharasa ya Jaccard) na kutegemewa (km thamani ya mkazo) inapaswa kubainishwa.

Pia inafaa sana kutoa algoriti (k.m. Kruskal, Mather) ambayo mara nyingi huamuliwa na programu inayotumiwa (wakati fulani ikichukua nafasi ya ripoti ya algorithm), ikiwa umetoa usanidi wa kuanzia au ulikuwa na chaguo nasibu, nambari. ya mwendo wa vipimo, matokeo ya Monte Carlo, idadi ya marudio, alama ya uthabiti, na tofauti za sawia za kila mhimili (r-mraba).

Maelezo yanayoonekana na mbinu ya uchambuzi wa datakuongeza ukubwa wa pande nyingi

Taswira ya taarifa ni utafiti wa uwakilishi shirikishi (wa kuona) wa data dhahania ili kuboresha utambuzi wa binadamu. Data ya mukhtasari inajumuisha data ya nambari na isiyo ya nambari kama vile maelezo ya maandishi na kijiografia. Walakini, taswira ya habari inatofautiana na taswira ya kisayansi: "ni ya habari (uonyesho wa habari) wakati uwakilishi wa anga umechaguliwa, na scivis (uonyesho wa kisayansi) wakati uwakilishi wa anga unatolewa."

Nyumba ya taswira ya taarifa iliibuka kutokana na utafiti wa mwingiliano wa kompyuta na binadamu, matumizi ya sayansi ya kompyuta, michoro, muundo wa kuona, saikolojia na mbinu za biashara. Inazidi kutumiwa kama nyenzo muhimu katika utafiti wa kisayansi, maktaba za kidijitali, uchimbaji wa data, data ya kifedha, utafiti wa soko, udhibiti wa uzalishaji na kadhalika.

Mbinu na kanuni

Taswira ya taarifa inapendekeza kuwa mbinu za taswira na mwingiliano huchukua fursa ya wingi wa mitazamo ya binadamu, kuruhusu watumiaji kuona, kuchunguza na kuelewa kiasi kikubwa cha taarifa kwa wakati mmoja. Taswira ya habari inalenga kuunda mbinu za kuwasiliana data dhahania, habari kwa njia angavu.

Kuongeza rangi ya multidimensional
Kuongeza rangi ya multidimensional

Uchambuzi wa data ni sehemu muhimu ya utafiti wote unaotumika na utatuzi wa matatizo katika sekta. WengiMbinu za kimsingi za uchanganuzi wa data ni taswira (histograms, viwanja vya kutawanya, viwanja vya uso, ramani za miti, viwanja vya kuratibu sambamba, n.k.), takwimu (upimaji dhahania, urejeleaji, PCA, n.k.), uchanganuzi wa data (kulinganisha, n.k.)..d.) na mbinu za mashine za kujifunza (kuunganisha, uainishaji, miti ya maamuzi, n.k.).

Kati ya mbinu hizi, taswira ya taarifa au uchanganuzi wa data unaoonekana ndio unaotegemea zaidi ujuzi wa utambuzi wa wafanyakazi wa uchanganuzi na unaruhusu ugunduzi wa maarifa ambayo hayajapangiliwa kutekelezeka ambayo yamezuiwa tu na mawazo na ubunifu wa binadamu. Mchambuzi hahitaji kujifunza mbinu zozote changamano ili kuweza kutafsiri taswira za data. Taswira ya habari pia ni mpango wa uzalishaji dhahania ambao unaweza na kwa kawaida huambatana na uchanganuzi zaidi wa uchanganuzi au rasmi kama vile upimaji dhahania wa takwimu.

Somo

Utafiti wa kisasa wa taswira ulianza na michoro ya kompyuta, ambayo "tangu mwanzo ilitumika kusoma shida za kisayansi. Walakini, katika miaka ya mapema, ukosefu wa nguvu za michoro mara nyingi ulipunguza matumizi yake. Kipaumbele cha taswira kilianza. ili kuendeleza mwaka wa 1987, kwa kutolewa kwa programu maalum ya Kompyuta Graphics na Visualization in Scientific Computing Tangu wakati huo, kumekuwa na mikutano na warsha kadhaa zilizoandaliwa kwa pamoja na Jumuiya ya Kompyuta ya IEEE na ACM SIGGRAPH".

Walishughulikia mada za jumla za taswira ya data, taswira ya habari na taswira ya kisayansi,pamoja na maeneo mahususi zaidi kama vile utoaji wa sauti.

Kuongeza chapa ya pande nyingi
Kuongeza chapa ya pande nyingi

Muhtasari

Upeo wa Jumla wa Multidimensional (GMDS) ni kiendelezi cha kuongeza ukubwa wa metric ambapo nafasi inayolengwa si ya Euclidean. Wakati tofauti ni umbali kwenye uso, na nafasi inayolengwa ni sehemu nyingine, GMDS hukuruhusu kupata kutagia kwa uso mmoja hadi mwingine bila upotoshaji mdogo.

GMDS ni njia mpya ya utafiti. Kwa sasa, programu kuu ni utambuzi wa kitu kinachoweza kuharibika (kwa mfano, kwa utambuzi wa uso wa 3D) na uchoraji wa ramani.

Madhumuni ya kuongeza ukubwa wa pande nyingi ni kuwakilisha data yenye nyanja nyingi. Data ya pande nyingi, yaani, data inayohitaji zaidi ya vipimo viwili au vitatu kuwakilisha, inaweza kuwa vigumu kufasiriwa. Mbinu moja ya kurahisisha ni kudhani kuwa data ya kuvutia iko kwenye mpangilio mwingi usio na mstari uliopachikwa katika nafasi ya juu-dimensional. Ikiwa mkusanyaji ana kipimo cha chini cha kutosha, data inaweza kuonekana katika nafasi ya chini kabisa.

Njia nyingi zisizo za mstari za kupunguza vipimo zinahusiana na mbinu za mstari. Mbinu zisizo za mstari zinaweza kuainishwa kwa upana katika vikundi viwili: zile zinazotoa ramani (ama kutoka nafasi ya juu-dimensional hadi upachikaji wa mwelekeo wa chini, au kinyume chake), na zile zinazotoa taswira kwa urahisi. Katika muktadha wa kujifunza kwa mashine, mbinu za uchoraji ramani zinaweza kutazamwa kamahatua ya awali ya uchimbaji wa vipengele, baada ya hapo kanuni za utambuzi wa muundo hutumika. Kawaida zile zinazotoa taswira zinatokana na data ya ukaribu - yaani, vipimo vya umbali. Kuongeza ukubwa wa pande nyingi pia ni jambo la kawaida sana katika saikolojia na wanadamu wengine.

Kuongeza ulalo wa pande nyingi
Kuongeza ulalo wa pande nyingi

Ikiwa idadi ya sifa ni kubwa, basi nafasi ya mifuatano ya kipekee inayowezekana pia ni kubwa mno. Kwa hivyo, kadiri ukubwa unavyokuwa mkubwa, ndivyo inavyokuwa vigumu zaidi kuonyesha nafasi. Hii husababisha matatizo mengi. Algorithms zinazofanya kazi kwenye data ya hali ya juu huwa na utata wa juu sana. Kupunguza data hadi vipimo vichache mara nyingi hufanya kanuni za uchanganuzi kuwa bora zaidi na kunaweza kusaidia kanuni za kujifunza kwa mashine kufanya ubashiri sahihi zaidi. Hii ndiyo sababu uongezaji data wa pande nyingi ni maarufu sana.

Ilipendekeza: