Modus (Mo) je statistični pojem, ki označuje najpogostejšo vrednost v množici podatkov. To pomeni, da je modus tista vrednost v podatkovni zbirki, ki se pojavlja največkrat. Na primer, če imamo množico podatkov, ki vsebuje 1, 2, 2, 3, 4, 4, 4, 5, 5, 5, 5, 6, 7, 7, 8, 8, 8, 8, 9, 9, 10, je modus 5, saj se ta vrednost pojavlja največkrat.
Modus (Mo) je eden od treh osnovnih statističnih ukrepov centralne tendence, poleg aritmetične sredine in mediane. Čeprav se modus običajno uporablja za opisovanje diskretnih podatkov, ga je mogoče izračunati tudi za kontinuirne podatke, na primer če podatki predstavljajo intervali vrednosti.
Modus (Mo) se lahko uporablja za opisovanje različnih podatkovnih zbirk, kot so demografski podatki, rezultati testov ali rezultati anket. Včasih je modus bolj značilen za podatkovno zbirko kot aritmetična sredina ali mediana, še posebej, če obstajajo močno izstopajoče vrednosti v podatkih.
Modusov je lahko več.
Mediana (Me) razdeli ranžirno vrsto na dva enaka dela, torej je polovica vrednosti je manjših od mediane ali njej enakih, polovica pa večjih od mediane ali njej enakih.
Mediana (Me) se uporablja kot alternativni kazalnik centralne tendence, ki nadomešča aritmetično sredino. Mediana je zlasti koristna pri podatkovnih nizih, kjer obstajajo izjemno visoke ali nizke vrednosti, ki lahko popačijo aritmetično sredino. Mediana se ne spreminja ob pojavu novih podatkov z manjšimi vrednostmi, saj je odvisna samo od sredinskega podatka v množici.
Na primer, če imamo urejeno množico podatkov, ki vsebuje 10 števil: 2, 3, 4, 7, 10, 11, 12, 13, 15, 20, je mediana 10, saj se 50% podatkov nahaja pred in za to vrednost.
Aritmetično sredino izračunamo tako, da seštejemo vse vrednosti spremenljivke in vsoto delimo s številom podatkov. Več informacije tu: aritmetična sredina.
T test je univariatna statistična metoda, ki se v raziskavah pogosto uporablja.
Poznamo:
– T-test za en vzorec (angl. One-Sample T Test): uporablja se v primeru, ko ugotavljamo statistično značilne razlike vzorca glede na populacijo ali za ugotavljanje statistično značilnih razlik dveh vzorcev, kjer se meja postavi na povprečni vrednosti enega vzorca
– T-test za dva neodvisna vzorca (Independent-Samples T Test): s T-testom za dva neodvisna vzorca ugotavljamo, ali obstajajo statistično značilne razlike v povprečni vrednosti dveh vzorcev npr. ali se povprečne vrednosti ocene zadovoljstva zaposlenih med moškimi in ženskami razlikujejo
– T-test za dva odvisna vzorca (angl. Paired-Samples T Test): uporablja se v primeru, ko imamo na voljo podatke stanja npr. podatke iz preteklosti in podatke v sedanjosti ali podatke v sedanjosti in podatke (želje) v prihodnosti – ugotavljamo statistično značilne razlike med temi vrstami podatkov
Analiza variance (ANOVA) je statistična metoda, ki se uporablja za analizo razlik med srednjimi vrednostmi več skupin podatkov. Namen metode je ugotoviti, ali so razlike med skupinami statistično pomembne in ali so posledica dejanske razlike v povprečnih vrednostih ali pa naključnega nihanja v podatkih./span>
ANOVA se uporablja, ko imamo več kot dve skupini podatkov in želimo primerjati povprečne vrednosti neodvisne spremenljivke (ki določa skupine) za odvisno spremenljivko (katero želimo primerjati). Postopek ANOVA se začne z izračunom skupne variabilnosti vseh podatkov in nato razčleni variabilnost na dva dela: variabilnost, ki jo povzročajo razlike med skupinami, in variabilnost, ki jo povzročajo razlike znotraj skupin.
Analiza variance (ANOVA) je univariatna statistična metoda, ki se uporablja v primeru, ko analiziramo statistično značilne razlike med povprečnimi vrednostmi za več kot dva neodvisna vzorca npr. ali se povprečne vrednosti ocene zadovoljstva zaposlenih med anketiranimi glede na stopnjo pridobljene izobrazbe razlikujejo.
Pri ANOVA se izračuna F statistiko, ki primerja razmerje med variabilnostjo med skupinami in variabilnostjo znotraj skupin. Visoka F statistika pomeni, da so razlike med skupinami statistično pomembne.
Hi-kvadrat test (preizkus) je univariatna statistična metoda, ki se uporablja v primeru, ko želimo preveriti, ali sta dve opisni spremenljivki povezani/soodvisni. Več informacij: Hi-kvadrat test.
Korelacijska analiza je multivariatna statistična metoda, s katero ugotavljamo medsebojno povezanost (medsebojno odvisnost) med dvema ali več spremenljivkami.
Regresijska analiza je multivariatna statistična metoda, s katero ugotavljamo vpliv med dvema ali več spremenljivkami, vpliv pa je mogoče izraziti v obliki regresijske enačbe. Poznamo enostavno regresijsko analizo (ugotavljamo vpliv ene neodvisne spremenljivke na odvisno spremenljivko) in multiplo (večkratno) regresijsko analizo (ugotavljamo vpliv dveh ali več neodvisnih spremenljivk na odvisno spremenljivko).
Diskriminantna analiza je multivariatna statistična metoda, ki je podobna multipli regresijski analizi z razliko, da je odvisna spremenljivka pri diskriminantni analizi opisna, neodvisne spremenljivke pa so številske. Poznamo diskriminantno analizo z dvema skupinama (opisna spremenljivka ima dve vrednosti – določa dve skupini) in multiplo diskriminantno analizo (opisna spremenljivka ima tri ali več vrednosti, ki določajo skupine).
Faktorska analiza je multivariatna statistična metoda, s katero zmanjšamo število spremenljivk na način, da uvedemo t.i. faktorje (sintetične spremenljivke), ki jih kasneje vključimo v nadaljnje analize.
Metoda glavnih komponent je multivariatna statistična metoda, s katero zmanjšamo število spremenljivk na način, da uvedemo t. i. komponente (linearne kombinacije originalnih merjenih spremenljivk), ki jih kasneje vključimo v nadaljnje analize.
Statistični slovar pripravila
Dr. Melita Moretti
(Vir: Moretti, Melita. 2023. Statistični slovar)
Pokličite:
(klikni na številko)
Pošljite mail:
(klikni na mail)