ca. 5 min. STATISTISKE TEGN I statistik støder du tit på forskellige tegn - det som også kaldes for statistisk notation. Det kan virke forvirrende og uoverskueligt i starten. Men bare rolig: For det første er der ikke så mange af dem, og for det andet ser du dem ofte, og lærer dem hurtigt. I denne oversigt har jeg givet en lille definition af de vigtigste, som du møder i den statistiske verden. OVERSIGT
Xi xi N n Stort X angiver en variabel. i et henviser til et givent variabelnummer, som fxkan været X1, X2 osv. Typisk angiver fodtegnet hvad variablen måler, fx: XKøn, XIndkomst, XBopæl,. Lille x angiver konkrete værdier af en variabel, fx værdier fra variabel Xi. Fx er x1,bopæl værdien af observation 1 fra variablen XBopæl. Stort N : ens størrelse - antal respondenter/observationer i populationen. en kan fx være alle danskere mellem 18-35 år eller alle produkter på et varelager. Lille n : ns størrelse - antal respondenter/observationer i stikprøven. n er altid et udsnit af populationen, og besidder de præcis samme karakteristika som populationen. OVERSIGT Side 2
middelværdi, fx respondenternes gennemsnitlige årsindkomst før skat, karaktergennemsnit, gennemsnitlige ugentlige salg i kroner. ens middelværdi / den sande middelværdi - ofte anvendes stikprøvemiddelværdien ovenfor som et estimat (dvs. et bud) på den sande populationsmiddelværdi, fx alle danskeres årsindkomst, det samlede salg i kroner. andel, fx andelen af henholdsvis mænd og kvinder i stikprøven, andelen af respondenter som har svaret henholdsvis ja og nej til et konkret spørgsmål. Meget brugt: Du har sikkert anvendt andel som et procent-tal. ens andel / den sande andel - ofte anvendes stikprøveandelen ovenfor som et estimat (dvs. et bud) på den sande populationsandel, fx andelen af mænd og kvinder i hele populationen. OVERSIGT Side 3
varians - et mål for hvor meget data i stikprøven samlet set afviger fra stikprøvemiddelværdien. svarians - et mål for hvor meget data i populationen samlet set afviger fra den sande populationsmiddelværdi. ns standardafvigelse - et mål for hvor meget data i stikprøven i gennemsnit afviger fra stikprøvemiddelværdien. ens standardafvigelse - et mål for hvor meget data i populationen i gennemsnit afviger fra den sande populationsmiddelværdi. OVERSIGT Side 4
Signifikansniveau - vores beslutningsregel for, hvor sikkert vi vil udtale os. Typisk fastsættes det til 5%, dvs. at vi accepterer, at der vil være 5% sandsynlighed for, at vi tager fejl når vi henholdsvis accepterer eller forkaster H0. H0-hypotesen - typisk den mindste farlige påstand, fx at to middelværdier er ens, at en flaskes indhold er mindre eller lig med 50 cl. eller at to standardafvigelser er ens (som også benævnes varianshomogenitet). H1-hypotesen - typisk den mere farlige påstand, fx at to middelværdier er forskellige, at en flaskes indhold er mere end 50 cl. eller at to standardafvigelser er forskellige (ikke varianshomogenitet). p-værdi - et mål for sandsynligheden for at begå en type-ii-fejl. Med andre ord, viser p-værdien hvor sandsynligt det er at vores H0-hypotese er sand. Hvis den er over 0,05 siger vi fx at sandsynligheden for at H0 er sand er mindre end 5%, og vi forkaster derfor H0 og vender os mod H1. OVERSIGT Side 5
Forskellig fra - det modsatte af lig med (=). Sumtegn - at man i en beregning skal tage summen af alt det der står til højre for sumtegnet, fx: Korrelationskoefficient - et mål for den lineære samvariation mellem X og Y. Antager en værdi mellem -1 og 1, hvor -1 betyder at X og Y samvarierer perfekt negativt, 1 at de varierer perfekt positivt og 0 at X og Y ikke samvarierer. OVERSIGT Side 6