Bedste svar
“Data” er faktisk flertallet af “datum”, så strengt grammatisk skal det være” disse data “. Nogle grammatikbrikker (og gamle lærere) vil stadig forkaste dig for at bruge “disse data”.
Men i dag, især i informations- og computerfelterne, bruges ordet data i stedet for nulpunkt og bruges “ utalligt ”. Dette betyder, at der ikke er noget klart mål for et nulpunkt, to data og så videre, men snarere en klods af data i stedet.
Hvis du ønsker at henvise til en enkelt dataenhed, skal du bruge en kvantifier eller en container, såsom:
- “ data præsenteret i denne tabel viser fordelingen af Pikachu i Kanto-regionen. ” På denne måde er dataene begrænset til en enkelt datatabel. Også, “distribution” er heller ikke en rigtig tællelig ting, så det er svært at sige “distribution af data” faktisk at afgøre, om det skal være ental eller flertal.
- “Google datasæt er enormt stort og kræver lang tid at downloade. NIST datasæt er betydeligt mindre. ” På denne måde er datasættet et enkelt sæt pakkedata leveret af et firma. Det kan bruges som ental eller flertal.
- “Disse data, du ser her, repræsenterer antallet af personer, der har stemt på Joseph Joestar.” Selvom det er data om en enkelt person, kan det have flere distrikter osv.
Dette perspektiv er skrevet af en computerforsker der IKKE taler engelsk som et primært sprog.
Svar
Måske har jeg misforstået dit spørgsmål, i så fald lad mig det vide, og jeg kan slette eller ændre mit svar.
Du finder middelværdien af en variabel ved at tilføje alle værdierne i det datasæt af den variabel og dividere med antallet af observationer.
Hvis disse data kun repræsenterer en stikprøve af observationer, kan du derefter teste, om prøvegennemsnittet (X bar) er i overensstemmelse med et antaget populationsgennemsnit (Mu 0).
Trin 1: Angiv nul og alternativ / alternativ hypotese
Trin 2: Vælg den passende teststatistik:
Sx er standardafvigelsen, og n er antallet af observationer for den variabel.
Trin 3: Vælg den ønskede niveau af betydning (normalt 0,05, 0,01 eller 0,001) og find de relevante kritiske værdier til afvisning af nulhypotesen. Kald det Zt.
Trin 4: Beregn Zc baseret på formlen i trin 2.
Trin 5: Sammenlign Zc med Zt. Hvis Zc ligger i afvisningsregionerne, afvis H0. Det betyder, at gennemsnitsprøven ikke er i overensstemmelse med det hypotetiske populationsgennemsnit. Betydningsniveauet er den værdi, du valgte i trin 3, hvilket er sandsynligheden for at være forkert, når du (forkert) afviser nulhypotesen.
Hvis Zc ikke ligger i et af afvisningsregionerne, er du undlader at afvise H0. Dette indebærer, at stikprøvernes gennemsnit er i overensstemmelse med det hypotetiske populationsgennemsnit.