Beste svaret
«Data» er faktisk flertallet av «datum», så strengt grammatisk bør det være» disse dataene «. Noen grammatikksjekkere (og gamle lærere) vil fremdeles utsette deg for å bruke “disse dataene”.
I dag, spesielt i informasjons- og datamaskinfeltene, brukes ordet data i stedet for referanse og brukes “ utallige ”. Dette betyr at det ikke er noe klart mål på ett datum, to data og så videre, men heller en klatt data i stedet.
Hvis du ønsker å referere til en enkelt dataenhet, bør du bruke en kvantifier eller en container, for eksempel:
- “ data presentert i denne tabellen viser fordelingen av Pikachu i Kanto-regionen. ” På denne måten er dataene begrenset til en enkelt datatabell. Også, «distribusjon» er heller ikke en virkelig tellbar ting, så det er vanskelig å si «distribusjonsdata» faktisk om det skal være entall eller flertall.
- «Google datasett er enormt stort og krever ganske lang tid å laste ned. NIST datasett er betydelig mindre. ” På denne måten er datasettet et enkelt sett med pakkedata levert av et selskap. Den kan brukes som entall eller flertall.
- «Disse dataene du ser her representerer antall personer som stemte på Joseph Joestar.» Selv om det er data om en enkelt person, kan det ha flere distrikter og så videre.
Dette perspektivet er skrevet av en dataforsker som IKKE snakker engelsk som hovedspråk.
Svar
Kanskje jeg har misforstått spørsmålet ditt, i så fall gi meg beskjed, og jeg kan slette eller endre mitt svar.
Du finner gjennomsnittet av en variabel ved å legge til alle verdiene i det datasettet til den variabelen, og dele med antall observasjoner.
Hvis dataene bare representerer et utvalg av observasjoner, kan du deretter teste om prøvenes gjennomsnitt (X bar) er i samsvar med en antatt populasjonsgjennomsnitt (Mu 0).
Trinn 1: Angi null og alternativ / alternativ hypotese
Trinn 2: Velg riktig teststatistikk:
Sx er standardavviket, og n er antall observasjoner for den variabelen.
Trinn 3: Velg ønsket nivå av betydning (vanligvis 0,05, 0,01 eller 0,001) og finn passende kritiske verdier for avvisning av nullhypotesen. Kall det Zt.
Trinn 4: Beregn Zc basert på formelen i trinn 2.
Trinn 5: Sammenlign Zc med Zt. Hvis Zc ligger i avvisningsregionene, avvis H0. Det betyr at gjennomsnittet av prøven ikke er i samsvar med det hypoteserte gjennomsnittet av populasjonen. Betydningsnivået er verdien du valgte i trinn 3, som er sannsynligheten for å være feil når du (feil) avviser nullhypotesen.
Hvis Zc ikke ligger i en av avvisningsregionene, vil du unnlater å avvise H0. Det antyder at gjennomsnittet av prøven er i samsvar med det hypotetiske populasjonsgjennomsnittet.