Beste svaret
På engelsk er den gjennomsnittlige ordlengden 5,1 (8-bit ASCII) tegn. Du trenger en ordavgrenser, la oss bare bruke mellomromstegnet. 200 tegn vil inneholde 32,8 biter på 6,1 tegn, inkludert mellomrom (som det siste ordet ikke trenger), eller 32 biter på 6,1 tegn og ett på 4,8 tegn.
Så i gjennomsnitt , 32 komplette moderne engelske ord med 200 (8-biters ASCII) tegn.
En person kan ta en tekstfil, dele den i en løpende liste på 200 tegn, og tell antall komplette ord (enten start eller slutt på en linje, eller slutt på et tegnsettingstegn eller mellomrom – hmm, du vil faktisk bruke 201 tegn til å teste hva det siste tegnet i settet er, hvis det er en bokstav, så ikke tell ordet, hvis det er et mellomrom eller skilletegn eller slutten av linjen, gjør det) i hver liste. Plott deretter histogrammet og ta forskjellige univariate statistikker. Et merkelig, men morsomt prosjekt hvis du tok tekster fra forskjellige språk og forskjellige tidsperioder. Det er verktøy i python for å gjøre dette. Du kan ha noen få skrapende øyeblikk om hvordan du kan tenke på UTF-8 tegnsett, da de ikke er kodet i 8 bits, men i 8 bits + 4 bits for aksenter, andre alfabet osv.
I Kinesisk, otoh, det er omtrent 1,5 logogram til en enkelt semantisk enhet (“ord”), men hvert logogram er i variabel bytekoding (Big5, Guobiao), så , 200 1-byte (8-biters) enheter kan oversettes til 150 eller så logogrammer, noe som gir oss omtrent 100 ord på kinesisk, eller omtrent 126 hvis du teller hvert “tegn” som en enkelt enhet. Kodingen av kinesiske tegn på kinesisk, japansk og koreansk er kilden til, err, mye kontrovers .
Svar
200 tegn kan opprette et stort antall ord eller et lite antall ord, avhengig av hva du vil gjøre med det.
Det lengste ordet på det engelske språket anses vanligvis å være: antidisestablishmentarianism. Den er 28 tegn lang. Du kan skrive ordet 6 ganger (168 tegn), og hvis du inkluderer mellomrom mellom hvert ord (5 tegn) og en periode på slutten (1 tegn), vil den siste setningen din være 174 tegn lang. Hvis du tar med ett stort ord til i setningen, et ord på 25 tegn, vil du ha totalt 7 ord, 6 mellomrom og en periode som «setning» – totalt 200 tegn.
De korteste ordene på engelsk er «a», «I» og «O». Så du kan ha 100 av disse ordene, med 99 mellomrom og en periode på slutten, og fylle opp 200 tegn. Den setningen vil ha 100 ord.
PS: Ja, jeg vet at det er tekniske ord mye lenger enn antidisestablishmentarianism. Men blant ikke-myntede, ikke-tekniske ord blir det generelt sett på som konge.