Bedste svar
På engelsk er den gennemsnitlige ordlængde 5,1 (8-bit ASCII) tegn. Du har brug for en ordafgrænser, lad os bare bruge mellemrumstegnet. 200 tegn ville indeholde 32,8 klumper på 6,1 tegn, inklusive det bageste mellemrum (som det sidste ord ikke har brug for) eller 32 klumper på 6,1 tegn og et på 4,8 tegn.
Så i gennemsnit , 32 komplette moderne engelske ord med 200 (8-bit ASCII) tegn.
En person kunne tage en tekstfil, opdele den i en kørende liste på 200 tegn, og tæl antallet af komplette ord (enten start eller slutning af en linje eller slutning med et tegnsætningstegn eller mellemrum – hmm, du vil faktisk bruge 201 tegn til at teste, hvad det sidste tegn i sættet er, Hvis det er et bogstav, skal du ikke tælle ordet, hvis det er et mellemrum eller tegnsætningstegn eller slutningen af linjen, skal du gøre) på hver liste. Plot derefter histogrammet ud, og tag forskellige univariate statistikker. Et mærkeligt, men sjovt projekt, hvis du tog tekster fra forskellige sprog og forskellige tidsperioder. Der er værktøjer i python til at gøre dette. Du har muligvis et par hovedskrabemomenter om, hvordan man tænker på UTF-8-tegnsæt, da de ikke er kodet i 8 bits, men i 8 bits + 4 bits til accenter, andre alfabeter osv.
I Kinesisk, otoh, der er ca. 1,5 logogram til en enkelt semantisk enhed (“ord”), men hvert logogram er i variabel bytekodning (Big5, Guobiao), så , 200 1-byte (8-bit) enheder oversættes måske til 150 eller deromkring logogrammer, hvilket giver os cirka 100 ord på kinesisk eller cirka 126, hvis du tæller hvert “tegn” som en enkelt enhed. Kodningen af kinesiske tegn på kinesisk, japansk og koreansk er kilden til, err, megen kontrovers .
Svar
200 tegn kan oprette et stort antal ord eller et lille antal ord, afhængigt af hvad du vil gøre med det.
Det længste ord på det engelske sprog anses normalt for at være: antidisestablishmentarianism. Det er 28 tegn langt. Du kunne skrive dette ord 6 gange (168 tegn), og hvis du inkluderer mellemrum mellem hvert ord (5 tegn) og en periode i slutningen (1 tegn), ville din sidste “sætning” være 174 tegn. Hvis du inkluderer endnu et stort ord i sætningen, et ord på 25 tegn, så har du i alt 7 ord, 6 mellemrum og en periode som din “sætning” – i alt 200 tegn.
De korteste ord på det engelske sprog er “a”, “I” og “O”. Så du kan have 100 af disse ord med 99 mellemrum og en periode i slutningen og udfylde 200 tegn. Denne sætning ville have 100 ord.
PS: Ja, jeg ved, at der er tekniske ord meget længere end antidisestablishmentarianism. Men blandt ikke-mønterede, ikke-tekniske ord betragtes det generelt som konge.