Bästa svaret
På engelska är den genomsnittliga ordlängden 5,1 (8-bitars ASCII) tecken. Du behöver en ordavgränsare, låt oss bara använda mellanslagstecknet. 200 tecken skulle innehålla 32,8 bitar med 6,1 tecken, inklusive det bakre utrymmet (som det sista ordet inte behöver), eller 32 bitar med 6,1 tecken och en på 4,8 tecken.
Så i genomsnitt , 32 kompletta moderna engelska ord med 200 (8-bitars ASCII) tecken.
En person kan ta en textfil, dela den i en löpande lista på 200 tecken och räkna antalet kompletta ord (antingen starta eller avsluta en rad, eller sluta med ett skiljetecken eller mellanslag – hmm, du vill faktiskt använda 201 tecken för att testa vad det sista tecknet i uppsättningen är, Om det är en bokstav räknar du inte ordet, om det är ett mellanslag eller skiljetecken eller slutet på raden, gör det) i varje lista. Rita sedan upp histogrammet och ta olika univariata statistik. Ett märkligt men roligt projekt om du tog texter från olika språk och olika tidsperioder. Det finns verktyg i python för att göra detta. Du kan ha några huvudskrapa ögonblick om hur man tänker på UTF-8 teckenuppsättningar, eftersom de är kodade inte i 8 bitar men i 8 bitar + 4 bitar för accenter, andra alfabet etc.
Kinesiska, otoh, det finns ungefär 1,5 logogram till en enda semantisk enhet (“ord”) men varje logogram är i variabel byte-kodning (Big5, Guobiao), så , 200 1-byte (8-bitars) enheter kan översättas till ungefär 150 logogram, vilket ger oss cirka 100 ord på kinesiska, eller cirka 126 om du räknar varje ”tecken” som en enda enhet. Kodningen av kinesiska tecken på kinesiska, japanska och koreanska är källan till, err, mycket kontrovers .
Svar
200 tecken kan skapa ett stort antal ord eller ett litet antal ord, beroende på vad du vill göra med det.
Det längsta ordet på det engelska språket anses vanligtvis vara: antidisestablishmentarianism. Den är 28 tecken lång. Du kan skriva ordet 6 gånger (168 tecken), och om du inkluderar mellanslag mellan varje ord (5 tecken) och en punkt i slutet (1 tecken) skulle din sista ”mening” vara 174 tecken lång. Om du tar med ytterligare ett stort ord i meningen, ett ord som är 25 tecken långt, har du totalt 7 ord, 6 mellanslag och en punkt som din ”mening” – totalt 200 tecken.
De kortaste orden på engelska är ”a”, ”I” och ”O”. Så du kan ha 100 av något av dessa ord, med 99 mellanslag och en punkt i slutet, och fylla i 200 tecken. Den meningen skulle ha 100 ord.
PS: Ja, jag vet att det finns tekniska ord mycket längre än antidisestablishmentarianism. Men bland icke-myntade, icke-tekniska ord anses det i allmänhet kung.