Nejlepší odpověď
V angličtině je průměrná délka slova 5,1 (8bitový ASCII) znaků. Potřebujete oddělovač slov, stačí použít mezeru. 200 znaků by obsahovalo 32,8 bloků po 6,1 znaku, včetně koncové mezery (kterou poslední slovo nepotřebuje), nebo 32 bloků po 6,1 znaku a jeden ze 4,8 znaků.
Takže v průměru , 32 úplných moderních anglických slov v 200 (8bitových ASCII) znacích.
Osoba si může vzít textový soubor a rozdělit jej na běžící seznam 200 znaků a spočítejte počet celých slov (ať už na začátku nebo na konci řádku, nebo na konci interpunkčního znaménka nebo mezery – hmm, ve skutečnosti byste chtěli použít 201 znaků k otestování posledního znaku v sadě, pokud je to písmeno, pak slovo nepočítejte, pokud je to mezera, interpunkční znaménko nebo konec řádku, pak udělejte) v každém seznamu. Poté vykreslete histogram a proveďte různé jednorozměrné statistiky. Zvláštní, ale zábavný projekt, pokud jste pořídili texty z různých jazyků a různých časových období. V Pythonu jsou k tomu nástroje. Možná budete mít několik okamžiků škrábání hlavy o tom, jak přemýšlet o znakových sadách UTF-8, protože jsou zakódovány ne v 8 bitech, ale v 8 bitech + 4 bitech pro akcenty, jiné abecedy atd.
V Číňané, otoh, přibližně 1,5 logogramu do jedné sémantické jednotky („slovo“), ale každý logogram je kódován v proměnných bajtech (Big5, Guobiao), takže , 200 1bajtových (8bitových) jednotek se může přeložit na přibližně 150 logogramů, což nám dá asi 100 slov v čínštině, nebo asi 126, pokud spočítáte každý „znak“ jako jednu jednotku. Kódování čínských znaků v čínštině, japonštině a korejštině je zdrojem, err, mnoha kontroverzí .
Odpověď
200 znaků může vytvořit velký počet slov nebo malý počet slov podle toho, co s nimi chcete dělat.
Za nejdelší slovo v anglickém jazyce se obvykle považuje: antidisestablishmentarianism. Má 28 znaků. Toto slovo byste mohli napsat 6krát (168 znaků), a pokud mezi každé slovo (5 znaků) a tečku na konci (1 znak) přidáte mezery, měla by vaše poslední „věta“ 174 znaků. Pokud do věty zahrnete ještě jedno velké slovo, slovo o délce 25 znaků, měli byste jako „větu“ celkem 7 slov, 6 mezer a tečku – celkem 200 znaků.
Nejkratší slova v anglickém jazyce jsou „a“, „I“ a „O“. Můžete tedy mít 100 kteréhokoli z těchto slov, s 99 mezerami a tečkou na konci, a vyplnit 200 znaků. Ta věta by měla 100 slov.
PS: Ano, vím, že existují technická slova mnohem déle než antidisstitucionářství. Ale mezi neinformovanými a netechnickými slovy je obecně považován za krále.