Migliore risposta
In inglese, la lunghezza media di una parola è di 5,1 caratteri (ASCII a 8 bit). Hai bisogno di un delimitatore di parole, usiamo solo il carattere spazio. 200 caratteri conterrebbero 32,8 blocchi di 6,1 caratteri, incluso lo spazio finale (di cui lultima parola non ha bisogno) o 32 blocchi di 6,1 caratteri e uno di 4,8 caratteri.
Quindi in media , 32 parole complete in inglese moderno in 200 caratteri (ASCII a 8 bit).
Una persona potrebbe prendere un file di testo, dividerlo in un elenco progressivo di 200 caratteri e conta il numero di parole complete (che iniziano o finiscono una riga o terminano con un segno di punteggiatura o uno spazio – hmm, in realtà vorresti usare 201 caratteri per verificare qual è lultimo carattere del set, se è una lettera, non contare la parola, se è uno spazio o un segno di punteggiatura o la fine della riga, allora fai) in ogni elenco. Quindi tracciare listogramma e prendere varie statistiche univariate. Un progetto particolare ma divertente se hai preso testi da lingue diverse e periodi di tempo diversi. Ci sono strumenti in Python per farlo. Potresti avere alcuni momenti da grattarsi la testa su come pensare ai set di caratteri UTF-8, poiché sono codificati non in 8 bit ma in 8 bit + 4 bit per accenti, altri alfabeti, ecc.
In Cinese, otoh, ci sono circa 1,5 logogrammi per una singola unità semantica (“parola”) ma ogni logogramma è in codifica byte variabile (Big5, Guobiao), quindi , 200 unità da 1 byte (8 bit) potrebbero tradursi in circa 150 logogrammi, dandoci circa 100 parole in cinese, o circa 126 se contate ogni “carattere” come una singola unità. La codifica dei caratteri cinesi in cinese, giapponese e coreano è allorigine di, err, molte controversie .
Risposta
200 caratteri possono creare un gran numero di parole o un piccolo numero di parole, a seconda di cosa si vuole fare con esso.
La parola più lunga in lingua inglese è solitamente considerata: antidisestablishmentarianism. È lungo 28 caratteri. Potresti scrivere quella parola 6 volte (168 caratteri) e se includi spazi tra ogni parola (5 caratteri) e un punto alla fine (1 carattere), la tua “frase” finale sarebbe lunga 174 caratteri. Se includi unaltra parola grossa nella frase, una parola lunga 25 caratteri, avresti un totale di 7 parole, 6 spazi e un punto come “frase”, per un totale di 200 caratteri.
Le parole più brevi in lingua inglese sono “a”, “I” e “O”. Quindi puoi avere 100 di qualsiasi di queste parole, con 99 spazi e un punto alla fine, e riempire fino a 200 caratteri. Quella frase sarebbe composta da 100 parole.
PS: Sì, lo so che ci sono parole tecniche molto più lunghe dellantidisestablishmentarianism. Ma tra le parole non coniate e non tecniche, è generalmente considerato re.