Beste Antwort
Auf Englisch beträgt die durchschnittliche Wortlänge 5,1 (8-Bit-ASCII) Zeichen. Sie benötigen ein Worttrennzeichen. Verwenden Sie einfach das Leerzeichen. 200 Zeichen würden 32,8 Blöcke mit 6,1 Zeichen enthalten, einschließlich des nachgestellten Leerzeichens (das das letzte Wort nicht benötigt), oder 32 Blöcke mit 6,1 Zeichen und eines von 4,8 Zeichen.
Also durchschnittlich , 32 vollständige moderne englische Wörter in 200 (8-Bit-ASCII) Zeichen.
Eine Person könnte eine Textdatei nehmen und in eine laufende Liste aufteilen mit 200 Zeichen und zählen Sie die Anzahl der vollständigen Wörter (entweder am Anfang oder am Ende einer Zeile oder endend mit einem Satzzeichen oder Leerzeichen – hmm, Sie möchten tatsächlich 201 Zeichen verwenden, um zu testen, was das letzte Zeichen im Satz ist. Wenn es sich um einen Buchstaben handelt, zählen Sie das Wort nicht. Wenn es sich um ein Leerzeichen, ein Interpunktionszeichen oder ein Zeilenende handelt, tun Sie dies in jeder Liste. Zeichnen Sie dann das Histogramm und erstellen Sie verschiedene univariate Statistiken. Ein eigenartiges, aber lustiges Projekt, wenn Sie Texte aus verschiedenen Sprachen und Zeiträumen aufgenommen haben. Dafür gibt es in Python Tools. Möglicherweise haben Sie einige Momente, in denen Sie sich Gedanken über UTF-8-Zeichensätze machen müssen, da diese nicht in 8 Bit, sondern in 8 Bit + 4 Bit für Akzente, andere Alphabete usw. codiert sind.
In Chinesisch, otoh, es gibt ungefähr 1,5 Logogramme für eine einzelne semantische Einheit („Wort“), aber jedes Logogramm ist in variabler Bytecodierung (Big5, Guobiao) 200 8-Bit-Einheiten (1 Byte) können in etwa 150 Logogramme übersetzt werden, was ungefähr 100 Wörter auf Chinesisch ergibt, oder ungefähr 126, wenn Sie jedes „Zeichen“ als eine Einheit zählen. Die Kodierung chinesischer Schriftzeichen in Chinesisch, Japanisch und Koreanisch ist die Ursache für viele Kontroversen .
Antwort
200 Zeichen können eine große Anzahl von Wörtern oder eine kleine Anzahl von Wörtern erzeugen, je nachdem, was Sie damit machen möchten.
Das längste Wort in der englischen Sprache wird normalerweise als: Antidisestablishmentarianism angesehen. Es ist 28 Zeichen lang. Sie können dieses Wort 6 Mal schreiben (168 Zeichen). Wenn Sie zwischen jedem Wort (5 Zeichen) und einem Punkt am Ende (1 Zeichen) Leerzeichen einfügen, ist Ihr letzter „Satz“ 174 Zeichen lang. Wenn Sie ein weiteres großes Wort in den Satz aufnehmen, ein Wort mit 25 Zeichen, haben Sie insgesamt 7 Wörter, 6 Leerzeichen und einen Punkt als „Satz“ – insgesamt 200 Zeichen.
Die kürzesten Wörter in der englischen Sprache sind „a“, „I“ und „O“. Sie können also 100 dieser Wörter mit 99 Leerzeichen und einem Punkt am Ende haben und 200 Zeichen ausfüllen. Dieser Satz würde 100 Wörter enthalten.
PS: Ja, ich weiß, dass es technische Wörter gibt, die viel länger sind als Antidisestablishmentarianismus. Aber unter nicht geprägten, nicht technischen Wörtern wird es allgemein als König betrachtet.