Mejor respuesta
En inglés, la longitud media de las palabras es de 5,1 (ASCII de 8 bits) caracteres. Necesita un delimitador de palabras, usemos solo el carácter de espacio. 200 caracteres contendrían 32,8 fragmentos de 6,1 caracteres, incluido el espacio final (que no necesita la última palabra), o 32 fragmentos de 6,1 caracteres y uno de 4,8 caracteres.
Entonces en promedio , 32 palabras completas en inglés moderno en 200 caracteres (ASCII de 8 bits).
Una persona podría tomar un archivo de texto y dividirlo en una lista en ejecución de 200 caracteres, y cuente el número de palabras completas (ya sea que comiencen o terminen una línea, o que terminen en un signo de puntuación o un espacio; hmm, en realidad querría usar 201 caracteres para probar cuál es el último carácter del conjunto, si es una letra, no cuente la palabra, si es un espacio o un signo de puntuación o al final de la línea, entonces hágalo) en cada lista. Luego, trace el histograma y obtenga varias estadísticas univariadas. Un proyecto peculiar pero divertido si tomas textos de diferentes idiomas y diferentes períodos de tiempo. Hay herramientas en Python para hacer esto. Es posible que tenga algunos momentos de rascarse la cabeza sobre cómo pensar en los conjuntos de caracteres UTF-8, ya que no están codificados en 8 bits sino en 8 bits + 4 bits para acentos, otros alfabetos, etc.
En Chino, otoh, hay aproximadamente 1,5 logogramas en una sola unidad semántica («palabra»), pero cada logograma tiene una codificación de bytes variable (Big5, Guobiao), por lo que , 200 unidades de 1 byte (8 bits) podrían traducirse en aproximadamente 150 logogramas, lo que nos da alrededor de 100 palabras en chino, o alrededor de 126 si cuenta cada “carácter” como una sola unidad. La codificación de caracteres chinos en chino, japonés y coreano es fuente de, err, mucha controversia .
Respuesta
200 caracteres pueden crear una gran cantidad de palabras o una pequeña cantidad de palabras, dependiendo de lo que quieras hacer con él.
La palabra más larga en el idioma inglés generalmente se considera: antidisestablishmentarianism. Tiene 28 caracteres. Puede escribir esa palabra 6 veces (168 caracteres), y si incluye espacios entre cada palabra (5 caracteres) y un punto al final (1 carácter), su “oración” final tendrá 174 caracteres. Si incluye una palabra grande más en la oración, una palabra que tiene 25 caracteres de largo, entonces tendrá un total de 7 palabras, 6 espacios y un punto como su «oración», con un total de 200 caracteres.
Las palabras más cortas en el idioma inglés son «a», «I» y «O». Entonces puede tener 100 de esas palabras, con 99 espacios y un punto al final, y llenar 200 caracteres. Esa oración tendría 100 palabras.
PD: Sí, sé que hay palabras técnicas mucho más largas que el antidisestablishmentarianism. Pero entre las palabras no acuñadas y no técnicas, generalmente se considera rey.