Melhor resposta
Em inglês, o comprimento médio das palavras é de 5,1 (ASCII de 8 bits) caracteres. Você precisa de um delimitador de palavra, vamos apenas usar o caractere de espaço. 200 caracteres conteriam 32,8 blocos de 6,1 caracteres, incluindo o espaço à direita (que a última palavra não precisa), ou 32 blocos de 6,1 caracteres e um de 4,8 caracteres.
Portanto, em média , 32 palavras completas em inglês moderno em 200 caracteres (ASCII de 8 bits).
Uma pessoa poderia pegar um arquivo de texto e dividi-lo em uma lista de execução de 200 caracteres e conte o número de palavras completas (começando ou terminando uma linha, ou terminando em um sinal de pontuação ou espaço – hmm, você realmente gostaria de usar 201 caracteres para testar qual é o último caractere do conjunto, se for uma letra, não conte a palavra, se for um espaço ou sinal de pontuação ou fim de linha, conte) em cada lista. Em seguida, trace o histograma e obtenha várias estatísticas univariadas. Um projeto peculiar, mas divertido, se você pegar textos de diferentes línguas e diferentes períodos de tempo. Existem ferramentas em python para fazer isso. Você pode ter alguns momentos difíceis sobre como pensar sobre conjuntos de caracteres UTF-8, já que eles são codificados não em 8 bits, mas em 8 bits + 4 bits para acentos, outros alfabetos, etc.
Em Chinês, otoh, existem cerca de 1,5 logogramas para uma única unidade semântica (“palavra”), mas cada logograma está em codificação de byte variável (Big5, Guobiao), então , 200 unidades de 1 byte (8 bits) podem ser traduzidas em 150 ou mais logogramas, nos dando cerca de 100 palavras em chinês, ou cerca de 126 se você contar cada “caractere” como uma única unidade. A codificação de caracteres chineses em chinês, japonês e coreano é a fonte de, err, muita controvérsia .
Resposta
200 caracteres podem criar um grande número de palavras ou um pequeno número de palavras, dependendo do que você deseja fazer com eles.
A palavra mais longa no idioma inglês é geralmente considerada como: antidisestablishmentarianism. Possui 28 caracteres. Você poderia escrever essa palavra 6 vezes (168 caracteres) e, se incluir espaços entre cada palavra (5 caracteres) e um ponto final (1 caractere), sua “frase” final teria 174 caracteres. Se você incluir mais uma palavra grande na frase, uma palavra com 25 caracteres, terá um total de 7 palavras, 6 espaços e um ponto como sua “frase” – totalizando 200 caracteres.
As palavras mais curtas do idioma inglês são “a”, “I” e “O”. Portanto, você pode ter 100 de qualquer uma dessas palavras, com 99 espaços e um ponto final no final, e preencher até 200 caracteres. Essa frase teria 100 palavras.
PS: Sim, eu sei que existem palavras técnicas muito mais longas do que o antidesestabelecimento. Mas entre palavras não inventadas e não técnicas, geralmente é considerado rei.