ベストアンサー
英語では、平均単語長は5.1(8ビットASCII)文字です。単語の区切り文字が必要です。スペース文字だけを使用しましょう。 200文字には、末尾のスペース(最後の単語は不要)を含む6.1文字の32.8チャンク、または6.1文字の32チャンクと4.8文字の1つが含まれます。
つまり、平均、200(8ビットASCII)文字の32の完全な現代英語単語。
人はテキストファイルを取得して、実行リストに分割できます。 200文字で、完全な単語の数を数えます(行の開始または終了、または句読点またはスペースで終了します—うーん、実際には201文字を使用して、セットの最後の文字が何であるかをテストします。文字の場合は単語を数えないでください。スペース、約物、または行の終わりの場合は、各リストでカウントしてください。次に、ヒストグラムをプロットし、さまざまな単変量統計を取得します。さまざまな言語や期間のテキストを使用した場合の、独特で楽しいプロジェクト。これを行うためのPythonのツールがあります。 UTF-8文字セットは8ビットではなく、アクセントやその他のアルファベットなどのために8ビット+ 4ビットでエンコードされているため、UTF-8文字セットの考え方について頭を悩ませる瞬間があるかもしれません。
In中国語、otoh、単一のセマンティックユニット(「ワード」)に対して約1.5の表語文字がありますが、各表語文字は可変バイトエンコーディング(Big5、Guobiao)であるため、 、200個の1バイト(8ビット)単位は150程度の表語文字に変換され、中国語で約100語、または各「文字」を1つの単位として数えると約126個になります。中国語、日本語、韓国語での中国語の文字のエンコードは、多くの論争の原因です。
回答
200文字は、何をしたいかに応じて、多数の単語または少数の単語を作成できます。
英語で最も長い単語は、通常、反国教会廃止主義と見なされます。長さは28文字です。その単語を6回(168文字)書くことができ、各単語の間にスペース(5文字)と最後のピリオド(1文字)を含めると、最終的な「文」は174文字の長さになります。文章にもう1つの大きな単語、つまり25文字の単語を含めると、「文章」として合計7単語、6スペース、ピリオドが含まれ、合計200文字になります。
英語で最も短い単語は「a」、「I」、「O」です。したがって、99個のスペースと末尾にピリオドを付けて、これらの単語を100個持つことができ、200文字を埋めることができます。その文は100語になります。
追記:はい、反国教会廃止主義よりもはるかに長い専門用語があることを私は知っています。しかし、造語ではなく、技術的ではない言葉の中で、それは一般的に王と見なされます。