Câte cuvinte sunt 200 de caractere?


Cel mai bun răspuns

În engleză, lungimea medie a cuvântului este de 5,1 (ASCII pe 8 biți). Aveți nevoie de un delimitator de cuvinte, să folosim doar caracterul spațial. 200 de caractere ar conține 32,8 bucăți de 6,1 caractere, inclusiv spațiul final (de care ultimul cuvânt nu are nevoie) sau 32 de bucăți de 6,1 caractere și unul de 4,8 caractere.

Deci în medie , 32 de cuvinte în limba engleză completă completă în 200 de caractere (ASCII pe 8 biți).

O persoană ar putea lua un fișier text, împărțindu-l într-o listă în curs de 200 de caractere și numărați numărul de cuvinte complete (începând sau terminând o linie sau terminând cu un semn de punctuație sau un spațiu – hmm, ați dori să utilizați 201 caractere pentru a testa care este ultimul caracter din set, dacă este o literă, nu numărați cuvântul, dacă este un spațiu sau un semn de punctuație sau un sfârșit de linie, atunci faceți) în fiecare listă. Apoi trageți histograma și luați diferite statistici univariate. Un proiect ciudat, dar distractiv, dacă ai luat texte din diferite limbi și perioade de timp diferite. Există instrumente în python pentru a face acest lucru. S-ar putea să aveți câteva momente de zgârieturi ale capului despre cum să vă gândiți la seturile de caractere UTF-8, deoarece acestea sunt codate nu în 8 biți, ci în 8 biți + 4 biți pentru accente, alte alfabete etc.

În Chineză, otoh, există aproximativ 1,5 logograme la o singură unitate semantică („cuvânt”), dar fiecare logogramă este în codare de octet variabil (Big5, Guobiao), deci , 200 de unități de 1 octeți (8 biți) s-ar putea traduce în aproximativ 150 de logograme, oferindu-ne aproximativ 100 de cuvinte în chineză sau aproximativ 126 dacă numărați fiecare „caracter” ca o singură unitate. Codificarea caracterelor chinezești în chineză, japoneză și coreeană este sursa, greșeală, multă controversă .

Răspuns

200 de caractere pot crea un număr mare de cuvinte sau un număr mic de cuvinte, în funcție de ceea ce doriți să faceți cu el.

Cel mai lung cuvânt în limba engleză este de obicei considerat a fi: antidisestablishmentarianism. Are 28 de caractere. Ați putea scrie acel cuvânt de 6 ori (168 de caractere), iar dacă includeți spații între fiecare cuvânt (5 caractere) și o perioadă la sfârșit (1 caracter), „propoziția” finală ar avea 174 de caractere. Dacă mai includeți un cuvânt mare în propoziție, un cuvânt cu o lungime de 25 de caractere, atunci veți avea în total 7 cuvinte, 6 spații și o perioadă ca „propoziție” – în total 200 de caractere.

Cele mai scurte cuvinte în limba engleză sunt „a”, „I” și „O”. Deci, puteți avea 100 din oricare dintre aceste cuvinte, cu 99 de spații și o perioadă la sfârșit, și completați 200 de caractere. Această propoziție ar avea 100 de cuvinte.

PS: Da, știu că există cuvinte tehnice mult mai lungi decât antidistribuirea. Însă, printre cuvintele non-inventate, non-tehnice, este în general considerat rege.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *