Najlepsza odpowiedź
W języku angielskim średnia długość słowa to 5,1 (8-bitowych znaków ASCII) znaków. Potrzebujesz separatora słów, użyjmy po prostu spacji. 200 znaków zawierałoby 32,8 fragmentów po 6,1 znaków, w tym spację na końcu (której ostatnie słowo nie potrzebuje) lub 32 fragmenty po 6,1 znaków i jeden z 4,8 znaków.
Więc , 32 kompletne współczesne angielskie słowa w 200 (8-bitowych ASCII) znakach.
Osoba może pobrać plik tekstowy i podzielić go na wyświetlaną listę 200 znaków i policz liczbę pełnych słów (rozpoczynających lub kończących linię lub kończących się znakiem interpunkcyjnym lub spacją – hmm, tak naprawdę chciałbyś użyć 201 znaków, aby sprawdzić, jaki jest ostatni znak w zestawie, jeśli jest to litera, nie licz słowa, jeśli jest to spacja, znak interpunkcyjny lub koniec linii, wykonaj) na każdej liście. Następnie wykreśl histogram i weź różne statystyki dla jednej zmiennej. Osobliwy, ale zabawny projekt, jeśli wziąłeś teksty z różnych języków i różnych okresów. W Pythonie są do tego narzędzia. Możesz mieć kilka momentów na drapanie głowy, jak myśleć o zestawach znaków UTF-8, ponieważ są one kodowane nie w 8 bitach, ale w 8 bitach + 4 bity dla akcentów, innych alfabetów itp.
W Chiński, otoh, na jedną jednostkę semantyczną („słowo”) przypada około 1,5 logogramu , ale każdy logogram jest kodowany w zmiennym bajcie (Big5, Guobiao), 200 jednobajtowych (8-bitowych) jednostek można przełożyć na około 150 logogramów, co daje nam około 100 słów w języku chińskim lub około 126, jeśli policzyć każdy „znak” jako pojedynczą jednostkę. Kodowanie chińskich znaków w języku chińskim, japońskim i koreańskim jest źródłem, err, wielu kontrowersji .
Odpowiedź
200 znaków może stworzyć dużą liczbę słów lub małą liczbę słów, w zależności od tego, co chcesz z tym zrobić.
Zwykle za najdłuższe słowo w języku angielskim uważa się: antidisestablishmentarianism. Ma 28 znaków. Możesz napisać to słowo 6 razy (168 znaków), a jeśli dodasz spacje między każdym słowem (5 znaków) i kropką na końcu (1 znak), Twoje ostatnie „zdanie” będzie miało 174 znaki. Jeśli umieścisz w zdaniu jeszcze jedno duże słowo, słowo o długości 25 znaków, jako „zdanie” będziesz mieć łącznie 7 słów, 6 spacji i kropkę – łącznie 200 znaków.
Najkrótsze słowa w języku angielskim to „a”, „I” i „O”. Możesz więc mieć 100 takich słów, 99 spacji i kropki na końcu, i wypełnić 200 znaków. To zdanie miałoby 100 słów.
PS: Tak, wiem, że istnieją techniczne słowa o wiele dłuższe niż antydysestablishmentarianizm. Ale wśród nie wymyślonych, nietechnicznych słów jest powszechnie uważany za króla.