Задача Измерение текстовой информации

Каждый символ в Unicode закодирован двухбайтным словом. Оцените информационный объем следующего предложения в этой кодировке: «Без труда не вытащишь рыбку из пруда.»

1) 37 бит

2) 592 бита

3) 37 байт

4) 592 байта

Решение:

 

 

Длина фразы составляет примерно 40 символов. Следовательно, ее объем можно приблизительно оценить в 40 × 2 = 80 байт. Такого варианта ответа нет, попробуем перевести результат в биты: 80 байт × 8 = 640 бит. Наиболее близкое значение из предложенных – 592 бита. Заметим, что разница между 640 и 592 составляет всего 48/16 = 3 символа в заданной кодировке и его можно считать несущественным по сравнению с длиной строки.

Ответ: вариант 2 (592 бита).

Замечание: Подсчетом символов в строке можно убедиться, что их ровно 37 (включая точку и пробелы), поэтому оценка 592 бита = 74 байта, что соответствует ровно 37 символам в двухбайтовой кодировке, является точной.

При выполнении подобных заданий следует пользоваться формулой алфавитного подхода к измерению количества информации


Лекция добавлена 10.09.2013 в 10:15:04