Информационный объём фрагмента текста (8 класс)

Вам известно, что информационный объём I сообщения равен произведению количества К символов в сообщении на информационный вес i символа алфавита: I =К • i.

В зависимости от разрядности используемой кодировки информационный вес символа текста, создаваемого на компьютере, может быть равен:

  • 8 битов (1 байт)- восьмиразрядная кодировка;
  • 16 битов (2 байта) — шестнадцатиразрядная кодировка.

Информационным объёмом фрагмента текста будем называть количество битов, байтов или производных единиц (килобайтов, мегабайтов и т. д.), необходимых для записи этого фрагмента заранее оговорённым способом двоичного кодирования.

Задача 1.
Считая, что каждый символ кодируется одним байтом, определите, чему равен информационный объём следующего высказывания Жан-Жака Руссо:
Тысячи путей ведут к заблуждению, к истине — только один.

Решение:
В данном тексте 57 символов (с учётом знаков препинания и пробелов). Каждый символ кодируется одним байтом. Следовательно, информационный объём всего текста — 57 байтов.

Ответ: 57 байтов.

Задача 2.
В кодировке Unicode на каждый символ отводится два байта. Определите информационный объём слова из 24 символов в этой кодировке.

Решение:
I = 24 • 2 = 48 (байтов).

Ответ: 48 байтов.

Задача 3.
Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 8-битовом коде, в 16-битовую кодировку Unicode. При этом информационное сообщение увеличилось на 2048 байтов. Каков был информационный объём сообщения до перекодировки?

Решение:
Информационный вес каждого символа в 16-битовой кодировке в два раза больше информационного веса символа в 8-битовой кодировке. Поэтому при перекодировании исходного блока информации из 8-битовой кодировки в 16-битовую его информационный объём должен был увеличиться вдвое, другими словами, на величину, равную исходному информационному объёму. Следовательно, информационный объём сообщения до перекодировки составлял 2048 байтов = 2 Кб.

Ответ: 2 Кб.

Задача 4.
Выразите в мегабайтах объём текстовой информации в «Современном словаре иностранных слов» из 740 страниц, если на одной странице размещается в среднем 60 строк по 80 символов (включая пробелы). Считайте, что при записи использовался алфавит мощностью 256 символов.

Решение:
Информационный вес символа алфавита мощностью 256 равен восьми битам (одному байту). Количество символов во всём словаре равно 7 40 • 80 • 60 = 3 552 000. Следовательно, объём этого текста в байтах равен 3 552 000 байтов = 3 468,75 Кбайт ≈ 3,39 Мбайт.

Ответ: 3,39 Мбайт.

Самое главное:

  • В зависимости от разрядности используемой кодировки информационный вес символа текста, создаваемого на компьютере, может быть равен:
    • 8 битов (1 байт) — восьмиразрядная кодировка;
    • 16 битов (2 байта) — шестнадцатиразрядная кодировка.
  • Информационный объём фрагмента текста — это количество битов, байтов (килобайтов, мегабайтов), необходимых для записи фрагмента оговорённым способом кодирования.

Вопросы и задания:

  1. Считая, что каждый символ кодируется одним байтом, определите, чему равен информационный объём следующего высказывания Алексея Толстого:
    Не ошибается тот, кто ничего не делает, хотя это и есть его основная ошибка.
    1) 512 битов 2) 608 битов 3) 8 Кбайт 4) 123 байта
    (Всего символов в высказывании — 76. Поскольку на один символ отводится 1 байт, то объем высказывания равен 76 (байт) = 608 (бит). Правильный ответ: 2)
  2. Считая, что каждый символ кодируется 16 битами, оцените информационный объем следующей фразы А. С. Пушкина в кодировке Unicode:
    Привычка свыше нам дана: Замена счастию она.
    1) 44 бита 2) 704 бита 3) 44 байта 4) 704 байта
    (Всего символов во фразе — 44. Поскольку на один символ отводится 2 байта, то объем высказывания равен 88 (байт) = 704 (бит). Правильный ответ: 2)
  3. В текстовом режиме экран монитора компьютера обычно разбивается на 25 строк по 80 символов в строке. Определите объём текста, занимающего весь экран монитора, в кодировке Unicode.
    (Решение:
    В кодировке Unicode каждый символ кодируется 2 байтами. На экран влезает 25 • 80 = 2000 символов. Соответственно, объем текста равен 2000 • 2 = 4000 (байт) ≈ 3,9 (Кбайт)
    Ответ: 4000 байт)
  4. Сообщение занимает 6 страниц по 40 строк, в каждой строке записано по 60 символов. Информационный объём всего сообщения равен 28 800 байтам. Сколько двоичных разрядов было использовано на кодирование одного символа?
    (Решение:
    Сообщение состоит из 6 • 40 • 20 = 14400 символов. Поскольку объем этого текста составляет 28800 байт, то на один символ отводилось 2 байта, т.е. 16-разрядный двоичный код. Текст записан в кодировке Unicode.
    Ответ: 16 разрядов)
  5. Сообщение, информационный объём которого равен 5 Кбайт, занимает 4 страницы по 32 строки, в каждой из которых записано по 40 символов. Сколько символов в алфавите языка, на котором записано это сообщение?
    (Решение:
    I = 5 Кбайт
    K = 4 • 32 • 40
    N = ?N = 2i; I = K • i
    i = I/K, i = (5 • 210 • 23)/(22 • 25 • 23 • 5), i = 23 = 8
    N = 28 = 256
    Ответ: 256 символов в алфавите)

Содержание