Кодирование текстовой информации

 Начиная с конца 60-х годов компьютеры все больше стали использоваться для обработки текстовой информации, и в настоящее время основная доля персональных компьютеров в мире (и большая часть времени) занята обработкой именно текстовой информации.
 Современный компьютер может обрабатывать числовую, текстовую, графическую, звуковую и видео информацию. Все эти виды информации в компьютере представлены в двоичном коде, т. е. используется алфавит мощностью два (всего два символа 0 и 1). Связано это с тем, что удобно представлять информацию в виде последовательности электрических импульсов: импульс отсутствует (0), импульс есть (1). Такое кодирование принято называть двоичным, двоичным, а сами логические последовательности нулей и единиц -машинным языком, машинным языком. 
Традиционно для кодирования одного символа используется количество информации, равное 1 байту, т. е. / = 1 байт = 8 бит. При помощи формулы, которая связывает между собой количество возможных событий К и количество информации I, можно вычислить сколько различных символов можно закодировать (считая, что символы - это возможные события):

  К = 2I = 28 = 256, К = 2I = 28 = 256,

  т. е. для представления текстовой информации можно использовать алфавит мощностью 256 символов.
 Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 , уникальный десятичный код от 0 до 255  или соответствующий ему двоичный код от 00000000 до 11111111. Таким образом, человек различает символы по их начертанию, а компьютер — по их коду.

Кодирование текстовой информации

Просмотры

Персональные инструменты

Навигация

Поиск

Инструменты