Категории

Кодирование представляет собой

Кодирование от алкоголизма уколом диклоферама в вену - А. Огородников о кодировании от алкоголизма

Кодирование - это... Знаковые системы: кодирование информации

Кодирование информации - невероятно широкая область знаний. Разумеется, она напрямую связана с развитием цифровой техники. Во многих современных учебных заведениях самая популярная тема - кодирование информации. Сегодня мы изучим основные трактовки этого явления применительно к различным аспектам работы компьютеров. Постараемся ответить на вопрос: "Кодирование - это процесс, метод, инструмент или все эти явления одновременно?"

Нули и единицы

Практически любые типы данных, которые отображаются на экране компьютера, так или иначе представляют собой двоичный код, состоящий из нулей и единиц. Это самый простейший, "низкоуровневый" способ шифрования информации, позволяющий ПК обрабатывать данные. Двоичный код универсален: его понимают все без исключения компьютеры (собственно, для этого он и был создан - чтобы стандартизировать пользование информацией в цифровой форме).

Базовая единица, которую использует двоичное кодирование, - это бит (от словосочетания "binary digit" - "двойная цифра"). Он равен либо 0, либо 1. Как правило, биты по отдельности не используются, а объединяются в 8-значные последовательности - байты. В каждом из них, таким образом, может содержаться до 256 комбинаций из нулей и единиц (2 в 8-й степени). Для записи значительных объемов информации используются, как правило, не единичные байты, а более масштабные величины - с приставками "кило", "мега", "гига", "тера" и т. д., каждая из которых в 1000 раз больше предыдущей.

Кодирование текста

Самый распространенный вид цифровых данных - это текст. Каким образом осуществляется его кодирование? Это достаточно легко объяснимый процесс. Буква, знак препинания, цифра или символ может кодироваться посредством одного или нескольких байтов, то есть компьютер видит их как уникальную последовательность нулей и единиц, а затем, в соответствии с заложенным алгоритмом распознавания, отображает на экране. Есть два основных мировых стандарта "шифрования" компьютерного текста - ASCII и UNICODE.

В системе ASCII каждый знак кодируется только одним байтом. То есть посредством этого стандарта можно "зашифровать" до 256 знаков - что более чем достаточно для отображения символов большинства алфавитов мира. Конечно, все существующие на сегодня национальные буквенные системы не поместятся в этот ресурс. Поэтому для каждого алфавита создана собственная "подсистема" шифрования. Происходит кодирование информации с помощью знаковых систем, адаптированных к национальным образцам письменности. Однако каждая из этих систем, в свою очередь, является составной частью глобального стандарта ASCII, принятого на международном уровне.

В рамках системы ASCII этот самый ресурс из 256 знаков делится на две части. Первые 128 - это символы, отведенные под английский алфавит (буквы от a до z), а также цифры, основные знаки препинания и некоторые другие символы. Вторые 128 байт зарезервированы, в свою очередь, под национальные буквенные системы. Это и есть "подсистема" для неанглийских алфавитов - русского, хинди, арабского, японского, китайского и многих других.

Каждая из них представлена в виде отдельной таблицы кодировки. То есть может получиться (и, как правило, это происходит) так, что одна и та же последовательность битов будет отвечать за разные буквы и символы в двух отдельных "национальных" таблицах. Более того, в связи с особенностями развития IT-сферы в разных странах даже они отличаются. Например, для русского языка наиболее распространены две системы кодирования: Windows-1251 и KOI-8. Первая появилась позже (равно как и сама созвучная ей операционная система), но теперь многими IT-специалистами используется в первоочередном порядке. Поэтому компьютер, чтобы на нем можно было гарантированно читать русский текст, должен уметь корректно распознавать обе таблицы. Но, как правило, никаких проблем с этим нет (если на ПК стоит современная операционная система).

Методы кодирования текстов все время совершенствуются. Кроме "однобайтной" системы ASCII, способной оперировать только 256 значениями для символов, есть также и "двухбайтная" система UNICODE. Несложно подсчитать, что она позволяет осуществлять текстовое кодирование в количестве, равном 2 в 16-й степени, то есть 65 тыс. 536. В ней, в свою очередь, есть ресурсы для одновременного кодирования практических всех существующих национальных алфавитов мира. Использование UNICODE не менее распространено, чем задействование "классического" стандарта ASCII.

Кодирование графики

Выше мы определили, каким образом "шифруются" тексты и как при этом используются байты. Как обстоит дело с цифровыми фотографиями и картинками? Также довольно просто. Аналогично тому, как это происходит с текстом, главную роль в кодировании компьютерной графики играют все те же байты.

Процесс построения цифровых изображений в целом схож с механизмами, на основе которых работает телевизор. На экране ТВ, если приглядеться, картинка состоит из множества отдельных точек, которые в совокупности формируют распознаваемые на некотором расстоянии глазом фигуры. Телевизионная матрица (или ЭЛТ-проектор) получает из передатчика горизонтальные и вертикальные координаты каждой из точек и постепенно выстраивает изображение. Компьютерный принцип кодировки графики работает точно так же. "Шифрование" изображений байтами основано на задании каждой из экранных точек соответствующих координат (а также цвета каждой из них). Это если говорить простым языком. Разумеется, графическое кодирование - это процесс намного более сложный, чем то же текстовое.

Метод задания точкам соответствующих координат и цветовых параметров называется "растровым". Аналогично именуются многие файловые форматы компьютерной графики. Координаты каждой из точек изображения, а также их цвет записываются в один или несколько байтов. От чего зависит их количество? Главным образом от того, сколько оттенков цвета предстоит "зашифровывать". Один байт, как известно, - это 256 значений. Если для выстраивания картинки нам хватит такого количества оттенков - обойдемся этим ресурсом. В частности, в нашем распоряжении может оказаться 256 оттенков серого цвета. И этого будет достаточно, чтобы кодировать практически любые черно-белые изображения. В свою очередь, для цветных изображений данного ресурса будет явно недостаточно: человеческий глаз, как известно, способен различать до нескольких десятков миллионов цветов. Поэтому необходим "запас" не в 256 значений, а в сотни тысяч раз больше. Отчего для кодирования точек задействуется не один байт, а несколько: по существующим на сегодня стандартам их может быть 16 (можно "зашифровать" 65 тыс. 536 цветов) или 24 (16 млн 777 тыс. 216 оттенков).

В отличие от текстовых стандартов, многообразие которых сопоставимо с количеством мировых языков, с графикой дела обстоят несколько проще. Самые распространенные форматы файлов (такие как JPEG, PNG, BMP, GIF и т. д.) распознаются на большинстве компьютеров в целом одинаково хорошо.

Нет ничего сложного с тем, чтобы понять, по каким принципам осуществляется кодирование графической информации. 9 класс любой средней российской школы, как правило, включает в себя курс компьютерной науки, где подобные технологии раскрываются довольно подробно очень простым и понятным языком. Есть также и специализированные программы обучения для взрослых - их организуют вузы, лицеи, либо также школы.

Поэтому современному российскому человеку есть где почерпнуть знания о кодах, имеющих практическую значимость в части компьютерной графики. А если хочется ознакомиться с базовыми знаниями самостоятельно, можно обзавестись доступными учебными материалами. К таковым можно отнести, к примеру, главу "Кодирование графической информации (9 класс, учебник "Информатика и ИКТ" под авторством Угринович Н. Д.).

Кодирование звуковых данных

Компьютер регулярно используется для прослушивания музыки и других аудиофайлов. Так же как и в случае с текстом и графикой, любой звук на ПК - это все те же байты. Они, в свою очередь, "дешифруются" аудиокартой и иными микросхемами и преобразуются в слышимый звук. Принцип здесь примерно тот же, что и в случае с пластинками граммофона. В них, как известно, каждый звук соответствует микроскопической бороздке на пластике, которая распознается считывателем, а затем озвучивается. В компьютере все похоже. Только роль бороздок играют байты, в природе которых, так же как и в случае с текстом и картинками, лежит двоичное кодирование.

Если в случае с компьютерными изображениями единичным элементом выступает точка, то при записи звука это так называемый "отсчет". В нем, как правило, прописывается два байта, генерирующих до 65 тыс. 536 звуковых микроколебаний. Однако, в отличие от того, как это происходит при построении изображений, для улучшения качества звука осуществляется не добавление дополнительных байтов (их, очевидно, и так более чем достаточно), а увеличение количества "отсчетов". Хотя в некоторых аудиосистемах байтов используется и меньшее, и большее число. Когда осуществляется кодирование звука, то стандартной единицей измерения "плотности потока" байтов выступает одна секунда. То есть микроколебания, зашифрованные при помощи 8 тыс. отсчетов в секунду, будут, очевидно, более низкого качества, чем последовательность звуков, закодированных посредством 44 тыс. "отсчетов".

Международная стандартизация аудиофайлов, так же как и в случае с графикой, хорошо развита. Есть несколько типовых форматов звукового медиа - MP3, WAV, WMA, которыми пользуются во всем мире.

Кодирование видео

Своего рода "гибридная схема", при которой шифрование звука объединяется с кодированием картинок, используется в компьютерных видеороликах. Обычно фильмы и клипы состоят из двух типов данных - это как таковой звук и сопутствующий ему видеоряд. Как "шифруется" первый компонент, мы рассказали выше. Со вторым чуть сложнее. Принципы здесь иные, чем включает в себя рассмотренное выше графическое кодирование. Но благодаря универсальности "концепции" байтов, суть механизмов вполне понятна и логична.

Вспомним, как устроена кинопленка. Она представляет собой не что иное как последовательность отдельных кадров (их, как правило, 24). Совершенно аналогичным образом устроены компьютерные видеоролики. Каждый кадр - это картинка. О том, как она строится при помощи байтов, мы определили выше. В свою очередь, в видеоряде присутствует определенная область кода, позволяющая связывать отдельные кадры между собой. Своего рода цифровой заменитель кинопленки. Отдельной единицей измерения видеопотока (аналогичной точкам для картинок и отсчетам для звука, как и в "пленочном" формате кино и роликов), принято считать кадр. Последних в одной секунде, в соответствии с принятыми стандартами, может быть 25 или 50.

Так же как и в случае с аудио, есть распространенные международные стандарты видеофайлов - MP4, 3GP, AVI. Производители кино и роликов стараются выпускать образцы медиа, совместимые с как можно большим количеством компьютеров. Указанные форматы файлов - в числе самых популярных, они открываются практически на любом современном ПК.

Сжатие данных

Хранение компьютерных данных осуществляется на различных носителях - дисках, флешках и т. д. Как мы уже сказали выше, байты, как правило, "обрастают" приставками "мега", "гига", "тера" и т. д. В некоторых случаях величина закодированных файлов такова, что разместить их при имеющихся ресурсах на диске невозможно. Тогда используются различного рода методы сжатия данных. Они, по сути, также представляют собой кодирование. Это - еще одна возможная трактовка термина.

Существует два основных механизма сжатия данных. По первому из них последовательность битов записывается в "упакованном" виде. То есть компьютер не может прочитать содержимое файлов (воспроизвести его как текст, картинку или видео), если не осуществит процедуру "распаковки". Программа, которая выполняет сжатие данных таким способом, называется архиватор. Принцип ее работы достаточно прост. Архивацию данных как один из самых популярных методов, при помощи которых можно осуществить кодирование информации, информатика школьного уровня изучает в обязательном порядке.

Как мы помним, процесс "шифрования" файлов в байтах стандартизован. Возьмем стандарт ASCII. Чтобы, скажем, зашифровать слово "привет", нам понадобится 6 байт, исходя из количества букв. Именно столько пространства файл с этим текстом займет на диске. Что будет, если мы напишем слово "привет" 100 раз подряд? Ничего особенного - для этого нам понадобится 600 байт, соответственно, столько же места на диске. Однако мы можем использовать архиватор, что создаст файл, в котором посредством гораздо меньшего количества байт будет "зашифрована" команда, выглядящая примерно так: "привет умножить на 100". Подсчитав количество букв в этом сообщении, приходим к выводу, что для записи такого файла нам понадобится всего лишь 19 байт. И столько же места на диске. При "распаковке" же архивного файла происходит "дешифрование", и текст приобретает исходный вид со "100 приветами". Таким образом, используя специальную программу, которая задействует особый механизм кодирования, мы можем сэкономить на диске существенный объем пространства.

Вышеописанный процесс достаточно универсален: какие бы ни использовались знаковые системы, кодирование информации с целью сжатия всегда возможно посредством архивации данных.

Что представляет собой второй механизм? В какой-то мере он схож с тем, что применяется в архиваторах. Но принципиальное его отличие в том, что сжатый файл вполне может отображаться компьютером без процедуры "распаковки". Как работает этот механизм?

Как мы помним, в исходном виде слово "привет" занимает 6 байт. Однако мы можем пойти на хитрость и записать его так: "првт". Выходит 4 байта. Все, что остается сделать - это "научить" компьютер добавлять в процессе отображения файла те буквы, которые мы убрали. Надо сказать, что на практике "учебный" процесс организовывать и не нужно. Базовые механизмы распознавания недостающих символов заложены в большинстве современных программ для ПК. То есть основная часть файлов, с которыми мы имеем дело каждый день, так или иначе уже "зашифрована" по этому алгоритму.

Безусловно, есть и "гибридные" системы кодирования информации, позволяющие осуществлять сжатие данных при одновременном задействовании обоих вышеописанных подходов. И они, скорее всего, будут еще более эффективны с точки зрения экономии дискового пространства, чем каждый по отдельности.

Конечно, оперируя словом "привет", мы изложили лишь основные принципы работы механизмов сжатия данных. В реальности они гораздо сложнее. Различные системы кодирования информации могут предлагать невероятно сложные механизмы "компрессии" файлов. Однако мы видим, за счет чего можно добиться экономии дискового пространства, практически не прибегая к ухудшению качества информации на ПК. Особенно значима роль сжатия данных при использовании картинок, аудио и видео - эти виды данных более других требовательны к ресурсам диска.

Какие еще бывают "коды"?

Как мы уже сказали в самом начале, кодирование - это сложносоставное явление. Разобравшись с базовыми принципами кодирования цифровых данных, основанных на байтах, мы можем затронуть другую область. Связана она с использованием компьютерных кодов в несколько иных значениях. Здесь под "кодом" мы будем понимать не последовательность нулей и единиц, а совокупность различных букв и символов (которые, как мы уже знаем, и так сделаны из 0 и 1), имеющую практическую значимость для жизни современного человека.

Программный код

В основе работы любой компьютерной программы - код. Написан он на языке, понятном компьютеру. ПК, расшифровывая код, выполняет те или иные команды. Отличительная особенность компьютерной программы от другого типа цифровых данных в том, что содержащийся в ней код способен "дешифровать" себя сам (пользователю лишь достаточно запустить этот процесс).

Еще одна особенность программ - в относительной гибкости используемого кода. То есть давать компьютеру одни и те же задания человек может, пользуясь достаточно большим набором "фраз", а при необходимости - и на другом языке.

Код разметки документов

Другая практически значимая область применения буквенного кода - создание и форматирование документов. Как правило, простого отображения знаков на экране недостаточно с точки зрения практической значимости пользования ПК. В большинстве случаев текст должен быть построен при помощи шрифта определенного цвета и размера, сопровождаться дополнительными элементами (такими как, например, таблицы). Все эти параметры задаются, так же как и в случае с программами, на особых языках, понятных компьютеру. ПК, распознав "команды", отображает документы именно так, как желает пользователь. Кроме того, тексты могут быть одинаково отформатированы, подобно тому, как это происходит с программами, при помощи различных наборов "фраз" и даже на разных языках.

Однако есть принципиальное отличие между кодами для документов и компьютерных программ. Оно состоит в том, что первые не способны дешифровать себя сами. Для открытия файлов с отформатированными текстами всегда требуются сторонние программы.

Шифрование данных

Еще одна интерпретация термина "код" применительно к компьютерам - это шифрование данных. Выше мы употребляли это слово как синоним термину "кодирование", и это допустимо. В данном случае под шифрованием мы будем понимать иного рода явление. А именно кодирование цифровых данных с целью запрещения к ним доступа со стороны других людей. Защита компьютерных файлов - важнейшее направление деятельности в IT-сфере. Это фактически отдельная научная дисциплина, ее включает в себя также и школьная информатика. Кодирование файлов с целью пресечения несанкционированного доступа - это задача, важность которой излагается гражданам современных стран уже в детстве.

Как устроены механизмы, с помощью которых осуществляется шифрование данных? В принципе, так же просто и понятно, как и все предыдущие, рассмотренные нами. Кодирование - это процесс, легко объяснимый с точки зрения базовых принципов логики.

Предположим, нам необходимо передать сообщение "Иванов идет к Петрову" так, чтобы никто не смог его прочитать. Мы доверяем зашифровать сообщение компьютеру и видим результат: "10-3-1-15-16-3-10-5-7-20-11-17-6-20-18-3-21". Этот код, конечно, весьма нехитрый: каждая цифра соответствует порядковому номеру букв нашей фразы в алфавите. "И" стоит на 10 месте, "В" - на 3, "А" - на 1, и т. д. Но современные компьютерные системы кодирования могут шифровать данные так, что подобрать к ним ключ будет невероятно сложно.


Как выглядеть моложе: лучшие стрижки для тех, кому за 30, 40, 50, 60

Девушки в 20 лет не волнуются о форме и длине прически. Кажется, молодость создана для экспериментов над внешностью и дерзких локонов. Однако уже посл...

Волосы

Что происходит с организмом человека, который не занимается сексом?

Секс – почти такая же базовая потребность, как и приём пищи. По крайней мере, начав им заниматься, вы уже не остановитесь. Даже если вы придерживаетес...

Сексуальность

До ужаса красивы:15 шокирующих пластических операций, завершившихся плачевно

Пластическая хирургия среди звезд остается невероятно популярной и по сей день. Но проблема в том, что раньше результат не всегда оказывался идеальным...

Пластическая хирургия

13 признаков, что у вас самый лучший муж

Мужья – это воистину великие люди. Как жаль, что хорошие супруги не растут на деревьях. Если ваша вторая половинка делает эти 13 вещей, то вы можете с...

Брак

10 интересных фактов об интимной близости, о которых вы наверняка не знали

Ознакомьтесь с наиболее интересными и впечатляющими фактами о сексуальной активности, которые вас удивят....

Сексуальность

Если у вас есть один из этих 11 признаков, тогда вы один из самых редких людей на Земле

Каких людей можно отнести к категории редких? Это личности, которые не размениваются по мелочам. Их взгляд на мир отличается широтой....

Новый век

Похожие статьи

Источник: http://fb.ru/article/156175/kodirovanie---eto-znakovyie-sistemyi-kodirovanie-informatsii

Кодирование товаров

1.2.1. Кодирование сообщений

Процесс передачи информации заключается в том, что сооб­щения преобразуются в сигналы и по системе связи передаются получателю. Получатель, зная закон соответствия между сообще­ниями и сигналами, может извлечь содержащуюся в сообщении ин­формацию. Для верного декодирования каждому сигналу должно соответствовать одно определенное сообщение.

Преобразование сообщений в сигналы осуществляется с по­мощью кодирования и модуляции. Кодирование представляет собой отображение дискретных сообщений последовательностью символов позиционной системы счисления.

Последовательность символов, сопоставляемая одному эле­ментарному сообщению (букве, знаку и т.д.) называется кодовой комбинацией. Систему правил преобразования элементарных сооб­щений в кодовые комбинации называют кодом. Основание использу­емой системы счисления называют основанием кода. Как правило, первичные коды задаются в виде таблиц.

При выборе основания системы счисления учитывают простоту, удобство и экономичность реализации цифрового представления информации в системе, ее преобразований и передачи по каналам связи. Наибольшее применение в технике передачи дискретной информации нашли колы с основанием 2, которые называются двоичными или бинарными. Поэтому в дальнейшем во всех случаях, где это не будет оговорено, рассматриваются двоичные коды. Символы двоичных кодов единица (1) и нуль (0) называются еди­ничными элементами. Количество единичных элементов, образующих кодовую комбинацию, называется длиной кодовой комбинации.

Кодирование сообщений производится специальным устройством, которое называется кодером (кодирующим устройством) источника сообщения (датчика информации). В кодере кодовые комбинации представляются в виде определенных состояний накопительных эле­ментов (триггеров, ферритов, механических рычагов, линеек и т.д.). Для передачи сообщения состояния накопительных элемен­тов преобразуются в последовательность элементов дискретного электрического сигнала, как правило, в импульсы тока или напря­жения. Каждый символ кодовой комбинации представляется единич­ным элементом цифрового сигнала. Процесс преобразования элемен­тов кодовой комбинации в последовательность элементов сигнала называется модуляцией. (Ранее применялся и термин манипуляция).

По рекомендациям MKKIT при представлении единичных эле­ментов кодовых комбинаций токовыми и бестоковыми (или положи­тельными и отрицательными) посылками, токовые (положительные) обозначаются "I", бестоковые (отрицательные) - "О". На рис.1.5 показан пример представления кодовой комбинации посылками постоянного тока а) - положительными и отрицательными, б) - то­ковыми и бестоковыми.

В кодирующем устройстве производится первичное кодирова­ние и первичная модуляция. Термин "первичное" подчеркивает то обстоятельство, что в процессе передачи по каналу связи сигналы, как правило, подвергаются дополнительному кодированию и моду­ляции.

Коды можно разделить на две большие группы: простые и корректирующие. Корректирующие коды (называют также помехоус­тойчивые) применяют для повышения верности информации. Простые коды (называют также: первичные, обыкновенные, безызбыточные) используются для первичного преобразования дискретных сообще­ний в сигналы и получаются на выходе кодера источника сообще­ния.

Простые код» делят на равномерные и неравномерные.

Равномерными называются такие коды, в которых все кодовые комбинации имеет одинаковую длину, т.е. имеют одинаковое чис­ло единичных элементов.

Неравномерными называют такие коды, кодовые комбинации которых могут отличаться одна от другой числом единичных эле­ментов.

Оценка простых кодов производится по скорости передачи, помехоустойчивости и сложности технической реализации.

1.2.2. Равномерные простые коды

Как следует из определения, простые равномерные коды сос­тоят из комбинаций одинаковой длины. Естественно, возникает вопрос:

Хорошо это или плохо?" Для ответа на этот вопрос рас­смотрим следующий пример.

Пусть имеется некоторое сообщение, состоящее из М эле­ментов, представляющее собой некоторую последовательность m(m<<M)   знаков (например, книга имеет M =100000 элемен­тов, представляющая собой некоторую последовательность из 32 букв, 10 цифр и 11 знаков препинания, т.е. из m = 53 знаков). Как известно, это сообщение несет некоторое количество инфор­мации I, равное:

I=log2N

где N - число возможных вариантов последовательностей из M элементов.

Поскольку последовательность из M элементов составлена знаками, каждый из которых ( xi) появляется в последо­вательности с различными вероятностями рi , то, используя формулу Стерлинга, можно показать, что количество информации в этой последовательности будет:

На один элемент сообщения будет приходиться в среднем количество информации:

Если каждый знак сообщения кодируется n -элементной кодовой комбинацией, состояний из двоичных символов, то каждый из них будет содержать Нэ количества информации

Очевидно, что код следует считать наилучшим с точки зрения скорости передачи тогда, когда Нэ будет максимально возможным.

Из теории информации известно, что один двоичный элемент может содержать максимальное количество информации равное 1-му биту, т.е. всегда Нэ <= I.

Следовательно, величина

может служить мерой, информационной недогрузки каждого двоич­ного элемента.

Если число знаков, из которых состоит сообщение, m=2n и все знаки равновероятны pi=1/m , то величина R = 0 Действительно.

Таким образом, максимальная скорость передачи равномерно­го простого кода будет тогда  и только тогда, когда выполняются условия


где n - целое число.
На практике, как правило, знаки сообщения неравновероят­ны, а также не выполняется условие  , Поэтому равно­мерные коды имеют , т.е. скорость их практически всегда ниже максимально возможной. Далее будет показано, что в ряде случаев с помощью неравномерного кода можно получить большую старость передачи. Однако, тот факт, что каждая кодовая комбинация в равно­мерных кодах имеет одинаковое количество двоичных элементов, позволяет получать простые правила кодирования и декодирования и, соответственно, простую техническую реализация кодирующих и декодирующих устройств.

Кроме того, за счет простых способов определения на при­емной стороне начала и конца каждой кодовой комбинации, что является необходимым условием однозначного декодирования, по­мехоустойчивость равномерных кодов достаточно высокая. Важным фактором является также то, что простые равномерные коды лег­ко преобразуются в корректирующие коды для повышения достовер­ности информации. Все это привело к тому, что равномерные ко­ды получили широкое применение на практике.

Для расширения возможностей равномерных кодов используют следующие меры. Например, число русских букв, цифр и знаков препинания составляет 53, что требует применения 6-элементных кодовых комбинаций (). Поэтому все множество знаков разбивается на два множества (регистра): буквенный и цифровой, что позволяет использовать 5-элементные кодовые комбинации. Для правильного декодирования вводятся специальные комбинации, указывающие о переходе с одного регистра на другой.

Современные отечественные телеграфные аппараты имеют три регистра: русский, латинский и цифровой.

Увеличение алфавита может быть достигнуто за счет того, что кодируются не только отдельные буквы (цифры), а и целые слова и даже отдельные фразы. Естественно - это вызывает не­обходимость увеличения числа регистров при использовании того же 5-элементного равномерного кода.

1.2.3. Неравномерные коды

Как отмечалось выше, неравномерными кодами называют такие коды, которые содержат разное число элементов.

Эти коды, как и равномерные коды, с точки зрения скорости передачи информации могут оцениваться величиной информационной недогрузки каждого двоичного символа:

где   - средняя длина кодовой комбинации;

- длина комбинации, соответствующей i-му сим­волу сообщения;

- вероятность появления i-го символа в сообщении.

Если более вероятным символам сообщения сопоставить более короткие кодовые комбинации и наоборот, то средняя длина кодо­вой комбинации будет меньше, т.е. скорость передачи информа­ции таким кодом будет выше.

Такие коды называют оптимальными. Если символы сообщения резко неравновероятны, то, целая код оптимальным, иногда мож­но увеличить скорость по сравнению с равномерным кодом.

При построении неравномерных кодов необходимо учитывать требование однозначного декодирования сообщения, первым этапом которого является правильное определение начала и конца каждой кодовой комбинации. Этого можно достичь, если между комбинациями ставить специальные разделительные группы или использовать неприводимые коды. Неприводимость кодов заключается в том, что в них из более длинной комбинации нельзя составить более ко­роткие комбинации. В настоящее время разработан целый ряд неприводимых кодов.

Примером неприводимого кода может служить код, состоящий из следующих комбинация:

11, 10, 011, 001, 000, 00001, 000001  

Неприводимость этого кода заключается в том, что короткие кодовые комбинация не могут быть  началом более длинных кодовых комбинаций и, следовательно, любая двоичная последовательность однозначно разбивается на указанные кодовые комбинации.

Например, последовательность

-  1011100000110000101111101000111  -
однозначно разбивается на комбинации

10, 11, 10, 00001, 10, 0001, 011, 11, 10, 10, 001, 11

Необходимо отметить, что применение оптимальных неравномерных кодов не всегда будет обеспечивать большую скорость передачи по сравнению с равномерным кодом. Предпосылкой получения более высокой скорости передачи путем применения нерав­номерного кода может служить заметная неравновероятность сим­волов сообщения и хорошая согласованность выбранного неравно­мерного кода со статистической структурой сообщения.

Пример. Пусть имеется сообщение, состоящее из достаточно большого числа элементов. Каждый элемент представляет собой один из восьми различных символов. Вероятность появления t-го символа определяется из выражения

Определить:

1) во сколько раз изменится скорость передачи ин­формации при передаче указанного сообщения вышерассмотренным неприводимым кодом по сравнению с равномерным кодом;

2) может ли существовать другой код, с помощью которого можно получить более высокую скорость передачи инфор­мации при передаче данного сообщения.

Сопоставим комбинации неприводимого кода символам сообще­ния в соответствии с табл.1.1.

Таблица 1.1

Комбинация

11

10

011

010

001

0001

00001

000001

1

2

3

4

5

6

7

8

64

49

36

25

16

9

4

1

2

2

3

3

3

4

5

6

Определим среднюю длину кодовой комбинации неприводимого кода  

При использовании равномерного кода число элементов в кодовой комбинации

Следовательно, при применении данного неприводимого кода скорость увеличивается в    3   gl.18 раз по сравнению с приме­нением равномерного кода. 'ч0"

Далее определим количество информации, которую несет один элемент кодовой комбинации неприводимого кода.

Поскольку один двоичный элемент кодовой комбинации может нести I бит информации, то возможно существует другой код или другая процедура кодирования, обеспечивающие большую скорость передачи.

В последнее время широкое применение получил неравномер­ный неприводимый коц построенный по следующему правилу.

Элементы сообщения записываются в виде последовательности натуральных десятичных чисел, записанных в двоичной форме, на­чиная с числа 2 (т.е.10):

10, II, 100, 101, 110, III, 10000,...

Полученные комбинации преобразуются в новые комбинации путем добавления в них нулей перед каждым нечетным элементом, начиная с третьего элемента.

Комбинации будут иметь вид

10, Ц, 1000, 1001, 1100, IIOI, 10000 и т.д.

Полученный таким образом коц обладает свойствами:

  • каждая комбинация начинается единицей} на нечетных позициях стоят нули;
  • каждая комбинация имеет четное число элементов.

Эти свойства делают код неприводимым и обеспечивают прос­тоту декодирования.

1.2.4. Первичные коды.

Вопросами координации стандартных кодов в международном масштабе занимается Международный консультативный комитет по телеграфии и телефонии (МККТТ) и Международная организация стандартов (МОС).

Для телеграфной связи в 1932 году был принят стандартный Международный телеграфный код » 2 (МТК-2). Этот код представ­ляет собой равномерный пятиэлементный код с двумя регистрами "буквы латинские" и "цифры". Для возможности передачи текстов на русском языке МТК - 2 был дополнен третьим регистром "русские буквы" (табл.1.2). Этот код на регистрах "буквы латин­ские" и "цифру" совпадает с УТК-2, что позволяет использовать его на международных связях.

Код МТК-2 не полностью удовлетворяет ряду требований теле­графной связи. Ограниченность числа комбинаций пятизначного кода не позволяет передавать весьма важные служебные знаки, например: "Понял", "Ждите",  квитанция", "Конец адреса" и др.

Поэтому ряд функциональных символов передают с помощью четырехкратного повторения комбинаций стандартного кода. Нап­ример, для обозначения начала текста передают В-Q'Cflt   , кон­ца телеграммы-++++, конца сообщения - /VNNM   и т.д. Однако многобуквенные сочетания можно использовать для передачи только служебных знаков или переключении аппаратуры, но их нельзя использовать для передачи графических печатных символов.

С появлением нового вида электросвязи - передачи данных •возникла потребность введения новых служебных, арифметических, логических и других символов, отсутствующих в MТK-2.  Это привело к необходимости создания нового стандартного кода, пригонного как для телеграфии, так и для передачи данные. Был разработан и утвержден в 1966 году МККТТ и МОС новый международный стан­дартней код  МТК-5, который содержит на только строчные, но и прописные буквы, дополнительные знаки препинания, большое чис­ло символов управления устройствами связи и печати.

Код обеспечивает:

  • обработку и передачу машинной символики в пределах машин­ного языка "КОБОЛ";
  • простоту выделения при декодировании групп символов раз­личного характера: служебных символов, цифр, букв и специаль­ных знаков;
  • простой алгоритм работы ЭВМ при обработке цифровой ин­формации;
  • упрощение процессов упорядочения информации по цифрам и буквам;
  • передачу информации по каналам связи и телеуправления устройствами обработки данных;
  • построение клавиатуры аппаратов с расположением клавиш, близким к расположению на клавиатуре пишущей машинки.

Международный код МТК-5 является равномерным семиэлементным однорегистровым кодом и содержит только буквы латинского язы­ка. Поэтому для нашей страны был разработан стандартный коц (ГОСТ 13052-67), который отличается от кода № 5 тем, что он является двухрегистровым: первый регистр соответствует латинс­кому алфавиту, а второй - русскому.

Указанный код приведен в табл.1,3. Таблица состоит из 16 столбцов и 16 строк. Место пересечения столбов и строки называ­ют позицией. Всего в коде 16 х 16 = 256 позиций, из них 127 принадлежит первому регистру и 127 - второму.

Каждой из позиций соответствует свой символ и своя кодовая комбинация. Первые семь столбцов составляют латинский регистр, последние семь - русский регистр. С левой стороны таблицы за­писаны первые четыре элемента Э1 Э2 Э3 Э4 кодовой комбинации в виде двоичного числа, указывающего номер строки. Над каждым столбцом записаны три последние элемента Э5 Э6 Э7 кодовой ком­бинации в виде двоичного числа, указывающего номер столбца в регистре. Символы обоих регистров делятся на служебные» пред­назначенные для организации процедуры обмена и обработки ин­формации ЭВМ, и графические, которые при необходимости могут быть выведены на печать. Служебные символы располагаются в первых двух столбцах, а графические - в последних пяти. Ука­занное построение кода позволяет упростить декодирование слу­жебных и графических символов, и создает дополнительные удоб­ства ее использования в системах передачи данных.

При вводе информации в ЭВМ двухрегистровый код целесооб­разно заменить однорегистровым, путем добавления восьмого элемента, указывающего признак регистра: 0 - первый регистр, I -второй регистр.

В единой системе электронных вычислительных машин (ЕС ЭВМ) для ввода - вывода информации применяют восьмиразрядный код КОИ-8 (табл.1.4). Этот код разработан на основе семиразрядного кода (ГОСТ 13052-67), но имеет несколько иной перечень функ­циональных символов и иное расположение колонок. Поэтому при сопряжении аппаратуры передачи данных с ЭВМ вводно-выводные устройства должны содержать кодопреобразователи.

Контрольные вопросы

1. Что является содержанием информации при тестовой проверке каналов связи?
2. Изобразите временные диаграммы троичного ЦСД, четверичного ЦСД.
3. Изобразите временные диаграммы ЦСД с двумя значащими позициями и различными единичными интервалами.
4. К чему приведет искажение одной посылки при использовании простых равномерных кодов?
5. Как увеличить возможности простых кодов при передаче часто применяемых сокращений типа СОД, МСД и т.п.?

Источник: http://www.rfcmd.ru/book_11/h1_2

Как кодируют от алкоголя?

Кодирование. Общие понятия

Преобразование дискретного сообщения в сигнал обычно осуществляется в виде двух операций — кодирования и модуляции. Кодирование представляет со­бой преобразование сообщения в последовательность кодовых символов, а мо­дуляция — преобразование этих символов в сигналы, пригодные для передачи по каналу. С помощью кодирования и модуляции источник сообщений согла­суется с каналом.

Простейшим примером дискретного сообщения является текст. Любой текст состоит из конечного числа элементов: букв, цифр, знаков препинания. Их совокупность называется алфавитом источника сообщения. Так как число элементов в алфавите конечно, то их можно пронумеровать и тем самым свести передачу сообщения к передаче последовательности чисел.

Так, для передачи заглавных букв русского алфавита (их 32) необходимо передать числа от 0 до 31. Для передачи любого числа, записанного в десятичной форме, требуется передача десяти цифр — от 0 до 9. Практически для этого нужны десять сигналов, соответствующих различным цифрам. Систему передачи дискретных сообщений можно существенно упро­стить, если воспользоваться при кодировании двоичной системой счисления.

В десятичной системе основанием счисления является число 10. Поэтому любое целое число Кможно представить в виде

K=an10n+...+a2102+a1101+a0100, (4.1)

где a0, a1, ...,an - коэффициенты, принимающие значение от 0 до 9. Так, число 265 можно записать как 2 102 + 6 101 + 5 10°. Очевидно, в качестве основания счисления можно принять любое целое число т и представить число N как

К=anmn+...+a2m2+a1m1+a0m0,(4.2)

где a0, a1, ...,an - коэффициенты, принимающие значение от 0 до т - 1. Задаваясь величиной m, можно построить любую систему счисления.

При m=2 получим двоичную систему, в которой числа записываются с помощью двух цифр 0 и 1.

Например, число 13 в двоичной системе записывается 1101, что соответствует выражению 1 23 +1 22 +0 21 + 1 2°.

Арифметические действия в двоичной системе весьма просты. Так, сложение осуществляется по следующим правилам:

0 + 0 = 0;

0+1 = 1;

1+0=1;

1 + 1 = 1.

Различают поразрядное сложение без переноса в старший разряд, так назы­ваемое "сложение по модулю два". Правила этого сложения следующие:

0 + 0 = 0;

0 + 1 = 1;

1 + 0 = 1,

1 + 1 = 0.

Если преобразовать последовательность элементов сообщения в последовательность двоичных чисел, то для передачи последних по каналу связи достаточно передавать всего лишь два различных сигнала. Например, символы 0 и 1 могут передаваться колебаниями с различными частотами или импульсами тока разной полярности. Благодаря своей простоте двоичная система счисления широко применяется при кодировании дискретных сообщений.

При кодировании происходит процесс преобразования элементов сообще­ния в соответствующие им числа (кодовые символы). Каждому элементу сооб­щения присваивается определённая совокупность кодовых символов, которая называется кодовой комбинацией. Совокупность кодовых комбинаций, отобра­жающих дискретные сообщения, образует код. Правило кодирования может быть выражено кодовой таблицей, в которой приводятся алфавит кодируемых сообщений и соответствующие им кодовые комбинации. Множество возможных кодовых символов называется кодовым алфавитом, а их количество m— основанием кода. В общем случае при основании кода т правила кодирования K элементов сообщения сводятся к правилам записи K различных чисел в m-ичной системе счисления. Число разрядов п, образующих кодовую комбинацию, называется разрядностью кода или длиной кодовой комбинации. В зависимости от системы счисления, используемой при кодировании, различают двоичные и т-ичные (недвоичные) коды.

Коды, у которых все комбинации имеют одинаковую длину, называют равномерными. Для равномерного кода число возможных комбинаций равно mn.Примером такого кода является пятизначный код Бодо, содержащий пять двоичных элементов (m= 2, п = 5). Число возможных кодовых комбинаций равно 25 = 32, что достаточно для кодирования всех букв русского алфавита. Однако этого недостаточно для передачи сообщения, содержащего буквы, цифры, различные условные знаки (точка, запятая, сложение, умножение и т.п.). Поэтому в настоящее время используется "Международный код №2" (МТК-2). В коде МТК-2 используется регистровый принцип, согласно которому одна и та же пятиэлементная кодовая комбинация может использоваться до трёх раз в зависимости от положения регистра: русский, латинский, цифровой. Общее число различных знаков при этом равно 84, что достаточно для кодирования телеграммы.

Для передачи данных рекомендован семиэлементный код МТК-5. Коды МТК-2 и МТК-5 являются первичными (простыми). Основными параметрами кодов являются: основание кода т, длина кодовой комбинации n, расстояние между кодовыми комбинациями dij и вес кодовой комбинации w. Расстояние dijхарактеризует различие между двумя кодовыми комбинациями и определяется по Хеммингу числом несовпадающих в них разрядов, т.е. числом единиц в сумме двух комбинаций по модулю 2. Число ненулевых элементов в кодовой комбинации определяет её вес w. Применение равномерных кодов упрощает построение автоматических буквопечатающих устройств и не требует передачи разделительных символов между кодовыми комбинациями.

Неравномерные коды характерны тем, что у них кодовые комбинации отличаются друг от друга не только взаимным расположением символов, но и их количеством. Это приводит к тому, что различные комбинации имеют различную длительность. Такие коды требуют либо специальных разделительных знаков, указывающих конец одной и начало другой кодовой комбинации, либо же должны строиться так, чтобы никакая кодовая комбинация не являлась началом другой. Коды, удовлетворяющие этому условию, называются неприводимыми или префиксными. Заметим, что равномерный код также является неприводимым. Строение кода удобно представлять в виде графа (кодового дерева), в котором из каждого узла исходит число ветвей, равное основанию кода (для двоичного кода, например, шаг вверх означает 0, шаг вниз — 1).

Типичным примером неравномерных кодов является код Морзе, в котором символы 0 и 1 используются только в двух сочетаниях - как одиночные (1 и 0) или как тройные (111 и 000). Сигнал, соответствующий одной единице, называется точкой, трём единицам - тире. Символ 0 используется как знак, отделяющий точку от тире, точку от точки и тире от тире. Совокупность 000 используется как разделительный знак между кодовыми комбинациями.



По признаку помехозащищённости коды делят на примитивные (первичные) и корректирующие. Коды, у которых все возможные кодовые комбинации ис­пользуются для передачи информации, называются простыми или кодами без избыточности (примитивными). В простых равномерных кодах превращение одного символа комбинации в другой, например 1 в 0 или 0 в 1, приводит к появлению новой разрешённой комбинации, т.е. к ошибке. Корректирующие коды строятся так, что для передачи сообщения используются не все кодовые ком­бинации, а лишь некоторая их часть (разрешённые кодовые комбинации). Тем самым создаётся возможность обнаружения и исправления ошибки при непра­вильном воспроизведении некоторого числа символов. Корректирующие свойства кодов достигаются введением в кодовые комбинации дополнительных (избыточных) символов.


Предыдущая45678910111213141516171819Следующая





Дата добавления: 2016-03-22; просмотров: 225;


ПОСМОТРЕТЬ ЕЩЕ:

Источник: http://helpiks.org/7-49136.html
Другие записи