КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Тема 6.1. Теоретичні положення
Дискретне джерело інформації – це таке джерело, яке може виробити (згенерувати) за скінчений відрізок часу тільки скінчену множину повідомлень. Кожному такому повідомленню можна співставити відповідне число, та передавати ці числа замість пові-домлень. Дискретне джерело інформації є достатньо адекватною інфор-маційною моделлю дискретних систем, а також неперервних систем, інформаційні сигнали про стан яких піддають аналого - цифровому пе-ретворенню; таке перетворення виконується в більшості сучасних автоматизованих систем управління. Первинні характеристики дискретного джерела інформації – це алфавіт, сукупність ймовірностей появи символів алфавіту на виході дискретного джерела та тривалості символів. Алфавіт – множина Якщо всі ймовірності, які визначають виникнення символів на виході джерела, не залежать від часу, джерело називають стаціонарним. Ми будемо розглядати тільки стаціонарні джерела та для скорочення замість “стаціонарне джерело” будемо всюди використовувати “джерело”. Для опису джерел, які не мають пам’яті, достатньо мати значення безумовних імовірностей p (xi) виникнення символів xi, i = 1, 2, 3,…, M на його виході. Більшість реальних джерел інформації є джерелами з пам’ят-тю. Розподіл ймовірностей виникнення чергового символу на виході дискретного джерела з пам’яттю залежить від того, які символи були попередніми. Таке джерело інформації називають марковським, оскільки процес появи символів на його виході адекватний ланцюгам Маркова; останні в свою чергу отримали таку назву на честь російського математика Маркова (старшого) Андрія Андрійовича (1856 – 1922), який заклав основи розділу теорії випадкових процесів. Будемо говорити, що глибина пам’яті марковського дискретного джерела інформації дорівнює h, (h ³ 0), якщо ймовірність появи чергового символу залежить тільки від h попередніх символів на виході цього джерела. Кількість інформації – одне із основних понять теорії інформації, яка розглядає технічні аспекти інформаційних проблем, тобто вона дає відповіді на запитання такого типу: якою повинна бути ємність запам’ятовуючого пристрою для запису даних про стан деякої системи, якими повинні бути характеристики каналу зв’язку для передачі певного повідомлення тощо. Кількісна оцінка інформації пов’язана з поняттям ентропії. Ентропія є мірою невизначеності, непрогнозованості ситуації. Зменшення ентропії, що відбулось завдяки деякому повідомленню, точно збігається з кількістю інформації, яка міститься в цьому повідомленні. Для дискретного немарковського (без пам’яті) джерела інформації ентропія
зазначимо, що Значення Якщо основа логарифма в (6.1) дорівнює двом, то одиниці вимірювання H, а також кількості інформації називають бітами або двійковими одиницями. Ентропія дискретного розподілу ймовірностей завжди невід’ємна і набуває максимального значення H max , коли всі
В цьому разі маємо міру кількості інформації, яку ще до Шеннона було запропоновано англійським математиком Р.Хартлі. Підставимо (6.2) в (6.1), отримаємо H = H max = log 2 M. (6.3) Значення H max збігається з кількістю двійкових комірок па-м’яті, які необхідно мати, щоб зафіксувати за допомогою двійкового коду інформацію про один із M можливих станів системи, або про символ, що з’явиться на виході дискретного джерела інформації. Ентропія дорівнює нулю, якщо ймовірність появи одного з символів є одиниця (при цьому, звичайно, ймовірність появи будь - якого іншого символа буде дорівнювати нулю); в такій ситуації невизначеність відсутня. Продуктивність
де Надмірність (надлишок) R дискретного джерела інформації дає відносну оцінку використання потенційних можливостей джерела з алфавітом заданої потужності
Надмірність може приймати значення від 0 до 1. Вона дорівнює нулю, якщо H = H max ; в цьому випадку дискретне джерело інформації буде виробляти максимально можливий інформаційний потік. Із першої теореми Шеннона виходить, що при застосуванні ефективного кодування надмірність може бути зведена практично до нуля, внаслідок чого об’єм повідомлення буде зменшено майже в Ентропія, продуктивність та надмірність – інтегральні інформаційні характеристики дискретного джерела інформації. Розглянемо сукупність двох дискретних немарковських джерел інформації з алфавітами
Вона має назву умовної частинної ентропії та характеризує невизначеність символів на виході другого джерела при умові, що на виході першого з’явився символ
де Ця ентропія характеризує в середньому невизначеність символів на виході другого джерела, якщо є можливість спостерігати за появою символів на виході першого джерела. Аналогічно визначається частинна Якщо дискретні джерела статистично незалежні, то
В цьому випадку
Середня умовна ентропія Таким чином для середньої умовної
Для двох визначених вище дискретних джерел можна розрахувати сумісну ентропію
Для обчислення
Сума елементів
Маючи безумовні ймовірності
а далі за виразом (6.7) знайти умовні ентропії Всі вище перелічені ентропії можна також отримати із матриць умовних ймовірностей Ентропію
Перша складова з урахуванням того, що
є ентропією
Аналогічно можна показати, що
Якщо джерела статистично незалежні, то із виразу (6.9) виходить
У загальному випадку
Для системи, що складається з
Звичайно, як і для двох джерел, має місце співвідношення
де рівність має місце, коли всі джерела статистично незалежні. Звернемось знову до системи двох дискретних джерел. Спостерігаючи за виникненням символів на виході одного із джерел, наприклад першого, в загальному випадку будемо отримувати певну кількість інформації про появу символів на виході другого джерела. Ця інформація
Ця величина показує, яка кількість інфомації в середньому міститься в одному символі першого джерела про виникнення символів на виході другого джерела. Користуючись виразами для безумовної та умовної ентропій, після деяких перетворень можна отримати:
Крім того, враховуючи (6.16) та (6.17), будемо мати такі інтерпретації для
Тобто кількість інформації, що містить в середньому символ на виході першого джерела про виникнення символів на виході другого джерела, дорівнює кількості інформації, яка міститься в середньому в символі на виході другого джерела про виникнення символів на виході першого. Через це Користуючись поняттям умовної ентропії, можна отримати вираз для обчислення ентропії Тоді частинна умовна ентропія
де Усереднюючи
тут Якщо статистичні зв’язки мають місце лише між двома суміжними символами (тобто джерело має глибину пам’яті
Для джерела з глибиною пам’яті
Аналогічно можна отримати вирази для ентропій марковських джерел при більш глибоких статистичних зв’язках.
Дата добавления: 2014-10-17; Просмотров: 452; Нарушение авторских прав?; Мы поможем в написании вашей работы! |