Коды Голомба: различия между версиями

Материал из in.wiki
Перейти к навигации Перейти к поиску
Строка 1: Строка 1:
 
'''Коды [[Голомб, Соломон Вольф|Голомба]]''' — семейство [[энтропийное кодирование|энтропийных кодов]]. Под кодом Голомба может подразумеваться также один из представителей этого семейства.
 
'''Коды [[Голомб, Соломон Вольф|Голомба]]''' — семейство [[энтропийное кодирование|энтропийных кодов]]. Под кодом Голомба может подразумеваться также один из представителей этого семейства.
  
Код Голомба позволяет представить последовательность символов в виде последовательности двоичных слов. Это представление будет оптимальным при условии, что [[распределение вероятности]] символов подчиняется геометрическому закону:
+
Рассмотрим источник, независимым образом порождающий неотрицательные числа <math>i</math> с вероятностями <math>P(i) = (1-p)p^{i}</math>, где <math>p</math> — произвольное положительное число, не превосходящее 1, т.е. источник, описываемый [[Геометрическое распределение|геометрическим распределением]]. Если при этом целое положительное число <math>m</math> таково, что
  
: <math> P(i) = (1-p)p^{i} </math>,
 
  
где ''i'' — номер символа, а ''p'' — параметр [[Геометрическое распределение|геометрического распределения]]. Также должно соблюдаться условие:
+
: <math>p^m = \frac 1 2 </math>,
 +
 
 +
 
 +
то оптимальным  для такого источника будет код, построенный в соответствии с предложенной С. Голомбом процедурой, согласно которой для любого кодируемого числа <math>n</math> при известном <math>m</math> кодовое слово образуют [[Унарное кодирование|унарная запись]] числа <math>q = \left[ \frac{n}{m}\right]</math> и кодированный в соответствии с описанной ниже процедурой остаток <math>r</math> от деления <math>\frac{n}{m}</math>:
 +
 
 +
 
 +
#Если <math>m</math> является степенью числа 2, то код остатка представляет собой двоичную запись числа <math>r</math>, размещённую в <math>\log_2(m)</math> битах.
 +
#Если <math>m</math> не является степенью 2, вычисляется число <math>b = \lceil\log_2(m)\rceil</math>. Далее:
 +
 
 +
::Если <math>r < 2^b-m </math>, код остатка представляет собой двоичную запись числа <math>r</math>, размещённую в <math>b-1</math> битах,
 +
::иначе остаток <math>r</math> кодируется двоичной записью числа <math>r+2^b-m</math>, размещённой в <math>b</math> битах.
 +
 
 +
 
 +
Позже Р. Галлагером и Д. Ван Вурхисом было показано, что предложенный Голомбом код оптимален не только для дискретного набора значений <math>p</math>, удовлетворяющих приведённому выше критерию, но и для любых <math>p</math>, для которых справедливо двойное неравенство
 +
 
 +
 
 +
: <math>p^{m} + p^{m+1} \le 1 < p^{m} + p^{m-1}</math>,
  
: <math>p^m = \frac 1 2 </math>,
 
  
где ''m'' — основной параметр кода Голомба.
+
причём для любого <math>p</math> всегда найдётся не более одного значения <math>m</math>, удовлетворяющего такому неравенству.
  
Для кодирования символа с номером ''n'' необходимо представить ''n'' в виде:
 
  
: <math> n = qm + r </math>,
+
== Пример ==
  
где ''q'' и ''r'' — целые неотрицательные числа, <math> 0 \le r < m </math>. Затем ''q'' кодируется унарным кодом, а ''r'' — бинарным. Полученные двоичные последовательности объединяются в результирующее слово.
+
Пусть <math>p = 0.85</math>, <math>n = 13</math>.  
  
Пример:
+
Удовлетворяющее двойному неравенству Галлагера - Ван Вурхиса значение <math>m = 4</math>.
  
основной параметр кода
 
: <math> m = 4 </math>
 
кодируемое число
 
: <math> n = 13 </math>
 
  
 
частное
 
частное
: <math> q = \left[ \frac{n}{m} \right] = \left[\frac{13}{4} \right] = 3 </math>
+
: <math> q = \left[ \frac{n}{m} \right] = \left[\frac{13}{4} \right] = 3 </math>
унарный код
+
 
: <math> 1110 </math>
+
унарный код <math> 1110 </math>,
 +
 
  
 
остаток
 
остаток
: <math> r = n \mod m = 13 \mod 4 = 1 </math>
+
: <math>r = 1</math>,
бинарный код
+
 
: <math> 01 </math>
+
код <math> 01 </math>.
 +
 
  
результирующее кодовое слово
+
Результирующее кодовое слово
 
: <math> 1110|01 </math>
 
: <math> 1110|01 </math>
 +
 +
== Ссылки ==
 +
* [http://urchin.earth.li/~twic/Golombs_Original_Paper/Golomb1966.djvu  Golomb S.W. Run-length encodings //IEEE Trans. Inf. Theor.–1996.- IT-12, No 3. – pp. 399-401]
 +
* [http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?reload=true&arnumber=1055357 Gallager R.G., Van Voorhis D.C. Optimal source codes for geometrically distributed integer alphabets //IEEE Trans. Inf. Theor.–1975.-IT-21, No 2. – pp. 228-230]
  
 
{{методы сжатия}}
 
{{методы сжатия}}

Версия от 17:11, 12 июня 2010

Коды Голомба — семейство энтропийных кодов. Под кодом Голомба может подразумеваться также один из представителей этого семейства.

Рассмотрим источник, независимым образом порождающий неотрицательные числа i i с вероятностями P ( i ) = ( 1 p ) p i P(i) = (1-p)p^{i} , где p p — произвольное положительное число, не превосходящее 1, т.е. источник, описываемый геометрическим распределением. Если при этом целое положительное число m m таково, что p m = 1 2 , p^m = \frac 1 2 ,


то оптимальным для такого источника будет код, построенный в соответствии с предложенной С. Голомбом процедурой, согласно которой для любого кодируемого числа n n при известном m m кодовое слово образуют унарная запись числа q = [ n m ] q = \left[ \frac{n}{m}\right] и кодированный в соответствии с описанной ниже процедурой остаток r r от деления n m \frac{n}{m} :


  1. Если m m является степенью числа 2, то код остатка представляет собой двоичную запись числа r r , размещённую в log 2 ( m ) \log_2(m) битах.
  2. Если m m не является степенью 2, вычисляется число b = log 2 ( m ) b = \lceil\log_2(m)\rceil . Далее:
Если r < 2 b m r < 2^b-m , код остатка представляет собой двоичную запись числа r r , размещённую в b 1 b-1 битах,
иначе остаток r r кодируется двоичной записью числа r + 2 b m r+2^b-m , размещённой в b b битах.


Позже Р. Галлагером и Д. Ван Вурхисом было показано, что предложенный Голомбом код оптимален не только для дискретного набора значений p p , удовлетворяющих приведённому выше критерию, но и для любых p p , для которых справедливо двойное неравенство p m + p m + 1 1 < p m + p m 1 , p^{m} + p^{m+1} \le 1 < p^{m} + p^{m-1},


причём для любого p p всегда найдётся не более одного значения m m , удовлетворяющего такому неравенству.


Пример

Пусть p = 0.85 p = 0.85 , n = 13 n = 13 .

Удовлетворяющее двойному неравенству Галлагера - Ван Вурхиса значение m = 4 m = 4 .


частное q = [ n m ] = [ 13 4 ] = 3 , q = \left[ \frac{n}{m} \right] = \left[\frac{13}{4} \right] = 3 ,

унарный код 1110 1110 ,


остаток r = 1 , r = 1,

код 01 01 .


Результирующее кодовое слово 1110 | 01 1110|01

Ссылки

Ошибка Lua в Модуль:Navbox на строке 353: attempt to index local 'listText' (a nil value).

de:Golomb-Code en:Golomb coding es:Codificación Golomb-Rice fr:Codage de Golomb ja:ゴロム符号 pl:Kod Golomba pt:Códigos de Golomb