Коды Голомба: различия между версиями

Материал из in.wiki
Перейти к навигации Перейти к поиску
м (58 версий импортировано: Импорт из Википедии)
 
(не показано 17 промежуточных версий 12 участников)
Строка 1: Строка 1:
'''Коды [[Голомб, Соломон Вольф|Голомба]]''' — семейство [[энтропийное кодирование|энтропийных кодов]]. Под кодом Голомба может подразумеваться также один из представителей этого семейства.
+
'''Коды [[Голомб, Соломон Вольф|Голомба]]''' — семейство [[энтропийное кодирование|энтропийных кодов]]. Под кодом Голомба может подразумеваться также один из представителей этого семейства.  
  
 
Рассмотрим источник, независимым образом порождающий целые неотрицательные числа <math>i</math> с вероятностями <math>P(i) = (1-p)p^{i}</math>, где <math>p</math> — произвольное положительное число, не превосходящее 1, то есть источник, описываемый [[Геометрическое распределение|геометрическим распределением]]. Если при этом целое положительное число <math>m</math> таково, что
 
Рассмотрим источник, независимым образом порождающий целые неотрицательные числа <math>i</math> с вероятностями <math>P(i) = (1-p)p^{i}</math>, где <math>p</math> — произвольное положительное число, не превосходящее 1, то есть источник, описываемый [[Геометрическое распределение|геометрическим распределением]]. Если при этом целое положительное число <math>m</math> таково, что
Строка 5: Строка 5:
 
: <math>p^m = \frac 1 2 </math>,
 
: <math>p^m = \frac 1 2 </math>,
  
то оптимальным посимвольным кодом (то есть кодом, ставящим в соответствие каждому кодируемому символу определённое кодовое слово) для такого источника будет код, построенный в соответствии с предложенной С. Голомбом процедурой, согласно которой для любого кодируемого числа <math>n</math> при известном <math>m</math> кодовое слово образуют [[Унарное кодирование|унарная запись]] числа <math>q = \left[ \frac{n}{m}\right]</math> и кодированный в соответствии с описанной ниже процедурой остаток <math>r</math> от деления <math>\frac{n}{m}</math>:
+
то оптимальным посимвольным кодом (то есть кодом, ставящим в соответствие каждому кодируемому символу определённое кодовое слово) для такого источника будет код, построенный в соответствии с предложенной [[Голомб, Соломон Вольф|Соломоном Голомбом]] процедурой, согласно которой для любого кодируемого числа <math>n</math> при известном <math>m</math> кодовое слово образуют [[Унарное кодирование|унарная запись]] числа <math>q = \left[ \frac{n}{m}\right]</math> и кодированный в соответствии с описанной ниже процедурой остаток <math>r</math> от деления <math>\frac{n}{m}</math>:
  
 
# Если <math>m</math> является степенью числа 2, то код остатка представляет собой двоичную запись числа <math>r</math>, размещённую в <math>\log_2(m)</math> битах.
 
# Если <math>m</math> является степенью числа 2, то код остатка представляет собой двоичную запись числа <math>r</math>, размещённую в <math>\log_2(m)</math> битах.
Строка 13: Строка 13:
 
:: иначе остаток <math>r</math> кодируется двоичной записью числа <math>r+2^b-m</math>, размещённой в <math>b</math> битах.
 
:: иначе остаток <math>r</math> кодируется двоичной записью числа <math>r+2^b-m</math>, размещённой в <math>b</math> битах.
  
Позже Р. Галлагером и Д. Ван Вурхисом было показано, что предложенный Голомбом код оптимален не только для дискретного набора значений <math>p</math>, удовлетворяющих приведённому выше критерию, но и для любых <math>p</math>, для которых справедливо двойное неравенство
+
Позже [[Галлагер, Роберт|Р. Галлагером]] и Д. Ван Вурхисом было показано, что предложенный Голомбом код оптимален не только для дискретного набора значений <math>p</math>, удовлетворяющих приведённому выше критерию, но и для любых <math>p</math>, для которых справедливо двойное неравенство
  
 
: <math>p^{m} + p^{m+1} \le 1 < p^{m} + p^{m-1}</math>,
 
: <math>p^{m} + p^{m+1} \le 1 < p^{m} + p^{m-1}</math>,
Строка 32: Строка 32:
 
(унарный код <math> 0001 </math>, то есть q нулей с завершающей единицей),
 
(унарный код <math> 0001 </math>, то есть q нулей с завершающей единицей),
  
и кодированного остатка
+
и кодированного остатка  
  
 
: <math>r = 1</math>,
 
: <math>r = 1</math>,
Строка 48: Строка 48:
 
* {{статья|ссылка=http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?reload=true&arnumber=1055357|автор=R. G. Gallager, D. C. Van Voorhis.|заглавие=Optimal source codes for geometrically distributed integer alphabets|издание=IEEE Trans. Inf. Theor|год=1975|номер=2, IT-21|pages=228—230}}
 
* {{статья|ссылка=http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?reload=true&arnumber=1055357|автор=R. G. Gallager, D. C. Van Voorhis.|заглавие=Optimal source codes for geometrically distributed integer alphabets|издание=IEEE Trans. Inf. Theor|год=1975|номер=2, IT-21|pages=228—230}}
 
* {{статья|ссылка=http://dx.doi.org/10.1109/TCOM.1971.1090789|автор=R. F. Rice, J. R. Plaunt.|заглавие=Adaptive Variable-Length Coding for Efficient Compression of Spacecraft Television Data|издание=IEEE Trans. on Commun|год=1971|volume=16(9)|pages=889—897}}
 
* {{статья|ссылка=http://dx.doi.org/10.1109/TCOM.1971.1090789|автор=R. F. Rice, J. R. Plaunt.|заглавие=Adaptive Variable-Length Coding for Efficient Compression of Spacecraft Television Data|издание=IEEE Trans. on Commun|год=1971|volume=16(9)|pages=889—897}}
 +
* [http://www.hpl.hp.com/techreports/2006/HPL-2006-74.pdf#page=18 2.3 Golomb Codes] / Amir Said, On the Determination of Optimal Parameterized Prefix Codes for Adaptive Entropy Coding. HPL-2006-74
  
 
{{методы сжатия}}
 
{{методы сжатия}}
Строка 53: Строка 54:
 
[[Категория:Теория кодирования]]
 
[[Категория:Теория кодирования]]
 
[[Категория:Алгоритмы сжатия без потерь]]
 
[[Категория:Алгоритмы сжатия без потерь]]
 
[[de:Golomb-Code]]
 
[[en:Golomb coding]]
 
[[es:Codificación Golomb-Rice]]
 
[[fr:Codage de Golomb]]
 
[[ja:ゴロム符号]]
 
[[pl:Kod Golomba]]
 
[[pt:Códigos de Golomb]]
 

Текущая версия от 00:56, 20 августа 2025

Коды Голомба — семейство энтропийных кодов. Под кодом Голомба может подразумеваться также один из представителей этого семейства.

Рассмотрим источник, независимым образом порождающий целые неотрицательные числа i i с вероятностями P ( i ) = ( 1 p ) p i P(i) = (1-p)p^{i} , где p p  — произвольное положительное число, не превосходящее 1, то есть источник, описываемый геометрическим распределением. Если при этом целое положительное число m m таково, что p m = 1 2 , p^m = \frac 1 2 ,

то оптимальным посимвольным кодом (то есть кодом, ставящим в соответствие каждому кодируемому символу определённое кодовое слово) для такого источника будет код, построенный в соответствии с предложенной Соломоном Голомбом процедурой, согласно которой для любого кодируемого числа n n при известном m m кодовое слово образуют унарная запись числа q = [ n m ] q = \left[ \frac{n}{m}\right] и кодированный в соответствии с описанной ниже процедурой остаток r r от деления n m \frac{n}{m} :

  1. Если m m является степенью числа 2, то код остатка представляет собой двоичную запись числа r r , размещённую в log 2 ( m ) \log_2(m) битах.
  2. Если m m не является степенью 2, вычисляется число b = log 2 ( m ) b = \lceil\log_2(m)\rceil . Далее:
Если r < 2 b m r < 2^b-m , код остатка представляет собой двоичную запись числа r r , размещённую в b 1 b-1 битах,
иначе остаток r r кодируется двоичной записью числа r + 2 b m r+2^b-m , размещённой в b b битах.

Позже Р. Галлагером и Д. Ван Вурхисом было показано, что предложенный Голомбом код оптимален не только для дискретного набора значений p p , удовлетворяющих приведённому выше критерию, но и для любых p p , для которых справедливо двойное неравенство p m + p m + 1 1 < p m + p m 1 , p^{m} + p^{m+1} \le 1 < p^{m} + p^{m-1},

где m m  — целое положительное число. Поскольку для любого p p всегда найдётся не более одного значения m m , удовлетворяющего приведённому выше неравенству, предложенная С. Голомбом процедура кодирования геометрического источника оказывается оптимальной для любого значения p p .

Чрезвычайно простая в реализации, но не всегда оптимальная разновидность кода Голомба в случае, когда m m является степенью 2, называется кодом Райса.

Пример[править | править код]

Пусть p = 0.85 p = 0.85 , требуется закодировать число n = 13 n = 13 .

Удовлетворяющее двойному неравенству Галлагера — Ван Вурхиса значение m = 4 m = 4 .

В соответствии с описанной выше процедурой кодирования кодовое слово, соответствующее кодируемому числу 13, строится как унарная запись частного от деления n/m: q = [ n m ] = [ 13 4 ] = 3 , q = \left[ \frac{n}{m} \right] = \left[\frac{13}{4} \right] = 3 ,

(унарный код 0001 0001 , то есть q нулей с завершающей единицей),

и кодированного остатка r = 1 , r = 1,

(код 01 01 , то есть собственно остаток, записанный в log 2 ( m ) \lceil\log_2(m)\rceil битах).

Результирующее кодовое слово 0001 | 01 0001|01

См. также[править | править код]

Ссылки[править | править код]

Ошибка Lua в Модуль:Navbox на строке 353: attempt to index local 'listText' (a nil value).