Сжатие Файлов - Сжатие С Потерями Против. Сжатие Без Потерь



Средства массовой информации и файлов данных больших размеров, естественно, более трудно справиться, особенно с точки зрения управления пространством хранения и переноса их между дисками памяти. Самым простым решением будет сжимать их, которое может быть достигнуто различными способами. Существует два вида сжатия: С потерями и без потерь. Мы подробно объяснил и сравнил эти две категории, с тем чтобы помочь вам понять, где, почему и как каждый из них может быть использован. Знаете Ли Вы?Хороший практический пример реального приложения реализации методов сжатия данных является код Морзе, которая восходит к 19-го века. В Морс, те буквы алфавита, которые используются чаще всего (как и гласных), присваиваются более короткие кодовые слова, чем те, которые используются редко, так как для оптимизации эффективности кодирования. Например, буква 'Е' представляет собой один символ (одна точка), а не в виде буквы 'x', чьи кодированном виде содержит четыре символа.
Для общения любого рода, сжатие данных является необходимым условием. Для более чем столетие, методы сжатия данных, которые используются постоянно в стадии развития и совершенствования в руках ученых, математиков и специалистов по разработке программного обеспечения, которые стремились разработать более эффективные алгоритмы сжатия, С тем чтобы помочь модернизировать распространены технологические стандарты.

--- Хотите знать, как сжать файл? Вот помочь

Не только радиосвязь, но и весь спектр поджанров различные дисциплины Электроника, процветает за счет сжатия данных, и это включает в себя домены как данных, сигналов, изображений, аудио, а также видео обработки.

Как методы реализации передачи данных?
Функции сжатия данных-это на самом деле очень буквально―он стремится "уплотнить" большого количества данных в меньшем объеме, когда она хранится или передается на расстоянии, так что он потребует меньше места. Если рассматривать с точки зрения телекоммуникаций, эта аналогия является синонимом меньше требований (и, следовательно, утилизации) пропускная способность канала.

Однако, все данные, которые обрабатываются в цифровой природе, и, таким образом, прежде чем любой из вышеупомянутых задач (транспортировки его через кабели или хранить его в компакт-диски, DVD-диски, на жесткий диск компьютера или в любое другое запоминающее устройство) с успехом завершен, он должен быть преобразован в соответствующий Формат.

Это означает, что каждый символ данных, данных каждого образца из набора, который выбирается из пула данных через регулярные промежутки времени (этот процесс называется выборкой), каждый набор сгруппированных данных символов, или каждый набор коллективных данных образцов присваивается уникальное кодовое слово. Это закодированные данные, которые передаются или хранятся. Оригинал, исходные данные должны быть извлечены из кодированного потока, когда один хочет получить доступ к нему с того места, где он хранится, или когда оно получено в конце коммуникационного канала.

Методы сжатия данных реализуются на данном (данных преобразования) уровне; исходные данные кодируются с использованием оптимизированных алгоритмов, который дополнительно выполняет задачу сжатия данных.

Следует отметить, что в некоторых ситуациях, когда объем данных очень маленький, объем закодированных данных может даже превзойти исходные данные, делая сжатие неэффективно.
Теперь данные по существу сжатия можно разделить на две ветви: сжатие без потерь и сжатие С потерями. Сейчас мы попытаемся упростить эти две большие категории, так что их можно сравнивать, и их конкретные применения могут быть изучены.

Индекс
1. Сжатие Без Потерь

▶ методы кодирования без потерь CompressionEntropy
Показательный пример того, как кодирование Хаффмана алгоритм достигает сжатия
Наглядный пример как метод арифметического кодирования обеспечивает сжатие
Показательный пример того, как на lzw механизм кодирования обеспечивает сжатие
▶ реальные приложения без потерь CompressionLossless форматы сжатия
2. Сжатие С Потерями

▶ методы С потерями CompressionRate-искажение теории
▶ реальные применения методов сжатия С потерями CompressionWhy С потерями можно использовать для мультимедийных файлов
Форматы Сжатия С Потерями

Сжатие Данных Без Потерь
♦ в простых словах, сжатие без потерь используется, чтобы преобразовать данные таким образом, что никакие данные не отбрасываются, квантуется, или потеряны из-за каких то других причин, но адекватные конденсации данных достигается.

♦ методы, используемые в этом случае, работают по принципу разрушения больших потоков данных на более мелкие 'кодовые слова', делая передачи, хранения и восстановления гораздо проще.

♦ наиболее важной характеристикой сжатие без потерь, что делает его выделиться является то, что, в конечном, все исходные данные (или сообщение) сигнала, вплоть до последней крошки, можно восстановить полученные кодированные данные.
Методы сжатия без потерь**Энтропийного кодирования:- это категории методах кодирования представляет все те методы, где частота появления данных символов учитывается при сопоставлении их кодовых слов. Символы, которые встречаются более часто назначаются замкнута коды, в то время как те с более низкой частотой наступления тех или иных событий больше кодовых слов. Эти процессы полностью без потерь.

Интересно также отметить, что количество известно как энтропия, которая определяется по математик Клод Шеннон в 1948 году, можно определить как оценку наилучшее представление (с использованием минимального количества бит, по достижении максимальную степень сжатия можно) заданной последовательности. Математически это можно записать так:
Ч(х) = −∑[Р(ХІ)∗lоg2(Р(ХІ))]
Обратно в индекс
Наиболее распространенные алгоритмы, которые позволяют достичь сжатия без потерь является алгоритм кодирования Хаффмана, метод арифметического кодирования, и Лемпела-Зива-Уэлша (на lzw) механизм кодирования. Мы вкратце объяснили, как сжатие достигается, когда каждый из этих методов используется, с наглядными примерами.

**Примечание: алгоритм deflate представляет собой комбинацию алгоритма lz77, один из самых ранних методов, разработанных Абрахама Лемпеля и Якоба Зива (которые впоследствии способствовали развитию механизма кодирования по алгоритму lzw), и алгоритм кодирования Хаффмана.

Пример #1: Чтобы Проиллюстрировать, Как Кодирование Хаффмана Алгоритм Достигает Сжатия
Последовательность символов данных, где каждый символ выбирается из набора {А, B, С, D, Е, F}, имеет следующее распределение частот встречаемости символов.

Символ
Частота
А
15
Б
7
С
5
Д
23
Е
17
Ф
19


Кодирование Без Сжатия
Последовательность содержит 86 символов. Поскольку существует 8 различных символов, числа разрядов, необходимых для представления каждого символа будет 3, т. к. 23 = 8. Теперь, если вся последовательность преобразуется в двоичное без какого-либо сжатия, количество битов в закодированной последовательности будет 86 х 3 = 258.

После Кодирования С Кодированием Хаффмана Алгоритм
После использования алгоритма кодирования Хаффмана для генерации кодовых слов для данного распределения, можно получить следующие результаты:

Символ
Присваивается Кодовое Слово
Нет. бит на кодовое слово
Частота
Всего Нет. битов на символ
А
010
3
15
3 ∗ 15 = 45
Б
0110
4
7
4 ∗ 7 = 28
С
0111
4
5
4 ∗ 5 = 20
Д
00
2
23
2 ∗ 23 = 46
Е
11
2
17
2 ∗ 17 = 34
Ф
10
2
19
2 ∗ 19 = 38

Если весь Хаффман-кодовую последовательность преобразуется в двоичный код, общее количество битов в закодированной последовательности будет ∑(всего. битов на символ) = 211.

В сравнении с кодирование исходных данных, сжатых, закодированных последовательностей требует 47 бит меньше.

Для набора символов, которые включает в себя 24 буквы английского алфавита, 9 цифр, а также широкий спектр специальных символов, степень сжатия, которая может быть достигнута для любой произвольной последовательности (например, текстовый файл) - это очень показательно. Обратно в индекс
Пример #2: Чтобы Проиллюстрировать, Как Арифметический Метод Кодирования Обеспечивает Сжатие
Последовательность символов данных, где каждый символ выбирается из набора {А, B, С, D, #}, имеет следующее распределение вероятности появления символов.

Символ
Вероятность
А
0. 2
Б
0. 4
С
0. 1
Д
0. 2
#
0. 1


Энтропия распределения
Как уже упоминалось ранее, энтропия последовательности (или распределение вероятностей), по теории информации, представляет собой максимальное сжатие, он может пройти. Энтропия этого распределения могут быть вычислены следующим образом:

Ч(Х) = − [ 2 ∗ 0. 2 ∗ lоg2(0. 2) + 2 ∗ 0. 1 ∗ lоg2(0. 1) + 0. 4 ∗ lоg2(0. 4) ] = 12. 6095 приблизительно.
После Кодирование Арифметическое Кодирование Метод
Поскольку арифметическое кодирование в основном стремится представить весь спектр вероятностей на одной линии между 0 и 1, следующие данные могут быть получены:

Символ
Вероятность
Кумулятивная Вероятность
Интервалы на числовой прямой
А
0. 2
0. 2
[0, 0. 2)
Б
0. 4
0. 6
[0. 2, 0. 6)
С
0. 1
0. 7
[0. 6, 0. 7)
Д
0. 2
0. 9
[0. 7, 0. 9)
#
0. 1
1
[0. 9, 1. 0)

Количество битов, требуемых для представления одного символа данных, количество битов, необходимое для представления чисел, принадлежащих интервалу, что соответствующая вероятность падает в. Количество бит, которое потребуется, чтобы представлять интервал любого произвольного размера, скажем математически, -log2S.

Поэтому видно, что максимальное количество бит, требующихся для представления последовательности закодированных с помощью метода арифметического кодирования приравнивается к ее энтропии, которое, как уже упоминалось ранее, является максимальной величиной сжатия без потерь возможно. Обратно в индекс
Пример #3: чтобы проиллюстрировать, как Лемпеля-Зива-Уэлша (на lzw) механизм кодирования обеспечивает сжатие
Ниже приводится последовательность символов данных, где каждый символ выбирается из набора {А, B, с}.

ABABBABCABABBA
Кодирование Без Сжатия
Последовательность содержит 14 символов. Есть 3 различных символов, что предполагает 3 различных кодовых комбинаций для каждого символа. Давайте рассмотрим утверждение схемы кодирования, в которой 3-битовое кодовое слово используется для представления каждого символа.

Без сжатия, чтобы преобразовать всю последовательность RAW в двоичную, число требуемых битов будет 14 х 3 = 42.

После кодирования Лемпеля-Зива-Уэлша (на lzw) механизм кодирования
После использования Лемпеля-Зива-Уэлша механизма (алгоритма) для генерации кодовых слов для данного распределения, можно получить следующие результаты:

С
С
Выход
Код
Строку



1




2




3

А
Б
1
4
АБ
Б
А
2
5
БА
А
Б



АБ
Б
4
6
АББ
Б
А



БА
Б
5
7
Баб
Б
С
2
8
До н. э.
С
А
3
9
Калифорния
А
Б



АБ
А
4
10
АБА
А
Б



АБ
Б



АББ
А
6
11
АББА
А
ВФ
1



Видно, что есть 9 выходных кодовых слов, в отличие от 14, которая потребовалась бы, если кодирование проводилось без сжатия. Это приводит к 9 х 3 = 27 бит, что 15 бит меньше той суммы, что кодирование без сжатия приведет к.

Меньшее количество кодовых слов должны быть передаваемой или хранимой в данном случае. Коэффициент сжатия при использовании этого механизма, составляет 14/9 = 1. 56

Достигнутые компрессии является более важным для длинных строк, из которых длина превышает 100 символов. Обратно в индекс
Реальные применения CompressionTechniques без потерь сжатие без потерь обычно используется, когда вся информация, которая кодируется должна полностью восстановился. Следовательно, он больше используется в случае файлы данных или документов, а не медиа-файлы, такие как изображения, аудио и видео.

Однако, в некоторых случаях, например, когда требуется изображение RAW с вся информация, собранная с датчиков камеры, возникает необходимость использовать слишком lossless форматов файлов изображений. В случае с аудио, песни, хранящиеся на CD (. Формате WAV) кодируются без потерь, но то же самое не верно для многих других аудио форматов.

Мы составили список распространенных форматов без потерь, используемый для сжатия данных, изображений и аудио файлов.

Тип файла
Форматы, Которые Реализуют Сжатие Без Потерь
Файлы данных и папки
. Дуги:-
Формат, который впервые в практике объединения файлов архивирование и сжатие с помощью единого механизма, . Дуги, был популярен в конце 80-х годов, хотя уже в настоящее время выпали из. Ее ограничение было то, что он не смог сжать деревья каталог. Это достигается путем сжатия сжатия данных, который уже был сжат с помощью механизма сжатия lzw, путем использования алгоритма кодирования Хаффмана.

. ЗИП:-
. Zip-это один из самых популярных механизмов, используемых сегодня для сжатия и архивирования как отдельные файлы разных видов, а также целые папки. Это достигается сжатием с помощью комбинации различных алгоритмов. Кроме архивирования и сжатия, этот формат также имеет возможность зашифровать данные, которые он сжимает.

. РАР:-
. RAR - это еще один современный архивный архив и формат сжатия, который, однако, не столь распространен как . Молния. Это даже не как оптимизированный для всех видов файлов. Например, . РАР не может сжать аудио файлы с такой же эффективностью, как текстовые файлы. Помимо сжатия и архивирования, это дополнительно способны достичь восстановления ошибка.
Аудио Файлы
. В формате WAV:-
. WAV, что означает сигнал формата Аудио файла, на самом деле версия аудио файл, который является сырым и без сжатия. Его не следует путать с MP3-сжатый . Формат WAV, который обеспечивает сжатие с помощью методов сжатия С потерями. Она приняла стандартный формат для аудио файлы хранятся на компакт-дисках. Этот формат имеет максимальный размер файла 4 ГБ.

. ФЛАКЕ:-
FLAC расшифровывается бесплатный Аудио кодек без потерь, и открытое, безвозмездное формат, который был специально разработан для эффективного сжатия аудио файлов. Он может уменьшить размер аудиофайла на 50-60%, по сравнению с 10-20%, что молния, СДУЕТСЯ, и другие общего назначения форматы имеют потенциал, чтобы предложить. Он использует сочетание различных алгоритмов сжатия.

. РКК:-
Изначально проприетарное, но позже открыть и роялти-фри без потерь Формат сжатия, разработанный Apple, а именно, затраты, используется программное обеспечение Apple, таких как iTunes для сжатия музыкальных файлов. Хотя он использует другой алгоритм, чем FLAC для сжатия аудио файлов, это достигается подобная скорость сжатия.
Файлы Изображений
. Сырье:-
Как и предполагает название, . Формат RAW понимаются необработанные, несжатые изображения камеры, что также практически не претерпел каких-либо обработки. Так как этот формат содержит все сведения о изображения, и изображение может быть полностью реконструирована из его, его можно считать аналогом оцифрованный негатив.

. Размолвка:-
В . Формат TIFF, который расшифровывается как Формат TIFF, это очень удобный метод архивации исключительно для изображений. Он сжимает изображения без потерь путем использования пробега-длина методики кодирования как помощью packbits. Растровые изображения имеют преимущество поддержка редактирования изображений без потери данных.

. БМП:-
. БМП, или bitmap-Формат файлов, не нуждаются в представлении для тех, кто никогда не использовал приложение в Windows. Он реализует маленьким (в случае паллетах изображений, которые кодируются с использованием кодирования длин серий техник) или без сжатия; однако, из-за большого количества бит избыточность, Размер файла этого формата можно значительно уменьшить, если zip или подобный Формат сжатия используется.

. Формат PNG:-
В . PNG или Переносимая сетевая графика Формат сжатия изображений без потерь в значительной степени. Он предварительно сжимает изображения перед кодированием, путем фильтрации их, а затем достигает сжатия С помощью алгоритма deflate.

**Примечание: запуск-Продолжительность кодирования-метод кодирования данных, который принят, когда природа данных такова, что в ней присутствуют наборы как следствие-повторяющиеся данные символы. Этот метод кодирования позволяет оптимизировать процесс кодирования сам символ только один раз, затем несколько раз его повторяет, каждый раз, когда он появляется, а не кодирования один и тот же символ снова и снова.
Обратно в индекс
С потерями, сжатие данных♦ как следует из названия, С потерями, сжатие данных с потерей некоторого количества информации в данных процесс конденсации.

♦ информация, которая теряется в процессе сжатия, могут быть избыточные или повторяющиеся данные, которые, следовательно, просто отбрасывается для облегчения сжатия, в противном случае, либо идентичные или аналогичные данные могут быть представлены с помощью одного кодового слова, в процессе квантования.

♦ плохая новость заключается в том, что данные, которые сжимаются с потерей качества методы никогда не могут быть полностью реконструированы, в смысле, всего исходных данных, вплоть до последнего бита, никогда не могут быть полностью восстановлены.

♦ хорошая новость, однако, заключается в том, что любые данные, которые сжимаются с потерей качества методы, которые можете позволить себе потерять определенное количество данных без необходимости какого-либо влияния на его качество. Кроме того, сумма, в которую файл можно сжать с помощью методов сжатия С потерями намного больше, чем при использовании методов без потерь.

Методы сжатия С потерями**скорость-искажение теории:- так же, как энтропия последовательности задает границы на сумму без потерь сжатие данных поток может пройти, это теория, которая вновь была сформулирована Клодом Шенноном, стремится определить максимальную величину сжатия С потерями, что последовательность может выдержать, при этом не превышая максимальную сумму искажение сигнала, где искажения определяется как среднеквадратическая ошибка между передаваемого и принимаемого сигнала.
Обратно в индекс
При потере данных в процессе кодирования данных, то исходный набор символов данных не должны быть закодированы как есть.
✏ квантования может быть использован для преобразования полный набор данных символов в гораздо меньше, исключения ненужных повторов символов, в складчину похожие или идентичные данные символы вместе.
✏ кроме того, вся последовательность может быть преобразована в совершенно другой области, используя математические методы, как преобразование Фурье, Дискретное Косинусное преобразование, и множество других.

Алгоритмы сжатия С потерями можно настраивать, или простыми словами, степень, в которой данные могут быть сжаты с использованием методики сжатия С потерями могут быть разнообразны. Аналогии, как скорость-искажение теории используются, чтобы ограничить степень сжатия, что является приемлемым в разных случаях.
Реальные приложения с потерями CompressionAs упоминалось ранее, сжатие С потерями используется при двух условиях: во-первых, когда файл не страдают по качеству, если часть содержащейся в нем информации теряется, а во-вторых, если он должен быть сжат в большей степени, чем то, что без потерь методами можно добиться.

Текстовый документ, или папку, содержащую несколько файлов не могут быть сжаты с использованием методов сжатия С потерями, потому что все данные, которые они содержат, должна быть полностью восстановлена. С другой стороны, для медиа файлов, а именно изображения, аудио или видео файлов, динамика совершенно другая.

Почему Методики Сжатия С Потерями Могут Быть Использованы Для Медиа-Файлов
Человеческий глаз способен только признавая определенное количество разных цветов, а также он может решить только пиксели до определенного минимального размера. Представляя похожих цветов одного цвета, или объединение соседних пикселей, значения которых очень близки друг к другу, поможет не только успешно сжать файл, но изображение будет также не отличается от оригинала, когда он перестраивается (декодируется).

Подобное явление называется персистенция видение вступает в игру во время просмотра видео. С видео ничего, но колоссальное количество изображений, которые имеют минимальные различия между ними, которые успешно кормили со скоростью такой, что человеческий глаз не может различить отдельные кадры. Потеря кучки кадров не приведет к потери качества видео, так как скорость, с которой кадры ФРС превышает предельную величину. Обратно в индекс
Мы составили список из форматов сжатия С потерями, которые обычно в настоящее время используются, чтобы сжать соответствующих видов файлов.

Тип файла
Форматы, Реализующие Сжатие С Потерями
Файлы Изображений
. В формате JPEG:-
Это Формат изображений, разработанный Объединенная экспертная группа по фотографии, который является также, где он получил свое название, является лучшим примером сжатия С потерями. При создании . Файл JPEG, Автор имеет возможность выбора между размером изображения и качеством изображения. Более крупное изображение, очевидно, будет содержать больше пикселей, и, таким образом, автоматически будут лучшего качества. Чтобы добиться большего сжатия, качество изображения будет нарушена.

. Гиф:-
Хотя формате GIF (графика сменной) Формат изображения преимущественно без потерь, так как эти изображения кодируются с помощью метода Лемпеля-Зива-Уэлша механизм без потерь, можно также кодировать . GIF-файлы, используя более эффективный, алгоритм lzw сжатие С потерями, так как для улучшения сжатия.
Аудио Файлы
. МР3:-
В . Формат mp3 файл получил свое название из кинофильмов группы экспертов (в формате MPEG)-1 (или MPEG-2), Аудио слой 3, и является одним из наиболее широко распространенных аудио-форматов, закодированные с помощью методов сжатия С потерями. Он может уменьшить размер несжатого аудио файл (например, . WAV файл взят с CD) примерно 1/11-м от его первоначального количества. Качество mp3 файлов может быть изменена Кодировка на различных скоростях.

. ААС:-
Расширенный кодирования Аудио стандарт сжатия аудио в основном улучшением по сравнению с mp3, и было на самом деле предназначены, чтобы быть его преемником. Это аудио стандарт, который применяется во многих ведущих аудио/видео приложений, таких как YouTube, в продукции Apple и таких программ, как iTunes, и также поддерживается на различных мобильных телефонов и игровых устройств, включая Nintendo и PlayStation 3, Wii и многое другое. Этого можно добиться лучшего качества звука для той же скорости, которые используются для кодирования mp3-файлов.

. Формат WMA:-
Аудио Windows Media-это Проприетарный стандарт сжатия звука, разработанная Microsoft. Он использует модифицированное дискретное косинусное преобразование (как ААС), а также кодированием Хаффмана метод кодирования для достижения сжатия.
Видео Файлы
Ч. 264:-
Эксперты кинофильмов группы (в формате MPEG)-4, часть 10, усовершенствованное кодирование, также известный как H. 264-это стандарт сжатия С потерями, что популярно на сегодняшний день использовать. Наиболее популярное применение этого формата в кодировке проигрыватель Blu-ray дисков. Он использует сочетание разных lossy и lossless алгоритмы кодирования.

Обратно в индекс
В двух словах, сжатие С потерями-это ничто иное, как улучшение по сравнению с сжатием без потерь, поскольку функция уменьшения размера файла с помощью методов сжатия обеспокоен.

Однако, сжатие приведет к ухудшению качества данных/сигнала в случае ее осуществления за пределы определенной степени. Это просто происходит потому, что в конце приемника, исходный сигнал должен быть реконструирован из данных недостаточно, в то время как при сжатии С потерями, каждый последний бит Не кодируется.

Оба метода lossless и lossy лучше всего подходят для их применения, и это будет бесполезно пытаться использовать технику любой категории как синонимы.

Мы надеемся, что нам удалось выявить сходства и различия между сжатием С потерями и без потерь данных.


Комментарии


Ваше имя:

Комментарий:

ответьте цифрой: дeвять + пять =



Сжатие С Потерями Против. Сжатие Без Потерь Сжатие С Потерями Против. Сжатие Без Потерь