Audiophile's Software
foobar2000 audio player
Школа Linux. Развитие СПО в школе. Open Source

Speex

Speex Logo

Скачать Speex

Speex является свободным от патентов форматом для сжатия аудио, разработанным для передачи речи, а также для использования в открытом программном обеспечении (например, в направлении VoIP). Он основан на алгоритме для сжатия речи CELP. Speex заявляет о своей свободе от патентных ограничений и лицензирован под модифицированной (3-пунктовой) лицензией BSD. Он может быть использован в формате-контейнере Ogg или передан напрямую через UDP / RTP.

Разработчики Speex видят проект как дополнение к проекту общего назначения «Vorbis».

Speex является форматом сжатия с потерями, это означает, что качество ухудшается в пользу меньшего размера файлов.

Проект Speex был начат 13 февраля 2002 года. Первые версии Speex были лицензированы под LGPL лицензией, но, как только вышла версия 1.0 бета 1, Speex начал выпускаться под лицензией Xiph (модифицированной BSD). Speex 1.0 был анонсирован 24 марта 2003 года, после года разработки. Последняя стабильная версия кодека – 1.1.12 (на 20.02.11).

Описание

В отличие от многих других голосовых кодеков, Speex направлен не на сотовую связь, а на VoIP-телефонию и сжатие файлов. Целью проекта было желание сделать кодек, который будет оптимизирован для высококачественной передачи речи при низком битрейте. Чтобы достичь это, кодек использует различные битрейты, а также поддерживает различную частоту дискретизации:

  • 32 kHz – ultra-wideband
  • 16 kHz – wideband
  • 8 kHz – narrowband

Так как Speex затачивался изначально под VoIP-телефонию, вместо сотовой телефонии, кодек должен был быть устойчив к потерям пакетов, а не к их искажениям. Все это привело к выбору Линейного предсказания с мультикодовым управлением (CELP) как техники для кодирования. Одной из главных причин, по которой была выбрана CELP, являлась то, что эта техника уже хорошо зарекомендовала себя, как на низких битрейтах (что очевидно по DoD CELP на 4.8 kbit/s), так и на высоких (G.728 на 16 kbit/s). Основные характеристики могут быть описаны следующим образом:

  • Свободное программное обеспечение с открытыми исходными кодами и свободное от авторских гонораров.
  • Возможность использования различных частот дискретизации при одинаковом битрейте.
  • Широкий выбор доступных битрейтов (от 2 kbit/s до 44 kbit/s).
  • Динамически изменяемый битрейт и переменный битрейт (VBR).
  • Обнаружение Активности Голоса (Voice Activity Detection VAD, совместно с VBR) (убрано из версии 1.2)
  • Переменная сложность.
  • Режим высокой частоты дискретизации 32 kHz (вплоть до 48 kHz)
  • Intensity Stereo как опция сжатия.

Файлы

17.01.2012 01:11
15.01.2012 23:04
31.10.2011 22:51
29.10.2011 19:07
25.10.2011 01:51