Логотип Speex

Сайт проекта

Расширение файлов: .spx

Speex является свободным от патентов форматом для сжатия аудио, разработанным для передачи речи, а также для использования в открытом программном обеспечении (например, в VoIP-телефонии). Он основан на алгоритме для сжатия речи CELP. Speex заявляет о своей свободе от патентных ограничений и лицензирован под модифицированной (3-пунктовой) лицензией BSD. Он может быть использован в формате-контейнере Ogg или передан напрямую через UDP / RTP.

Разработчики Speex видят проект как дополнение к проекту общего назначения "Vorbis".

Speex является форматом сжатия с потерями, это означает, что качество ухудшается в пользу меньшего размера файлов.

История

Проект Speex был начат 13 февраля 2002 года. Первые версии Speex были лицензированы под LGPL лицензией, но, как только вышла версия 1.0 бета 1, Speex начал выпускаться под лицензией Xiph (модифицированной BSD). Speex 1.0 был анонсирован 24 марта 2003 года, после года разработки.

Начиная с версии 1.2rc2 исходные коды проекта были разделены на кодек Speex и библиотеку SpeexDSP.

Последняя версия 1.2rc3 библиотеки SpeexDSP датируется 3 января 2015 года.

На данный момент формат является устаревшим. На его замену пришел более современный и прогрессивный Opus. Всем пользователям рекомендуется переключиться на Opus, так как он лучше во всех аспектах.

Описание

В отличии от многих других голосовых кодеков, Speex был создан не для сотовой связи, а для VoIP-телефонии и сжатия файлов. Целью проекта было желание сделать кодек, который будет оптимизирован для высококачественной передачи речи при низком битрейте. Чтобы достичь это, кодек использует различные битрейты, а также поддерживает различную частоту дискретизации:

  • 32 kHz — ultra-wideband
  • 16 kHz — wideband
  • 8 kHz — narrowband

Так как Speex затачивался изначально под VoIP-телефонию, вместо сотовой телефонии, от кодека в первую очередь требовалась устойчивость к потерям пакетов, а не к их искажениям. Все это привело к выбору Линейного предсказания с мультикодовым управлением (CELP) как техники для кодирования. Одной из главных причин, по которой была выбрана CELP, являлась то, что эта техника уже хорошо зарекомендовала себя, как на низких битрейтах (что очевидно по DoD CELP на 4.8 kbit/s), так и на высоких (G.728 на 16 kbit/s). Можно выделить следующие основные характеристики кодека:

  • Программное обеспечение с открытыми исходными кодами, свободное от авторских гонораров.
  • Возможность использования различных частот дискретизации при одинаковом битрейте.
  • Широкий выбор доступных битрейтов (от 2 kbit/s до 44 kbit/s).
  • Динамически изменяемый битрейт и переменный битрейт.
  • Обнаружение Активности Голоса (Voice Activity Detection VAD, совместно с VBR) (убрано из версии 1.2).
  • Переменная сложность.
  • Режим высокой частоты дискретизации 32 kHz (вплоть до 48 kHz)
  • Intensity Stereo как опция сжатия.