Представляем вашему вниманию результаты открытого тестирования форматов за март / апрель 2011 года.

Вы можете скачать ZIP-архив, содержащий все результаты для всех образцов.

Ключи шифрования можно загрузить здесь и здесь.

Интерпретация результатов. По оси X представлены кодеки, по оси Y их рейтинг. 95% доверительные интервалы приведены для каждого кодека. Для каждого кодека рассчитывается средний рейтинг и отмечается середина этого интервала. Вертикальные отрезки построены с использованием дисперсионного анализа для каждого кодека. Этот анализ идентичен тем, которые были использованы в предыдущих тестах.

Можно сказать, что кодек будет лучше, чем другой с более чем 95% вероятностью, если нижняя граница интервала кодека выше или находится на уровне верхней границы интервала конкурирующего кодека. Стоит отметить, что это приблизительный анализ с некоторыми допущениями и доверие может быть намного больше во многих случаях.

Обратите внимание, что кодек CELT называется Opus, так как это имя будет использоваться при стандартизации формата.

Важное примечание: Эти участки представляют группу предпочтений (для определенной группы людей, которые участвовали в тесте). Индивидуальные предпочтения могут несколько отличаться. Лучший кодек для человека зависит от его собственных предпочтений и типа музыки, которую он предпочитает.

График полных результатов (30 образцов, 531 результат):

Крупным планом интересные результаты (30 образцов, 531 результатов):

Результаты для каждого образца

Страница с отдельными графиками для каждого образца здесь.

Таблица битрейтов

Настройки кодеков были откалиброваны, чтобы обеспечить ~64 кбит/с на большом разнообразии музыки.

Образцы были сжаты при следующих битрейтах:

Bootstrap анализ:

        Read 5 treatments, 531 samples => 10 comparisons
        Means:
              Vorbis   Nero_HE-AAC  Apple_HE-AAC          Opus    AAC-LC@48k
               3.513         3.547         3.817         3.999         1.656

        Unadjusted p-values:
                  Nero_HE-AAC   Apple_HE-AAC  Opus          AAC-LC@48k
        Vorbis        0.488         0.000*        0.000*        0.000*
        Nero_HE-AAC   -             0.000*        0.000*        0.000*
        Apple_HE-AAC  -             -             0.000*        0.000*
        Opus          -             -             -             0.000*

        Apple_HE-AAC лучше чем Vorbis (p=0.000)
        Apple_HE-AAC лучше чем Nero_HE-AAC (p=0.000)
        Opus лучше чем Vorbis (p=0.000)
        Opus лучше чем Nero_HE-AAC (p=0.000)
        Opus лучше чем Apple_HE-AAC (p=0.000)
        AAC-LC@48k хуже чем Vorbis (p=0.000)
        AAC-LC@48k хуже чем Nero_HE-AAC (p=0.000)
        AAC-LC@48k хуже чем Apple_HE-AAC (p=0.000)
        AAC-LC@48k хуже чем Opus (p=0.000)

        p-values adjusted for multiple comparison:
                  Nero_HE-AAC   Apple_HE-AAC  Opus          AAC-LC@48k
        Vorbis        0.490         0.000*        0.000*        0.000*
        Nero_HE-AAC   -             0.000*        0.000*        0.000*
        Apple_HE-AAC  -             -             0.000*        0.000*
        Opus          -             -             -             0.000*

        Apple_HE-AAC лучше чем Vorbis (p=0.000)
        Apple_HE-AAC лучше чем Nero_HE-AAC (p=0.000)
        Opus лучше чем Vorbis (p=0.000)
        Opus лучше чем Nero_HE-AAC (p=0.000)
        Opus лучше чем Apple_HE-AAC (p=0.000)
        AAC-LC@48k хуже чем Vorbis (p=0.000)
        AAC-LC@48k хуже чем Nero_HE-AAC (p=0.000)
        AAC-LC@48k хуже чем Apple_HE-AAC (p=0.000)
        AAC-LC@48k хуже чем Opus (p=0.000)

Дисперсионный анализ:

        FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
        Blocked ANOVA analysis

        Number of listeners: 531
        Critical significance:  0.05
        Significance of data: 0.00E+00 (highly significant)
        ---------------------------------------------------------------
        ANOVA Table for Randomized Block Designs Using Ratings

        Source of         Degrees     Sum of    Mean
        variation         of Freedom  squares   Square    F      p

        Total             2654        4521.67
        Testers (blocks)   530        1498.18
        Codecs eval'd        4        1893.65  473.41   888.29  0.00E+00
        Error             2120        1129.85    0.53
        ---------------------------------------------------------------
        Fisher's protected LSD for ANOVA:   0.088

        Means:

        Opus     Apple_HE Nero_HE- Vorbis   AAC-LC@4
          4.00     3.82     3.55     3.51     1.66

        ---------------------------- p-value Matrix ---------------------------

                 Apple_HE Nero_HE- Vorbis   AAC-LC@4
        Opus     0.000*   0.000*   0.000*   0.000*
        Apple_HE          0.000*   0.000*   0.000*
        Nero_HE-                   0.439    0.000*
        Vorbis                              0.000*
        -----------------------------------------------------------------------

        Opus лучше чем Apple_HE-AAC, Nero_HE-AAC, Vorbis, AAC-LC@48k
        Apple_HE-AAC лучше чем Nero_HE-AAC, Vorbis, AAC-LC@48k
        Nero_HE-AAC лучше чем AAC-LC@48k
        Vorbis лучше чем AAC-LC@48k

Примечания:

Графики основаны на простом дисперсионном анализе по всем достоверным результатам. Графики совместимы с результатами предыдущих тестов, но тем не менее, их следует рассматривать только как визуальное подтверждение реального анализа.

Для правильного расчета статистических вероятностей, и, чтобы можно было с уверенностью делать выводы, необходимо обратиться к Bootstrap анализу. Вы можете видеть, что результаты являются весьма значимыми, кроме одного сравнения (Vorbis против Nero HE-AAC).

По итогам тестирования:

Неверные результаты были отброшены в соответствии со следующими критериями, которые были обнародованы в начале испытания:

  • Если слушатель отметил эталонный образец хуже чем 4.5, результаты слушателя для этого образца были отброшены.
  • Если слушатель отметил нижний предел как 5.0 в образце, результаты слушателя для этого образца были отброшены.
  • Если слушатель отметил эталонные образцы хуже, чем 5.0 в более чем 4 образцах, все результаты этого слушателя были отброшены.
blog comments powered by Disqus