Результаты открытого тестирования форматов @ 64 кбит/с (март / апрель 2011 г.)
Представляем вашему вниманию результаты открытого тестирования форматов за март / апрель 2011 года.
Вы можете скачать ZIP-архив, содержащий все результаты для всех образцов.
Ключи шифрования можно загрузить здесь и здесь.
Интерпретация результатов. По оси X представлены кодеки, по оси Y их рейтинг. 95% доверительные интервалы приведены для каждого кодека. Для каждого кодека рассчитывается средний рейтинг и отмечается середина этого интервала. Вертикальные отрезки построены с использованием дисперсионного анализа для каждого кодека. Этот анализ идентичен тем, которые были использованы в предыдущих тестах.
Можно сказать, что кодек будет лучше, чем другой с более чем 95% вероятностью, если нижняя граница интервала кодека выше или находится на уровне верхней границы интервала конкурирующего кодека. Стоит отметить, что это приблизительный анализ с некоторыми допущениями и доверие может быть намного больше во многих случаях.
Обратите внимание, что кодек CELT называется Opus, так как это имя будет использоваться при стандартизации формата.
Важное примечание: Эти участки представляют группу предпочтений (для определенной группы людей, которые участвовали в тесте). Индивидуальные предпочтения могут несколько отличаться. Лучший кодек для человека зависит от его собственных предпочтений и типа музыки, которую он предпочитает.
График полных результатов (30 образцов, 531 результат):
Крупным планом интересные результаты (30 образцов, 531 результатов):
Результаты для каждого образца
Страница с отдельными графиками для каждого образца здесь.
Таблица битрейтов
Настройки кодеков были откалиброваны, чтобы обеспечить ~64 кбит/с на большом разнообразии музыки.
Образцы были сжаты при следующих битрейтах:
Bootstrap анализ:
        Read 5 treatments, 531 samples => 10 comparisons
        Means:
              Vorbis   Nero_HE-AAC  Apple_HE-AAC          Opus    AAC-LC@48k
               3.513         3.547         3.817         3.999         1.656
        Unadjusted p-values:
                  Nero_HE-AAC   Apple_HE-AAC  Opus          AAC-LC@48k
        Vorbis        0.488         0.000*        0.000*        0.000*
        Nero_HE-AAC   -             0.000*        0.000*        0.000*
        Apple_HE-AAC  -             -             0.000*        0.000*
        Opus          -             -             -             0.000*
        Apple_HE-AAC лучше чем Vorbis (p=0.000)
        Apple_HE-AAC лучше чем Nero_HE-AAC (p=0.000)
        Opus лучше чем Vorbis (p=0.000)
        Opus лучше чем Nero_HE-AAC (p=0.000)
        Opus лучше чем Apple_HE-AAC (p=0.000)
        AAC-LC@48k хуже чем Vorbis (p=0.000)
        AAC-LC@48k хуже чем Nero_HE-AAC (p=0.000)
        AAC-LC@48k хуже чем Apple_HE-AAC (p=0.000)
        AAC-LC@48k хуже чем Opus (p=0.000)
        p-values adjusted for multiple comparison:
                  Nero_HE-AAC   Apple_HE-AAC  Opus          AAC-LC@48k
        Vorbis        0.490         0.000*        0.000*        0.000*
        Nero_HE-AAC   -             0.000*        0.000*        0.000*
        Apple_HE-AAC  -             -             0.000*        0.000*
        Opus          -             -             -             0.000*
        Apple_HE-AAC лучше чем Vorbis (p=0.000)
        Apple_HE-AAC лучше чем Nero_HE-AAC (p=0.000)
        Opus лучше чем Vorbis (p=0.000)
        Opus лучше чем Nero_HE-AAC (p=0.000)
        Opus лучше чем Apple_HE-AAC (p=0.000)
        AAC-LC@48k хуже чем Vorbis (p=0.000)
        AAC-LC@48k хуже чем Nero_HE-AAC (p=0.000)
        AAC-LC@48k хуже чем Apple_HE-AAC (p=0.000)
        AAC-LC@48k хуже чем Opus (p=0.000)
          Дисперсионный анализ:
        FRIEDMAN version 1.24 (Jan 17, 2002) http://ff123.net/
        Blocked ANOVA analysis
        Number of listeners: 531
        Critical significance:  0.05
        Significance of data: 0.00E+00 (highly significant)
        ---------------------------------------------------------------
        ANOVA Table for Randomized Block Designs Using Ratings
        Source of         Degrees     Sum of    Mean
        variation         of Freedom  squares   Square    F      p
        Total             2654        4521.67
        Testers (blocks)   530        1498.18
        Codecs eval'd        4        1893.65  473.41   888.29  0.00E+00
        Error             2120        1129.85    0.53
        ---------------------------------------------------------------
        Fisher's protected LSD for ANOVA:   0.088
        Means:
        Opus     Apple_HE Nero_HE- Vorbis   AAC-LC@4
          4.00     3.82     3.55     3.51     1.66
        ---------------------------- p-value Matrix ---------------------------
                 Apple_HE Nero_HE- Vorbis   AAC-LC@4
        Opus     0.000*   0.000*   0.000*   0.000*
        Apple_HE          0.000*   0.000*   0.000*
        Nero_HE-                   0.439    0.000*
        Vorbis                              0.000*
        -----------------------------------------------------------------------
        Opus лучше чем Apple_HE-AAC, Nero_HE-AAC, Vorbis, AAC-LC@48k
        Apple_HE-AAC лучше чем Nero_HE-AAC, Vorbis, AAC-LC@48k
        Nero_HE-AAC лучше чем AAC-LC@48k
        Vorbis лучше чем AAC-LC@48k
          Примечания:
Графики основаны на простом дисперсионном анализе по всем достоверным результатам. Графики совместимы с результатами предыдущих тестов, но тем не менее, их следует рассматривать только как визуальное подтверждение реального анализа.
Для правильного расчета статистических вероятностей, и, чтобы можно было с уверенностью делать выводы, необходимо обратиться к Bootstrap анализу. Вы можете видеть, что результаты являются весьма значимыми, кроме одного сравнения (Vorbis против Nero HE-AAC).
По итогам тестирования:
Неверные результаты были отброшены в соответствии со следующими критериями, которые были обнародованы в начале испытания:
- Если слушатель отметил эталонный образец хуже чем 4.5, результаты слушателя для этого образца были отброшены.
- Если слушатель отметил нижний предел как 5.0 в образце, результаты слушателя для этого образца были отброшены.
- Если слушатель отметил эталонные образцы хуже, чем 5.0 в более чем 4 образцах, все результаты этого слушателя были отброшены.
 Audio Coding
 Audio Coding





