цифровые технологии и качественный звук

Тенденции в развитии аудио высокого разрешения, 2015

январь 2015


Доклад подготовлен Техническим комитетом «Аудио высокого разрешения» в начале 2015 года. Указанный орган является одним из 22 технических комитетов Международного общества аудиоинженеров (AES, Audio Engineering Society) и координирует его работу в сфере звукозаписи и звуковоспроизведения с высоким разрешением. Оригинал – на английском языке.


Последние годы были отмечены устойчивым ростом интереса к аудио высокого разрешения (АВР). АВР постепенно становится основным трендом  на рынках аудио для профессионалов и аудиофилов. Введение новых форматов и совершенствование технологий их обработки, наряду с ростом объемов доставки контента через интернет, а также значительное усилия со стороны индустрии, направленные на то, чтобы сделать АВР основным форматом, – всё это говорит об интересной и многообещающей перспективе на ближайшие несколько лет. Технический комитет «Аудио высокого разрешения» поддерживает проведение семинаров, обсуждений и издание инструктивных материалов, освещающих основные аспекты развития АВР, в интересах всего сообщества AES.

 

НОВЫЕ ФОРМАТЫ АВР

Наиболее заметным за последние два года стало возникновение и быстрое расширение использования DSD как независимого формата кодирования и распространения аудиоконтента. DSD — название, введённое компаниями Sony и Philips для обозначения однобитного формата, основанного на сигма-дельта-преобразовании, которое, вместе с соответствующей обработкой, используется для хранения и передачи данных, связанных с производством SACD. Наряду с оригинальным форматом DSD 64 Fs (64 x 44,1 кГц или 2,8224 МГц) в настоящее время используются форматы с увеличенной частотой дискретизации: 128 Fs и 256 Fs. Главным преимуществом использования более высоких частот является смещение области шума, который появляется вследствие преобразования динамического диапазона в сигма-дельта-конвертерах, далеко за пределы слышимого диапазона частот (> 60 кГц), а также снижение уровня шума квантования в аудиодиапазоне по сравнению с форматом 64 Fs. Считается, что DSD-сигнал звучит чище и прозрачнее при более высоких значениях частоты дискретизации.

Формат DSD связан также с форматом DXD, название которого используется для обозначения ИКМ-сигналов 352,8 кГц/24 дБ, сторонником которого является компания Merging Technologies, предложившая его в качестве промежуточного этапа для получения DSD. Поскольку при подготовке аудиозаписи цифровая обработка однобитного потока затруднительна, то, как правило, он предварительно преобразуется в ИКМ-сигнал с высокой частотой дискретизации. Некоторые инженеры звукозаписи используют DXD не просто в качестве промежуточного этапа, а как первичный формат звукозаписи для последующего выпуска в виде DSD, или как промежуточный формат межу записью и  выпуском в DSD-формате, или, возможно, в будущем, как ИКМ-формат 352,8 кГц для выпуска аудиозаписи.

Подобная тенденция использования более высоких частот дискретизации в форматах ИКМ и DSD поддерживается при производстве  потребительского и профессионального оборудования. Многие современные ЦАПы и АЦП могут обрабатывать оба формата – ИКМ и DSD. Новые преобразователи, программное обеспечение и даже портативных устройства всё чаще обеспечивают поддержку различных сигналов ИКМ от уровня компакт-диска (44,1 кГц/16 дБ) до 384 кГц/32 дБ и DSD 256 Fs, в то время как промышленность продолжает изучать как достоинства, так и степень интереса потребителей к этим форматам. Открытый стандарт для упаковки сигналов DSD в ИКМ-фреймы, известный как DoP*, был воспринят большинством производителей для облегчения передачи DSD через интерфейсы USB, а также AES и SPDIF.


УЛУЧШЕНИЯ В КОНВЕРТЕРАХ, ФИЛЬТРАХ И ОБРАБОТКЕ СИГНАЛОВ

В то время как  для получения высокого качества звука всегда стремились найти проблемные области, приводящие к его деградации, связанные с обработкой и фильтрацией музыкального цифрового сигнала, всё более высокое разрешение становится одновременно и результатом, и движущей силой этого поиска. В настоящее время производители высококачественных преобразователей прилагают усилия, направленные на устранение недостатков, свойственных микросхемам с повышением частоты дискретизации (upsampling) и многоразрядным сигма-дельта конвертерам, используемым практически повсеместно в ЦАПах для  обработки ИКМ-сигналов. Методы модернизации включают в себя замену микросхем на ПЛИС, осуществление повышения частоты дискретизации в компьютере, конструирование специальных фильтров, в том числе, фильтров с минимальной фазой, увеличение значения разрядности при обработке сигналов до  64 бит с плавающей запятой и выше, использование оригинальных схем сигма-дельта-модуляции и прореживания. Несколько производителей микросхем разработали более совершенные чипы с использованием указанных выше методов, улучшенными характеристиками по формированию шума, контролю джиттера, тактирования и развязки. Такие микросхемы все чаще появляются в новых АВР-совместимых аппаратах.

Теоретические и практические вопросы влияния фильтров на звук обсуждаются уже в течение длительного времени, и новая программа оценки, предложенная компанией Meridian Audio, направлена на исследование некоторых аспектов, связанных с различимостью этого влияния. В документе, представленном на 137-ом конгрессе AES компанией Meridian Audio (H.M. Jackson и др.), описаны результаты двойных слепых тестов оценки фильтров для даунсемплинга, обычно используемых при подготовке звукозаписи для компакт-дисков, в случае их применения для сигналов с более высоким разрешением (без прореживания), которые воспроизводились через высококачественную аудиосистему. Эти результаты оспаривают данные, ранее описанные Мэйером и Мораном (E.B. Meyer, D.R. Moran, J.A.E.S. 55: 775-779, 2007), и предоставляют подтверждение и возможное объяснение слышимых  различий в звучании компакт-диска и сигналов с высоким разрешением.


РАСПРОСТРАНЕНИЕ, ХРАНЕНИЕ И ВОСПРОИЗВЕДЕНИЕ

Распространение файлов АВР происходит в настоящее время главным образом через интернет. Существуют разнообразные веб-сайты для скачивания (от самых крупных до небольших, принадлежащих лейблам и исполнителям), которые предлагают новые записи и каталог ремастированных записей прошлых лет. В основном распространяются файлы ИКМ от 192 кГц/24 дБ до 44,1 кГц/16 дБ, но и форматы DSD 64 Fs и 128 Fs становятся всё более доступными. Хотя контент в форматах ИКМ 192 кГц и DSD 256 Fs еще не стал существенным фактором распространения на рынке, производители ЦАПов уже включают их поддержку в технические характеристики выпускаемых аппаратов, учитывая имеющиеся тенденции. FLAC, WAV и AIFF являются основными форматами для распространения сигналов ИКМ. Потоковая передача данных скорее всего сможет дополнить или даже заменить скачивание в будущем, как это происходит сейчас со сжатыми форматами музыки и видео. В настоящее время пропускная способность каналов связи ограничивает потоковую передачу музыки в форматах без потерь уровнем разрешения компакт-диска. Однако ожидается, что новый кодек под названием MQA, который недавно был предложен компанией Meridian Audio, сможет обеспечить кодирование сигналов более высокого разрешения без потерь, которое соответствует скорости передачи данных на уровне чуть ниже значения для компакт-диска. В случае успеха формат MQA может оказать сильное влияние на потоковую передачу аудио высокого разрешения.

Распространение скачивания музыкальных файлов связано с продолжающейся тенденцией по расширению применения компьютеров, файловых серверов и портативных цифровых устройств во всех сферах музыки, включая традиционный рынок двухканальной музыки для аудиофилов. Фильмы на дисках Blu-ray, содержащие фонограммы с высоким разрешением, также продолжают хорошо распространяться, несмотря на постоянное снижение продаж мультимедийного контента на физических носителях. Существует также ограниченный рынок дисков Blu-ray, предназначенных исключительно для высококачественного аудио.


НОВЫЕ РЫНКИ

Можно отметить две новые инициативы, направленные на внедрение аудио высокого разрешения в массовый рынок. Несколько факторов определяют эти усилия: во-первых, значительный успех крупных веб-сайтов, распространяющих на рынке файлы АВР для аудиофилов, и, во-вторых, увеличение запроса  на музыку с более высоким качеством звука, как результат неудовлетворённости уровнем звучания сжатых аудиоформатов.

Одна из инициатив – это проект Pono, который является результатом многолетних усилий певца Нила Янга и включает в себя создание портала для загрузки музыки с высоким разрешением и производство портативного цифрового проигрывателя оригинальной конструкции. Начало продаж Pono должно стартовать в конце 2014 года.

Второй пример – это совместная инициатива организаций Digital Entertainment Group (DEG), Consumer Electronics Association (CEA), Recording Academy и крупных звукозаписывающих компаний. Они разработали определение АВР и набор условных обозначений для указания происхождения источника будущего релиза. Участники этой инициативы организуют переговоры и демонстрации АВР на выставках, включая конгресс AES в 2014 году в Лос-Анджелесе. Отсутствие информации об источнике цифровой аудиозаписи был одним из основных моментов, часто вызывавших нарекания потребителей, поскольку многие диски DVD-A, SACD и загружаемые файлы, помеченные как аудио высокого разрешения, были получены простым повышением частоты дискретизации из  записи уровня компакт-диска. Таким образом, указание источника цифровой звукозаписи, хотя и не обязательное, является попыткой исправить это положение.

Следует отметить также ряд инициатив, направленных на повышение доступности многоканального аудио для  исследовательских и образовательном сообществ. К ним относятся такие проекты, как Open Multitrack Testbed, MedleyDB, Free Multitrack Download Library и Structural Segmentation Multitrack Dataset. Многие из них содержат отдельные записи, стемы и аудиомиксы, сделанные с качеством выше, чем у компакт-диска, и обычно включают в себя контент, доступный по лицензии типа Creative Commons, позволяющей в ограниченном виде его повторное использование или распространение.

Перевод Ю. Кузьмина

_________

* DoP (DSD over PCM) – метод передачи сигналов DSD с помощью ИКМ-фреймов (прим. переводчика)

Вверх