Очередной 143-й конгресс AES прошел в Нью-Йорке с 18 по 21 октября 2017 г. Традиционно на нем проводилось большое количество мероприятий: научная сессия, выставка, семинары, заседания технических комитетов, студенческие мероприятия и др.
Вступительную речь произнес профессор Принстонского Университета Эдгар Шери
фото 1 Эдгар Шери
Она называлась «Fooled by Audio» (буквально «одураченный звуком», хотя по смыслу точнее перевести как «введенный в заблуждение звуком») и была посвящена анализу исследований в области виртуальной реальности, цель которых - создание виртуального звукового пространства, практически не отличимого от реального. Современное состояние науки в этом направлении и было темой данного доклада.
Традиционную мемориальную Хайзеровскую лекцию по прочитала Лесли Энн Джонс, известный звукорежиссер и аудиопродюсер, в ней она рассказала историю свой карьеры в звукозаписи.
фото 2 Лесли Энн Джонс
На научной сессии работало восемь секций (прослушивание докладов на некоторых их происходило на четырех-пяти заседаниях).
На секции «Преобразователи» было представлено 22 доклада на четырех заседаниях.
В докладе китайских специалистов «Измерения АЧХ акустических систем в реальных условиях диффузного поля» (пр. 9823) предлагается метод измерения АЧХ акустических систем, используемых в тыловых системах для пространственного звуковоспроизведения, с помощью процессорной обработки импульсной характеристики, измеренной в ближнем поле.
В докладе проф. В. Клиппеля «Быстрые измерения громкоговорителей в реальном окружении» (пр. 9825) была представлена очень ценная методика измерений громкоговорителей в реальном помещении. Она позволяет получить такие же параметры (как линейные, так и нелинейные), как при измерениях в заглушенной камере. Это достигается с помощью введения компенсирующей функции, полученной из голографических измерений колебаний диафрагмы (метод был представлен в его докладе на предыдущем конгрессе). Учитывая сложность организации измерений в дорогостоящих заглушенных камерах, данная методика представляет большую практическую ценность.
В докладе «Использование повторяющейся многотоновой последовательности для определения нелинейных характеристик громкоговорителей» (пр. 9827) предлагается применить новую последовательность многотоновых сигналов со случайным распределением фаз для оценки нелинейных искажений. Такой метод измерений используется достаточно давно, и авторы считают, что предлагаемый ими сигнал лучше отражает нелинейные свойства громкоговорителей при исполнении музыки.
Специалисты фирмы Harman предложили «Неразрушающий метод измерений качества звука в беспроводных сетях» (пр. 9828), который можно использовать при передаче звука с помощью Wi-Fi и Bluetooth.
Очень полезные данные были представлены в докладе «Автоматический мониторинг электрических потенциалов слуховой системы с помощью стереотелефонов» (пр. 9858). В нем предложено для диагностики потери слуха использовать доступную недорогую методику для снятия электрических потенциалов слуховой системы (рис.1) и с помощью наушников создать автоматизированную систему контроля слуха вне клинических условий.
Рис. 1 - система для снятия электрических потенциалов в слуховой системе
В докладе «Объективное тестирование высококачественных акустических систем» (пр. 9835) предлагается методика контроля параметров High-End систем на протяжении всего цикла их эксплуатации.
Два доклада известного специалиста Д. Кили (пр. 9836, 9837) были посвящены теории расчета и методам проектирования линейных массивов. В частности, на рис. 2 показано сравнение характеристик направленности линейных массивов, составленных из монопольных и дипольных акустических излучателей.
Рис. 2 - сравнение характеристик направленности линейных массивов с монопольными и дипольными системами
В докладе специалистов из Австралии рассматривается метод расчета трехмерной характеристики направленности громкоговорителей из измеренной характеристики направленности только в горизонтальной плоскости, что значительно упрощает процедуру измерений (пр.9872).
Фирма Sony в докладе «Система измерения телефонов в слышимом диапазоне частот и за пределами 20 кГц» (пр. 9873) предложила методику измерения частотных характеристик стереотелефонов с помощью усовершенствованной системы «Искусственная голова» (рис. 3), позволяющую производить измерения в диапазоне до 100 кГц.
Рис. 3 - измерительная установка с искусственной головой
Новый тип МЕМS пьезоэлектрического громкоговорителя на силиконовой подложке представлен специалистами из немецкого института Fraunhofer Institute for Silicon Technology (пр. 9874). Громкоговоритель двухполосный (рис. 4) размером 10 х10 мм на основе цирконата титана может создавать давление выше 89 дБ на частотах выше 800 Гц.
Рис. 4 - МЕМС громкоговоритель
Среди коротких докладов (инженерных записок) относящихся к преобразователям можно выделить учебный доклад Д. Кили, посвященный проблеме слышимости нелинейных искажений в громкоговорителях на низких частотах (Е-378)
На секции «Системы озвучивания и звукоусиления» было представлено пять докладов.
Доклад Дж. Б. Мура и А. Дж. Хилла «Динамическая процессорная обработка низкочастотных сигналов для широкой площади озвучивания» (пр. 9903) предлагает метод процессорной обработки (DSP) для декорреляции аудиосигналов в системах звукоусиления с целью уменьшения эффектов гребенчатой фильтрации.
В докладе «Новая процедура для прямого измерения STI (Speech Transmission Index) (пр. 9904) предлагается усовершенствованная методика измерения STI - индекса передачи речи, позволяющая производить измерения с использованием полной матрицы для определения модуляционной функции (7 октав, 14 модуляционных частот) за 62,52 сек.
Доклад «Слепое измерение времени реверберации неизвестного акустического окружения» (пр. 9905) представляет метод, позволяющий определить время реверберации неизвестного помещения по записанному в нем акустическому сигналу, например, речи. Выделяется сигнал в паузе и по нему рассчитывается время спада, что позволяет рассчитать время реверберации на разных частотах.
В докладе «Экспериментальное исследование различных степеней диффузии (рассеяния) отраженного сигнала в помещении» (пр. 9906) предлагаются коэффициенты для оценки степени рассеяния отражений (SFDC) от различных поверхностей помещений для оценки отношения зеркально отраженной энергии к рассеянной на неровностях стен.
На секции «Пространственный звук» было представлено 18докладов.
Обзор современных методов бинаурального синтеза был представлен в докладе «Эффективные структуры многоканального виртуального пространственного аудиовоспроизведения» (пр. 9865), в нем рассмотрен прогресс в развитии алгоритмов и методов создания виртуальных многоканальных систем при бинауральном воспроизведении.
В докладе «Стабильная запись 3D-звука с плоскими микрофонными решетками с помощью кодирования характеристик направленности» (пр. 9866) рассматривается современная техника процессорной обработки, позволяющая формировать трехмерные характеристики направленности плоских микрофонных решеток для записи пространственного звука.
В докладе ведущих специалистов фирмы SCHOEPS Mikrofone GmbH Х. Виттека and Г. Тайле «Развитие и применение стереофонической многоканальной техники записи для 3D и виртуальной реальности» (пр. 9869) предлагается новая конструкция 8-канальной микрофонной системы (рис. 5), ORTF 3D, которая может использоваться в таких форматах, как Dolby Atmos, Auro 3D и др.
Рис. 5 - восьмиканальная микрофонная система с экраном
Создание цифровых фильтров, позволяющих изменить расположение виртуальных источников по высоте, было представлено в докладе фирмы Samsung «Различимое изменение подъема источника с использованием цифровых фильтров основанных на законах слуховой локализации» (пр. 9870).
Несколько докладов были посвящены проблемам учета индивидуальных особенностей передаточных функций головы (HRTF) на основе измеренных или рассчитанных антропометрических данных, с применением методов нейронных сетей и др., что подчеркивает важность этой темы в создании систем виртуальной реальности методами бинаурального синтеза.
К числу этих докладов относятся «Применение методов нейронных сетей для персонализации HRTF используя антропометрические измерения» (пр. 9860, Китай), « Метод для эффективного вычисления HRTF из сканированных данных головы» (пр. 9892, США) и др. (пр. 9890, пр. 9891,пр. 9893).
В докладе японских специалистов «Upmix-метод для 22-канальной системы звуковоспроизведения» (пр. 9861) предлагается алгоритм процессорной обработки сигналов, записанных в двухканальном и 5.1 форматах, позволяющий воспроизводить их через систему 22.2.
В докладе «Система 3D-звука, состоящая из двух боковых матриц по четыре громкоговорителя» (пр. 9862) представлена новая конфигурация пространственной системы, в которой благодаря использованию алгоритмов векторного панорамирования и свертке с передаточной функции головы удается получить трехмерную звуковую панораму, используя две боковых системы громкоговорителей (рис. 6).
Рис. 6 - пространственная система с боковыми линейками громкоговорителей
В докладе «Оценка бинауральных систем звуковоспроизведения по поведению слушателей в виртуальной реальности» (пр. 9895) рассматривается метод, позволяющий оценить качество бинауральных систем звуковоспроизведения с помощью решения различных задач, которые ставятся перед слушателями в виртуальном пространстве (рис.7).
Рис. 7 - слушатели в виртуальном пространстве
На секции «Применение в аудио» («Application in Audio») итальянскими специалистами был представлен интересный доклад «Оценка акустики римского театра Беневенто для отдельных слушательских мест» (пр.9884). В нем приведены результаты измерений основных акустических параметров реставрированного театра с помощью ненаправленного источника (рис. 8).
Рис. 8 - измерения в театре Беневенто
Измерения базовых параметров (время реверберации Т30, ЕДТ, С80, D50 и др.) показали, что параметры этого театра подходят для речевых сигналов (в частности, время реверберации не превышает 1 с), и не подходят для музыкальных, приведены некоторые рекомендации для улучшения акустических характеристик.
В докладе «Моделирование эффектов помещения на частотно-модулированных сигналах» (пр. 9885) исследуется, как реверберация помещения влияет на изменение мгновенной частоты модулированных звуковых сигналов. Целью исследования является разработка методов, которые смогут восстановить акустические параметры пространства из анализа записанных в нем музыкальных и речевых сигналов.
Доклад «Новые исследования мембранных низкочастотных поглотителей» (пр. 9886) посвящен сложной проблеме поглощения стоячих волн в помещении на низких частотах. Для этой цели были разработаны новые мембранные поглотители, обеспечивающие поглощение начиная с 40 Гц, предложены также варианты их размещения в помещении (рис. 9).
Рис. 9 - размещение мембранных поглотителей
Очень ценный доклад для обучения звукорежиссеров был представлен известным специалистом Джорджем Массенбургом «Динамический контроллер для тренировки технического слуха: методология, программное обеспечение и требуемые стимулы» (пр. 9888).
В коротком докладе е-372 рассматривался созданный в университете в Афинах новый программный комплекс, предназначенный для обучения студентов пению. Результаты его применения показывают, что студенты быстрее добиваются точности интонирования звуков.
На секции «Звукозапись и обработка» был представлен очень ценный доклад специалистов фирмы Dolby «Амплитудное панорамирование» (пр. 9853). В нем выполнен сравнительный анализ существующих методов пространственного панорамирования для многоканальных систем звуковоспроизведения, таких как Vector Base Amplitude Panning (VBAP), MultiDirection Amplitude Panning (MDAP), Distance-Based Amplitude Panning (DBAP) ,Optimal 3D Speaking Panning и др.
В докладе специалистов из Стэнфордского университета «Звукозапись в виртуальном окружении» (пр. 9854) предлагается методика записи голоса и музыкальных инструментов в виртуальном пространстве, созданном с помощью современных аурализационных технологий. Запись в таких необычных условиях требует особого подхода в выборе и расстановке микрофонов, приемов микширования и др.
В докладе «Изучение оценок уровней низких частот и громкости при воспроизведении через через громкоговорители и телефоны» (пр. 9855) представлены результаты экспериментов, позволившие установить, что различие в оценках составляет 1 дБ в уровнях низких частот и 2 дБ в уровнях громкости. В обоих случаях при прослушивании через громкоговорители звучание кажется более громким.
На секции был представлен целый ряд коротких докладов («Инженерные записки»). Из них можно отметить «Создание глобально распределенной в сети студии звукозаписи» (Е-365), где обсуждается опыт построения студии звукозаписи в режиме on-line, а также доклад «Запись, микширование и мастеринг с использованием единой микрофонной системы» (Е-368), где предлагается производить запись музыкальных ансамблей с помощью сферической решетки из 19 капсюлей и последующего применения разделяющих алгоритмов.
На секции «Процессорная обработка сигналов» можно выделить корейский доклад «Улучшение разборчивости речи для мобильных систем в шумном окружении» (пр. 9810), где рассматриваются два новых алгоритма Voice Quality Model (VQM) и Real-time Modulation (RMOD), основанные на изменении модуляционных характеристик речи.
В докладе специалистов из Digital Media Technology Lab, Birmingham University «Автоматическое уменьшение маскировки в процессе микширования с применением генетических алгоритмов» (пр. 9813) предлагается использование алгоритмов искусственного интеллекта для решения вопросов уменьшения маскировки в процессе микширования звуковых сигналов, подтвержденное результатами субъективных экспертиз.
В докладе «Бинауральное разделение источников, основанное на направленных свойствах спектральной мощности» (пр. 9845), предлагается метод автоматической локализации звуковых источников, основанный на выделении из бинауральных записей признаков, содержащихся в передаточных функциях головы (HRTF) и связанных с направленными свойствами спектральной мощности источников.
Самое большое количество докладов было на секции «Восприятие» (21 доклад), поскольку проблемы психоакустики всегда привлекают особое внимание специалистов.
Японский доклад «Изучение объективной техники оценок при малых различиях в качестве звука» (пр. 9817) посвящен проблеме оценок качества звучания нового поколения дисков Ultimate Hi Quality Compact Disc и установлению связей между различиями в оценках и технологическими особенностями изготовления дисков.
Актуальной проблеме оценок громкости радиовещательных программ был посвящен английский доклад «Альтернативные взвешивающие фильтры для измерений громкости в многоканальных программах» (пр. 9818). В нем предлагаются усовершенствование методики измерений по отношению к действующим рекомендациям ITU-Recommendation BS.1770.
В китайском докладе «Методы компрессии и компенсации аудиосигналов для миниатюрных громкоговорителей» (пр. 9819) предлагаются новые методы компрессии аудиосигналов для громкоговорителей с ограниченным динамическим диапазоном, используемыми в мобильных устройствах. Эти методы сохраняют спектральный баланс сигналов и обеспечивают лучшие субъективные оценки качества звучания.
Доклад «Оценка аутентичности KEMAR Mouth Simulator как повторяющегося источника речи» (пр. 9820) посвящен объективной и субъективной оценках новой модели симулятора речи G.R.A.S. Knowles Electronic Manikin for Acoustic Research (рис.10) с точки зрения повторяемости, точности и аутентичности воспроизводимого речевого сигнала.
Рис.10 - симулятор речи
Продолжаются многолетние исследования по поиску вербальных классификаций и построения многомерных шкал для музыкальных тембров. Последние результаты представлены в бразильском докладе «Эксперименты по классификации вербальных атрибутов оркестровых тембров» (пр. 9821)
Большая группа докладов была посвящена проблемам, связанным с восприятием звукового окружения в виртуальном пространстве (пр. 9820-9834). В них рассматриваются такие вопросы, как:
- точность локализации звуковых источников, расположенных как в вертикальной, так и в горизонтальной плоскости;
- оценка временных интервалов для эффекта предшествования; совпадение звуковых и визуальных образов;
- идентификации своего положения в виртуальном пространстве;
- оценка размеров и акустических свойств окружающего пространства и др.
Два доклада С. Олив (фирма JBL) (пр. 9830 и 9878) были посвящены проблеме анализа результатов слушательских тестов по оценке качества звучания вкладных телефонов (earphone) с различными видами АЧХ. Показано, что вариант, предложенный в предыдущих работах автора, получает лучшие слушательские оценки, чем форма АЧХ, рекомендуемая стандартами.
В докладе фирмы Dolby «Слуховая оценка искажений в телефонах» (пр. 9841) предлагается новая методика оценки нелинейных искажений, основанная на оценке отношения уровня гармоник синусоидального сигнала к уровню шума, и сравнению его с порогом маскирования в каждой критической полосе.
Доклад известного финского специалиста в области организации субъективных тестов Н. Захарова (пр. 9879) был посвящен сравнительному анализу различных шкал типа Continuous Quality Scale (CQS) (используемой в стандартеITU-R BS.1534-3), MUSHRA, Labelled Hedonic Scale (LHS) и др. для оценки качества AAC-кодеков.
В докладе специалистов из Университета Суррея «Слуховая оценка разделения источников для ремикширования музыки» (пр. 9880) рассматриваются шесть различных алгоритмов для разделения источников в записанных музыкальных отрывках (в случае, если оригинальные многоканальные треки недоступны). Это может быть полезным при создании ремиксов.
В докладе «Адаптивное низкочастотное расширение использующее слуховые фильтры» (пр. 9881) предлагается для расширения восприятия низких частот в мобильных устройствах использовать свойство слуховой системы, известное как «пропущенная фундаментальная». оно состоит в том, что, если в гармоническом спектре отсутствует фундаментальная частота, то слух ее «достраивает», создавая виртуальный основной тон. Предлагается подмешивать в подаваемый сигнал набор гармоник, которые создают в области низких частот виртуальный основной тон, увеличивая субъективное ощущение низких частот.
Самым интересным и информативным на этой секции был доклад специалистов фирмы Genelec «Возможности человеческого восприятия и их применение в профессиональном аудио» (пр. 9882). В нем были проанализированы результаты более 300 работ из области психоакустики, физиологии, нейропсихологии и др., касающиеся процессов получения информации от всех пяти органов чувств (слуха, зрения, обоняния, осязания, вкуса) и ее сознательного восприятия головным мозгом (рис. 11).
Рис. 11 - процесс приема и обработки информации
Сложный процесс переработки полученный информации перед поступлением ее в мозг и внутри мозга, например, для слуховой системы, показан на рис. 12.
Рис. 12 - структура обработки сигнала в слуховой системе
Он происходит с определенной скоростью, не превышающей 40 бит/сек и с определенной задержкой во времени, достигающей 400 мс для осознанного опознания полученной информации. Восприятие и обработка коротких стимулов, например, звуков длительностью 300-500 мс требует длительной тренировки (например, осознанное восприятие звуков в беглой иностранной речи). Именно поэтому опытные музыканты различают гораздо больше быстрых изменений во временной структуре музыкальных сигналов, чем неопытные. Существующие в настоящее время методы субъективной оценки аппаратуры, предложенные в стандартах ITU-R BS.1534-3, ITU-R BS.1116-3, используют стимулы постоянной длительности. Между тем анализ представленных данных об осознанной переработке информации показывает, что результаты оценок могут существенно отличаться при разных условиях: быстрое прослушивание, медленное прослушивание и тренированное прослушивание, что надо учитывать при оценках аппаратуры.
На секции «Образование в аудио» было представлено три доклада: первый посвящен проверке знаний студентов в освоении современных программ в области звукозаписи (пр. 9814), второй –методике обучения специалистов в области музыкальной реставрации и архивирования в австралийском национальном университете (пр. 9815), и третий - обучению следующего поколения специалистов в профессиональном аудио (пр. 9816, Англия).
На конгрессе было представлено 35 стендовых коротких докладов, тематика которых касалась теории линейных массивов, линейных микрофонных решеток, уточнения методов измерения передаточных функций головы HRTF, инверсной фильтрации импульсных характеристик помещения и др.
Кроме научной сессии, на конгрессе проводились научные и учебные семинары под руководством известных ученых. Тематика некоторых из них следующая: новые направления в тренировке технического слуха, практические 3D-акустические измерения, чему учат и чему должны учить студентов в аудиотехнологиях и др.
Как обычно большой комплекс мероприятий был связан со студенческой деятельностью: студенческая ассамблея, конкурс звукозаписей и др.
28 января 2018
Ирина Алдошина
Пока никто еще не оставлял комментарии. Вы можете быть первым.
Возможность оставлять комментарии доступна только для зарегистрированных пользователей.