С 4 по 7 июня 2016 г. в Париже прошел 140 конгресс AES. Председателем конгресса был известный ученый М. Вильямс, автор десятков статей, докладов на конгрессах и книг, посвященных проблемам выбора микрофонов для современных систем Surround Sound.
Председатель конгресса М. Вильямс
Открытие конгресса включало церемонию награждения и приветственную речь, которую произнес вновь избранный Президент AES Алекс Кейс, профессор Массачусетского Университета, специализирующийся в области процессорной обработки звука. Его речь называлась «Интуиция, сопротивление, мужество и удача: исторические моменты в создании сигнальных процессоров - вот то что важно сегодня».
Традиционную мемориальную Хайзеровскую речь произнесла Р, Николь, автор многочисленных статей и книг, посвященных современным пространственным системам звукового воспроизведения. Доклад назывался «3D-аудио революция - от лаборатории к массовому рынку», в нем содержался обзор современных пространственных систем от 5.1 до 7.1, Dolby Atmos, Auro-3D, Wave Field Synthesis, Ambisonic и др., а также был представлен анализ современного состояния исследований бинауральной адаптации любых многоканальных систем к прослушиванию через стереотелефоны, что открывает новые возможности для их массового внедрения.
На конгрессе работали: научная сессия, включающая 23 секции с докладами и четыре сессии с инженерными записками, учебные и научные семинары, специальные события, технические туры и студенческие мероприятия.
На секции «Акустика помещений» было представлено восемь докладов. Из них можно отметить следующие.
«Направление поздней реверберации и восприятие пространственности в двух концертных берлинских залах» (пр. 9503),в котором представлены результаты измерений поздних (после 80 мс) отражений, приходящих из различных направлений, в двух концертных залах (рис.1) Показано, что на ощущение окружения звуком (LEV), влияют не только боковые отражения, но и отражения от потолка и задней стены.
Рис 1 план концертного зала (размещение излучателей и приемника)
В докладе «Электронная оболочка» - улучшение акустики залов с отсутствием сцены с использованием активного контроля звукового поля (пр. 9504) (фирма Yamaha) предлагается метод электронного моделирования параметров сцены в залах, где сценическое пространство отсутствует. В выделенном пространстве зала звук от исполнителя подается на несколько микрофонов, обрабатывается с целью моделирования ранних отражений и подается с различными амплитудами и фазами на громкоговорители, размещенные в выделенном пространстве (Active Field Control). Обратная связь, возникающая между громкоговорителями и микрофонами, поддерживается ниже уровня самовозбуждения, в результате удается достичь обогащения звука ранними отражениями, увеличения общей звуковой энергии и времени реверберации для исполнителей и обогащения звука ранними отражениями для слушателей (сила звука в зале увеличивается более чем на 2 дБ), что сопоставимо с параметрами обычной сцены. Субъективные прослушивания показали, что качество звучания существенно улучшается как для исполнителей, так и для слушателей (рис.2).
Рис. 2 - структура электронного оборудования
В докладе «Экспериментальные оценки низкочастотных электроакустических поглотителей для демпфирования стоячих волн в помещениях (пр. 9505)» представлены активные акустические системы с встроенным микрофоном, в которых сигналы от падающих звуковых волн поступают на микрофон, оцифровываются, обрабатываются, затем (после ЦАП) подаются на звуковые катушки громкоговорителей (рис.3) с тем, чтобы общий импеданс акустической системы максимально соответствовал импедансу в воздушной среде на данной частоте, при этом коэффициент отражения стремится к нулю, а коэффициент поглощения максимально увеличивается, в связи с чем данная мода (форма) колебаний практически полностью поглощается. Обычно такие системы размещаются в углах прямоугольного помещения. Электроакустические поглотители значительно уменьшают возникновение стоячих волн на определенных частотах и тем самым уменьшают вероятность «окрашивания» звука.
Рис. 3 - конструкция электроакустического поглотителя
Новый численный метод решения волнового уравнения в помещениях различных конфигураций, имеющий определенные преимущества перед методом конечных элементов, обычно применяемым в этих случаях, был предложен в докладе «Моделирование непрямоугольных помещений методом МММ (Mode Matching Method)» (пр. 9506).
Новая разработка мощного ненаправленного громкоговорителя в форме додекаедра (рис.4) для проведения измерений в помещении с высоким уровнем шумов была представлена в докладе «Акустические измерения с использованием мощного громкоговорителя Додекаедрона» (пр. 9507).
Рис. 4 - общий вид излучателя Додекаедрон
В сербском докладе «Новые методы проектирования контрольных комнат для многоканальных записей» (пр. 9526) рассматриваются различные конструктивные решения при проектировании современных контрольных комнат (пример конструкции потолка показан на рис. 5).
Рис. 5 - конструкция потолка в студии
На секции «Инструментарий и измерения» можно выделить доклад известного специалиста В. Клиппеля «Вращающие формы колебаний диафрагм громкоговорителей, ч.2» (пр. 9496), в котором представлены дополнительные результаты изучения этих видов искажений, возникающих за счет дисбаланса сил, жесткостей и масс в громкоговорителях. Предложены новые методы их измерений и диагностики.
В докладе английских специалистов «Характеристики и измерения ветра вокруг микрофонов» (пр. 9495) приведены результаты продолжающихся исследований (доклад на эту тему был на предыдущем конгрессе) по анализу профилей различных видов шумов, которые создаются с помощью специального генератора, и оценке их влияния на параметры микрофонов.
В докладе Дж. Вандеркоя «Измерения гармонических искажений для идентификации нелинейных систем» (пр. 9497) предлагается методика для измерения не только амплитуд, но и фаз гармонических составляющих, возникающих при наличии нелинейных искажений в громкоговорителях, что необходимо для их идентификации и моделирования.
Специалисты Принстонского Университета представили доклад «Метрики для оценки постоянства характеристик направленности» (пр. 9501), в котором предложены критерии для оценки степени постоянства характеристик направленности громкоговорителей в широком диапазоне частот, что важно для их проектирования. В качестве таких критериев предлагается использовать стандартную девиацию индекса направленности и кросс-корреляцию полярных характеристик.
На секции «Аудиооборудование и аудиоформаты» был интересный доклад немецких специалистов «Анализ современных МЕМS-микрофонов для эффективных микрофонных решеток - практическое применение» (пр. 9486), в котором анализируются параметры решетки из миниатюрных микрофонов на силиконовой подложке, широко используемых в настоящее время для формирования управляемой характеристики направленности, например в конференц-системах. Образец конструкции такой решетки показан на рис. 6.
Рис. 6 - микрофонная решетка
Несколько секций были посвящены теме «Процессорная обработка аудиосигналов». Среди представленных на них докладов, можно выделить следующие.
Группа специалистов фирмы Dolby представила доклад «АС-4 - новое поколение аудиокодеков» (пр. 9491), в котором дан подробный анализ параметров и возможностей кодека АС-4, поддерживающего пространственное и персональное аудио, синхронизацию видеофреймов, диалоговые возможности, управление громкостью и многое другое, и предназначенного для радиовещательных и интернет-потоков.
Доклад специалистов из IRCAM «Установление индивидуализированных HRTF в реальных условиях» (пр. 9520) был посвящен проблеме установления индивидуальных передаточных функций головы и ушных раковин (HRTF), необходимых для максимально точного воспроизведения пространственного звука через телефоны. Этой проблемой занимаются многие исследователи, созданы методы точного расчета индивидуальных передаточных функций с помощью численных моделей ушных раковин, измеренных в заглушенных камерах для каждого слушателя и др., но все они чрезвычайно трудоемки. В данной работе предлагается методика выбора HRTF из базы данных на основе индивидуального прослушивания бинауральных записей слушателями в реальных условиях, и оценке их локализационных особенностей.
Аналогичной проблеме был посвящен немецкий доклад «Несоответствие между междуушной разницей уровней(ILD) для головы и ее сферической модели» (пр.9522), в котором детально изучается, за счет каких параметров головы возникает расхождение в определении ILD на сфере. Показано, что сильнее всего влияет глубина головы и расположение входа в ушной канал, эти параметры в значительной степени и определяют индивидуальные отличия HRTF.
Наконец, третий доклад, представленный специалистами из Берлинского Университета и посвященный проблеме индивидуализации HRTF, назывался «Получение антропометрических данных из 3D-сеток для индивидуализации HRTF»(пр. 9579). В нем предлагается метод измерения параметров головы, плеч и ушных раковин с помощью 3D-сканера и построения трехмерных сеток (рис. 7), с помощью которых извлекаются все необходимые антропометрические данные, необходимые для построения индивидуальных HRTF. Методика была проверена на 61 испытуемом.
Рис. 7 - трехмерная сетка для модели головы
В докладе «Алгоритм, основанный на пространственном анализе для ремастеринга законов панорамирования стереосигналов» (пр. 9523) предлагается новый алгоритм для изменения закона панорамирования в уже записанном стереосигнале для обогащения его пространственными свойствами.
На секции «Создание живого звука и upmix» (термин upmix используется для операции перевода аудиозаписи в более высокий порядок - моно в стерео, стерео в 5.1 и т.д. – прим. авт.) было представлено два доклада.
«Гибридное приближение для микширования живого пространственного звука» (пр. 9527), в котором предлагается новая техника микширования для систем озвучивания больших пространств, в которой сочетается объектно- ориентированное микширование (как в системах Dolby Atmos) с воспроизведением по системе Wave Field Synthesis (о ней уже было рассказано в статьях по предыдущим конгрессам), которая обладает большим преимуществом, состоящем в том, что расположение мнимых источников стабильно в пространстве и не зависит от положения слушателей (рис.8). В докладе приведены примеры установки таких систем.
Рис. 8 - стабильное расположение источников в системе WFS
Второй доклад «Моно в стерео - upmix» (пр. 9528) предлагает решение проблемы преобразования моносигнала в стерео (эта задача решается уже много десятилетий) с использованием современной техники процессорной обработки, для чего сигнал расщепляется на передний и тыловой, затем тыловой сигнал декоррелируется и микшируется в стереосигнал. Блок-схема показана на (рис.9)
Рис. 9 – блок-схема перевода сигнала из моно в стерео
На секции «Управление аудиоконтентом и приложения в аудио» был представлен доклад фирмы Dolby «Развитие средств для современных аудиокодеков» (пр. 9537).
Доклад специалистов из известного Фраунгоферского института назывался «Применение глубоких нейронных систем для компрессии динамического диапазона в процессе мастеринга» (пр. 9539).
В докладе фирмы Genelec «Поглощающие материалы в акустических системах с фазоинвертором» (пр. 9541) дана теория расчета турбулентных воздушных потоков в фазоинверторах и показано влияние различного расположения поглощающих материалов внутри корпуса.
На секции «Техника записи и воспроизведения» наиболее интересным был доклад председателя конгресса M. Вильямса «Конструкция микрофонной системы для полного полусферического звукового воспроизведения» (пр. 9569), в котором предлагается 13-канальная микрофонная система (рис. 10), для воспроизведения через 13 громкоговорителей полусферической конфигурации.
Рис.10 - система из 13 микрофонов
Как система микрофонов, так и громкоговорителей использует восемь каналов для горизонтальной плоскости, четыре канала для плоскости с подъемом 45 град и один канал на вершине под углом 90 град. Рассматриваются преимущества такой системы, и намечается следующий шаг – переход на 16-канальный формат, который получил название “Comfort 3D format”.
На секции «Системы воспроизведения» можно отметить английский доклад «Адаптивная система распределения виртуальных источников» (пр. 9574), в котором рассматривается система трансауральной стереофонии, (т.е. воспроизведение бинауральных сигналов через систему громкоговорителей, а не стереотелефонов). Эта система адаптируется к позиции слушателя, отслеживая положение головы и перестраивая систему задержек и подавителей перекрестных связей. (рис. 11).
Рис. 11 – блок-схема перестройки задержек
В докладе «Воспроизведение звукового поля через линейную систему громкоговорителей с виртуальным подъемом» (пр. 9575) предлагается метод, с помощью которого можно создать ощущение расположенных по высоте виртуальных источников при воспроизведении через линейную систему громкоговорителей. Это происходит за счет свертки сигнала с функцией, извлеченной из HRTF, которая несет информацию о высотном расположении источников.
Интересная идея представлена в греческом доклад «Cоздание MIDI-контроллера с использованием электроглоттографического сигнала» (пр. 9578), в котором предлагается голосовой сигнал конвертировать в MIDI-сообщение для использования голоса как контроллера для современных синтезаторов.
В китайском докладе «Метод создания мобильного звукового источника» (пр.9567)предлагается решение проблемы создания мобильного звукового 3D-источника, синхронизированного с 3D-видео, что чрезвычайно важно для индустрии кино и игр. Используется метод, основанный на принципах VBAP панорамирования (разработанный проф. В Пулкки), который позволяет обеспечить источнику различные траектории и скорости в 3D-пространстве.
В докладе ученых под руководством известного польского профессора Б. Костек «Графический интерфейс для создания музыки с учетом эмоционального содержания» (пр. 9568) приведены результаты многолетнего труда авторов по изучению базовых эмоций в музыке и созданию методов их автоматического распознавания.
В американском докладе «Пространственная процессорная обработка музыки для воспроизведения через телефоны» (пр. 9593) предлагается еще один алгоритм «ear Goggles» для экстернализации (создания впечатления внешнего звучания – прим. ред.) музыки при прослушивании через телефоны с учетом передаточных функций HRTF в помещении.
На секции «Окружение (погружение) звуком» можно отметить немецкий доклад «Декомпозиция и разделение стереосигнала при переводе из стерео в 3D (upmix)» (пр. 9586)/ В нем предлагается новый алгоритм преобразования стереосигнала в восьмиканальный пространственный звук, включая два высотных канала (рис. 12).
Рис. 12 - блок схема преобразования стереосигнала в восьмиканальный
В докладе лаборатории Dolby «Конструкция и субъективная оценка оптимизированных виртуалайзеров для телефонов» (пр. 9588) предлагается оптимизированная процедура экстернализации для стереотелефонов при сохранении натуральности тембров, с учетом бинауральных импульсных характеристик помещения, которые отбираются с учетом субъективных тестов.
В докладе специалистов из Парижской консерватории и Университета McGill (Канада) «Слуховая оценка программы «Transpan» для 5.1 микширования акустических записей» (пр. 9590) предлагается новый программный продукт Transpan, предназначенный для микширования записей по системе 5.1 с учетом бинаурального подавления перекрестных связей (как в трансауральной стереофонии), что улучшает локализацию боковых источников и стабильность их к смещению слушателей. Структурная схема «Transpan» показана на рис. 13.
Рис. 13 - структурная схема TRANSPAN
На секции «Качество звука» был представлен японский доклад «Субъективная оценка высококачественного звучания через телефоны» (пр. 9529), в котором рассматривалось различие в субъективных оценках высококачественного звукового материала, прослушанного через телефоны и громкоговорители. Отмечено, что через телефоны лучше дифференцируются тонкие детали в звучании, а через громкоговорители - впечатление присутствия и реализма.
Фирма Dolby предложила доклад «Методология для многоразмерной оценки качества пространственного звука» (пр. 9533), в нем предлагается новая методика оценки пространственного звука, которая позволяет точнее определять пространственные свойства звукового объекта, в том числе траекторию его движения.
В докладе «Различие между стереофонией и системами волнового синтеза (WFS) в контексте популярной музыки» (пр. 9533) представлены результаты эксперимента по сравнительной оценке двух разных систем воспроизведения (рис. 14). При этом отмечается, что требуется отработка специальной техники микширования для систем WFS, и показано, что применение таких систем может существенно обогатить опыт прослушивания популярной музыки.
Рис. 14 - расположение источников в системах стерео и WFS
Самое большое количество докладов (более 30) было представлено на секции «Восприятие», поскольку вопросам психоакустики в настоящее время уделяется особое внимание. Доклады были разнесены на три отдельных заседания.
В итальянском докладе «Восприятие низкочастотных переходных процессов в малых помещениях для музыки» (пр. 9512) отмечается, что хотя обычно акустические свойства малых помещений оцениваются в частотной области, необходимо фиксировать их реакцию во временнóй области, т.е. при возбуждении короткими музыкальными звуками. Было предложено ввести новый критерий «Инерция помещения».
В английском докладе «Анализ локализационных порогов для музыкальных источников» (пр. 9513) были установлены дифференциальные пороги различимости вертикальных каналов, под которыми понимается величина уменьшения уровня звукового давления верхних громкоговорителей до уровня, при котором мнимый источник начинает локализоваться в плоскости нижних громкоговорителей. Эта величина для конфигурации, представленной на рис. 15, составляет -9,5дБ.
Рис. 15 - расположение громкоговорителей в двух слоях
В докладе «Слуховое восприятие позиции слушателя в виртуальных помещениях, созданных с помощью бинаурального синтеза» (пр. 9517) представлены результаты экспериментов по определению способности слушателей определять свою позицию в виртуальных пространствах, что важно для современной киноиндустрии и индустрии игр.
В докладе специалистов из Университета Surrey (Англия) «Гармонический центроид как предсказатель тембральной ясности струнных инструментов» (пр. 9557) приводятся результаты субъективных оценок ясности (четкости) спектра в зависимости от положения центроида (частоты, где находится максимальное значение спектральной энергии). Показано, что при перемещении положения центроида в область высоких частот ясность (а также яркость) тембра возрастает.
В шведском докладе «Влияние акустики помещения на музыкальное исполнение» (пр. 9584) представлены результаты экспериментов по оценке влияния акустических свойств помещения (в частности, времени реверберации) на музыкальное исполнение, установлено, например, что темп исполнения возрастает, когда время реверберации уменьшается. Выявлен целый ряд других исполнительских нюансов, на которые влияют акустические параметры помещения.
Наряду с научными докладами значительно увеличилось количество коротких сообщений на сессиях «Инженерные заметки».
Наиболее интересные из них можно отметить следующие: «Анализ звукового давления в закрытых корпусах акустических систем» (ЕВ236), где представлена численная модель для расчета распределения звукового давления внутри корпусов закрытых акустических систем как на низких (рис. 16), так и на средних и высоких частотах, где проявляются резонансные свойства объема воздуха. Показано, что на низких частотах давление достигает 130 дБ.
Рис. 16 - распределение звукового давления внутри корпуса АС
Сообщение «Аэродинамические явления в фазоинверторах» (ЕВ257) содержит результаты изучения эффектов возникновения создающих дополнительные шумы турбулентных вихрей в струе из фазоинвертора в корпусах громкоговорителей,.
В сообщении известного специалиста по разборчивости речи П. Маппа «Влияние дискретных отражений на восприятие разборчивости и измерения коэффициента STI» (ЕВ248) показано, что хотя первые отражения влияют на субъективное восприятие разборчивости, это никак не отражается на измеренных значениях используемого в настоящее время индекса передачи речи STI, что требует введения новых коэффициентов.
В японском сообщении «Изучение локализации объектов в системе Dolby Atmos с использованием нового метода визуализации» (ЕВ253) предлагается новый визуалайзер VSV,который может показывать перемещение объектов в 3D-пространстве (рис. 17), например при воспроизведении в системе Dolby Atmos.
Рис. 17 - визуализация перемещения объекта
В сообщении «Создание лаборатории для 3D-аудио и видео» при Университете в Гонг Конге, описывается оборудование центра, включающего в себя театр и лаборатории с различными пространственными звуковыми системами на 24.2 канала и 5 HD видеоэкранами.
В сообщении «Виртуалайзеры для телефонов для мониторинга пространственного звука» (ЕВ271) предлагается способ оценки различных аудиоформатов (Dolby Atmos,Auro-3D, DTS-X и др.) с помощью создания в телефонах перестраиваемой системы виртуальных громкоговорителей.
Как и на предыдущих конгрессах работали учебные (27) и научные семинары (19), тематика некоторых из них следующая:
В полном объеме проводились студенческие мероприятия: студенческая ассамблея, соревнования звукозаписей, конкурс научных докладов и др.
12 августа 2016
Ирина Алдошина
Пока никто еще не оставлял комментарии. Вы можете быть первым.
Возможность оставлять комментарии доступна только для зарегистрированных пользователей.