145 конгресс AES – научные результаты

С 17 по 20 октября 2018 г в Нью-Йорке прошел очередной 145 конгресс Международного общества аудиоинженеров (AES), который собирает до пятнадцати тысяч посетителей из более чем 50 стран. Процедура проведения конгресса включает в себя набор мероприятий, таких как научная сессия, семинары, выставка, студенческие конференции и др.

Вступительную лекцию прочитал Томас Долби – музыкант, композитор, продюсер, профессорУниверситета Джонса-Хопкинса в Балтиморе.Его лекция была посвящена анализу грядущего поколения звуковых технологий, она называлась “The Conscious Sound Byte” (можно перевести как «Мыслящий цифровой звук»).

Томас Долби

Традиционную мемориальную Хайзеровскую лекцию читал на этом конгрессе Джон Майер, глава фирмы Meyer Sound Labs в Беркли, Калифорния, США на тему «Новые инструменты для прозрачного звуковоспроизведения», в которой он дал обзор новых методов измерения громкоговорителей и современных студийных мониторов фирмы Meyer Sound.

Джон Майер

На научной сессии работало двенадцать секций, заседания на некоторых из них проходили в течение нескольких дней из-за большого количества докладов.

Секция « Преобразователи» была одной из самых многочисленных, на ней было заслушано на трех заседаниях 17 докладов. На первом заседании был представлен совместный доклад фирмы Dolby и Университета Аахена (Германия) «Акустическое моделирование свернутых рупорных громкоговорителей» (пр. 10047), который был посвящен созданию моделей расчета таких излучателей, рассматриваемых как системы с сосредоточенными параметрами.

Два доклада А. Войшвилло (фирма JBL, США), были также посвящены рупорным громкоговорителям. Первый (пр. 10050) – анализу новой конструкции громкоговорителя с кольцевой диафрагмой, нагруженной с тыльной стороны на компрессионную камеру.В докладе представлена теория расчета и результаты измерений электроакустических параметров полученной конструкции.

Конструкция нового драйвера JBL

Второй доклад (пр. 10061) предлагает новый подход к оценке эффективности и чувствительности рупорных громкоговорителей.

В финском докладе фирмы Genelec (пр. 10059) представлен анализ различных методов применения обратной связи в громкоговорителях, достаточно давно используемых для линеаризации характеристик излучателей.

В докладе фирмы Samsung (пр. 10060) рассматривались методы нелинейной оптимизации звукового поля в помещении на низких частотах с помощью эквализации характеристик низкочастотных громкоговорителей, размещенных в разных точках помещения.

Моделирование и расчет нелинейных параметров фазоинверторов был представлен в докладе фирмы Harman (пр. 10062).

Доклад известнейшего специалиста в области громкоговорителей проф. В. Клиппеля (пр. 10054), обобщал опыт его многолетней работы по созданию метрологических методов и соответствующей аппаратуры для оценки параметров излучателей, и содержал предложения по созданию технологической линейки, позволяющей оценивать параметры громкоговорителей в течении всего производственного цикла их производства.

Последнее заседание было посвящено в основном микрофонам: в датском докладе «Модель акустической трансмиссионной линии для интерференционных труб в микрофонах» (пр. 10094) предлагалась уточненная теория расчета для таких параметров интерференционных труб в остронаправленных микрофонах (типа Shotgun), как длина, диаметр, и акустическая проводимость (сопротивление). Там же приведены примеры расчета характеристик направленности.

На аналогичную тематику был представлен японский доклад «Shotgun-микрофоны с высокой направленностью со сверхдлинной трубой и цифровым уменьшением шумов» (пр. 10097). В нем предлагается метод уменьшения боковых лепестков в диаграмме направленности с помощью цифровой процессорной обработки.

Трубка микрофона типа Shortgun

Детальный анализ требований для организации прецизионных измерений микрофонов в процессе их производства представлен в американском докладе (пр. 10096) фирмы NTi Audio Inc.

В немецком докладе «Установление «открытости» наушников, основанное на измерении их акустического импеданса, отношения давлений и выбора других критериев» (пр. 10099) рассматривалась важная для развития бинаурального синтеза проблема выбора параметров наушников, обеспечивающих минимальное искажение бинаурального сигнала. В докладе предложен новый критерий Occlusion Index (OI), который характеризует степень «открытости» наушников.

Секция «Пространственный звук» явилась одной из основных на данном конгрессе. На ней было представлено 17 докладов по наиболее актуальным проблемам пространственных систем звукопередачи.

В докладе «Восприятие пространственно-распределенной реверберации при многоканальном звуковоспроизведении» (пр. 10076) представлены результаты субъективных экспертиз по оценке пространственного окружения слушателя в помещении при разном количестве каналов звуковоспроизведения. Было организовано прослушивание при 128 равномерно распределенных громкоговорителях. Исследование показало, что при малом числе каналов существенно меняется восприятие пространственности в зоне стереоэффекта и вне ее, при каналах выше 16 существенного различия нет, при дальнейшем увеличении каналов восприятие практически не меняется.

В докладе «Влияние бинауральных различий в характеристике направленности громкоговорителей на пространственную обработку» (пр. 10079) рассмотрено влияние при бинауральном восприятии различий характеристик направленности громкоговорителей, и предложен метод процессорной обработки, который компенсирует эту разницу и улучшает пространственный эффект.

В японском докладе «Генерация бинаурального сигнала с помощью линейки микрофонов для полупроизвольной позиции слушателя» (пр. 10122) рассматривается методика, позволяющая создать бинауральные сигналы, соответствующие разному положению слушателя относительно источника звука. Для этого производится запись источника с помощью линейки микрофонов, и из нее формируются бинауральные сигналы, соответствующие разному положению головы с учетом передаточных функций HRTF.

В английском докладе «Изучение влияния вращения головы при трансауральном воспроизведении» (пр. 10125) рассматривается проблема создания фильтров, позволяющих при воспроизведении бинауральных записей через громкоговорители (а не через наушники, как обычно это делается в бинауральной стереофонии) учесть повороты головы слушателя для сохранения бинаурального эффекта. Такая техника называется «трансауральная стереофония».

Трансауральная стереофония

Аналогичная проблема рассматривалась в японском докладе «Дизайн и применение бинаурального контроллера для контроля движения головы» (пр. 10121). Там был предложен метод создания бинаурального контроллера при воспроизведении через многоканальную систему громкоговорителей 22.2 (о которой было рассказано в предыдущих обзорах. Цель разработки – создание бинаурального сигнала, позволяющего учитывать движение головы.

Многоканальная система 22.2

В докладе «Индивидуализация передаточных функций головыHRTF» (пр. 10129) представлен обзор современных работ по очень актуальной для бинаурального синтеза проблеме – учету индивидуальных особенностей ушных раковин и соответственно специфике их передаточных функций, поскольку они оказывают существенное влияние на точность воссоздания пространственных характеристик звукового поля.

В японском докладе «Воспроизведение виртуального источника с помощью двух круговых линеек громкоговорителей» (пр. 10120) предлагается вариант системы волнового синтеза (WFS) (см. предыдущие обзоры), реализованной с помощью двух систем круговых громкоговорителей в жестком экране.

Система волнового синтеза

Несколько докладов было посвящено проблемам аудиовизуального взаимодействия. В частности в немецком докладе «От пространственной звукозаписи к аудиовизуальным системам виртуальной реальности» (пр. 10077) рассмотрена вся линейка систем, от пространственной записи сферическими микрофонными системами с одновременной видеозаписью камерами на 360 градусов, до воспроизведения через систему распределенных громкоговорителей и видеодисплеев.

В докладах «Влияние визуального контента на воспринимаемое качество звучания в системах виртуальной реальности» (пр. 10128) и «Пространственная аудиовизуальная интеграция» (пр. 10128) рассматривается влияние звукового сопровождения на воспринимаемый видеоконтент.

Секция «Процессорная обработка звука» включала несколько докладов.

Финский доклад «Морфинг и синтез музыкальных инструментов в многоразмерном латентном пространстве с использованием вариационного, конволюционного, рекурентного автокодера – VCRAE» (пр. 10035) предлагает новый метод синтеза музыкальных инструментов, основанный на моделировании различных музыкальных инструментов, их интерполяции в латентной области для получения новых инструментов, интерполяций различных стилей исполнения (не всегда физически реализуемых).

В докладе представителей фирмы Samsung (Корея, Англия, Россия - А. Попов, К. Осипов) «Повышение качества музыки с помощью новой архитектуры CNN» (пр. 10036) предлагается с помощью системы нейронных сетей новой архитектуры восстанавливать информацию, которая была потеряна в компрессированном музыкальном сигнале.

В докладе A.Феррейры «Физиологическая ценность характеристик групповой задержки во всепропускающих моделях вокального тракта» (пр. 10038) рассматривалась роль фазовых характеристик в моделях голосового тракта, которым обычно не уделялось такого внимания, как амплитудным характеристикам, и показано, что они оказывают влияние на качество синтезированной речи.

В английском докладе (Университет Рочестера) «Статистическая метрика для стабильности инструментального вибрато» (пр. 10069) предложен метод анализа инструментального вибрато. Показано, что этот вид частотной модуляции не является строго синусоидальным. Предлагается интерпретировать траекторию вибрато, как реализацию случайного процесса, который может быть характеризован функцией автокорреляции и спектральной плотностью мощности .Этот метод позволяет характеризовать индивидуальное исполнение и ресинтезировать вибрато для различных стилей исполнения.

В докладе С. Макгаверна (США) «Моделирование реверберации как случайного ансамбля мнимых источников» (пр. 10072) предлагается новый быстрый метод, the Fast Image Method, позволяющий улучшить результаты за счет подавления эхо (флаттера) и уменьшения времени вычислений.

В докладе известного британского специалиста П. Маппа «Точность представления аудитории в компьютерных моделях» (пр. 10073) рассматриваются причины погрешностей при создании компьютерных моделей помещений, в частности, из-за трудностей учета коэффициентов поглощения за счет публики, эффектов дифракции и др. Намечены пути продолжения исследований в этих направлениях с целью увеличения точности компьютерных моделей помещений.

Модель театра в программе EASE

В докладе «Горизонтальная линейка громкоговорителей с высоким разрешением для cцены и зала: концепции и преимущества» (пр. 10074) рассматриваются принципы построения линейки громкоговорителей для систем пространственного звука WFS.

Горизонтальная линейка излучателей для системы WFS

Для увеличения разрешающей способности и сдвига частоты элайзинга предложена новая конструкция активной акустической системы, являющейся базовым блоком для построения линейки.

Активный блок

На секции «Звукозапись и воспроизведение» был представлен доклад ведущего специалиста фирмы SCHOEPS Mikrofone GmbH Х. Витека и др. «Запись с помощью микрофонной системы Double-MS с контролем диффузного звукового поля» (пр. 10042), где рассматривалась система декодирования пространственного звука при записи микрофонной системой Double-MS с контролем усиления и декорреляции диффузной части звукового поля. Это позволяет управлять в записи степенью диффузности и пространственности.

Система Double MS

В докладе японской фирмы NHK «Алгоритм определения коэффициентов для преобразования многоканального формата воспроизведения в формат с меньшим числом каналов» (пр. 10044) предлагается новый унифицированный алгоритм downmix для расчета коэффициентов преобразования многоканальной системы 22.2 в систему 5.1.

Преобразование системы 22.2 в систему 5.1

В американском докладе «Субъективная оценка алгоритмов UpMix из стерео в систему 9.1» (пр. 10045) представлены результаты субъективной экспертизы трех разных алгоритмов UpMix (метод пассивного декодирования, алгоритм LMS, алгоритм адаптивного панорамирования) для преобразования стереосигнала в формат 9.1. В докладе показано, что лучшие результаты (более натуральный и пространственный звук) показал второй алгоритм LMS.

В английском докладе «Влияние параметров компрессии на воспринимаемый стиль музыки» (пр. 10085) оценивается, как установки динамических параметров компрессора (в частности время атаки и спада) влияют на качество звука для разных стилей музыки (рок, джаз и др.).

В докладе Fraunhofer Institute (Германия) «Активный многоканальный Downmix» (пр.10081) предлагается новый подход к определению коэффициентов пересчета амплитуды и фазы при переходе от систем с большим количеством каналов к меньшему (стерео или 5.1)

Интересные результаты представлены в докладе «Риск повреждения слуха у инженеров звукозаписи» (пр. 10045). Было обследовано 23 участника и показано, что практически у всех есть отклонения от порогов, шум в ушах и др. Предполагается продолжение этих работ с целью выработки рекомендаций для разработок средств защиты.

Секция «Восприятие» всегда привлекала внимание слушателей, поскольку достижения психоакустики очень важны для общего развития аудиотехники.

В немецком докладе «Влияние культурных различий на восприятие искажений при кодировании музыки» (пр. 10030) исследовано, как воспринимают искажения при кодировании музыки китайские и немецкие слушатели, например китайские слушатели больше акцентируют тональные несоответствия, чем немецкие и т.д.

В докладе М. Пахомова, В. Рожнова (С-ПБ) «Метод для количественной оценки слухового восприятия нелинейных искажений» (ч. 2) (пр. 10032) предлагается метод для оценки влияния спектральных характеристик тестового сигнала на субъективное восприятие слышимых нелинейных искажений.

В докладе известного инженера, ведущего разработчика фирмы Lexicon Дэвида Гризинджера «Воспроизведение низкочастотной пространственности и окружения в помещениях прослушивания» (пр. 10063) рассматривается возможность увеличения ощущения пространственности за счет минимизации мод с высоким давлением на слушательской позиции, и максимизации боковых мод с минимумом давления с помощью установки двух независимых субвуферов по боковым сторонам от слушателя.

Три доклада (пр.10066, 10115, 10114) были посвящены уточнению характеристик ушной раковины и их влиянию на точность локализации в вертикальной плоскости.

На секции «Аудиообразование» можно отметить интересный доклад «Развитие и оценка звукового обучающего инструмента для поддержки контроля пения» (пр. 10116). В нем представлена новая обучающая программа Match Your Own Voice, которая позволяет контролировать качество своего голоса по анализу его спектрального состава с помощью специального интерактивного интерфейса.

На конгрессе было представлено достаточно большое количество стендовых коротких докладов («Инженерные записки»), которые были разделены по следующим направлениям: Пространственный звук, Запись и воспроизведение, Преобразователи, Применение в аудио и др.

Вот некоторые из этих сообщений.

«Микрофонная модульная система» (ЕВ479), состоящая из модулей по 16 МЕМS-микрофонов (всего до 512 элементов) со специальным интерфейсом, позволяющим управлять характеристиками направленности, контролировать движение источников и др.;

«Влияние температуры поверхности рупора на его характеристики направленности» (ЕВ482);

«Новая студия для исследования пространственного звука» (ЕВ 453) в Университете Гамбурга, оснащенная системой громкоговорителей 33.2;

Новая студия в Гамбурге

«Позиция микрофона при реконструкции звукового поля источника» (ЕВ-462), где предлагается система для перемещения микрофона в трехмерном пространстве при записи параметров звукового поля источника;

«Практическая звукозаписывающая техника для создания систем виртуальной реальности с шестью степенями свободы» (Е-464);

«Вкладные телефоны с пьезоэлектрическими МЕМS-громкоговорителями» (Е-469), где описываются параметры нового пьезоизлучателя размером 4 х 4 мм, и перспективы его развития;

«Устройство для измерения слуховой реакции мозга на звуковые стимулы» (Е-485), (проф. Б. Костек и др., Университет Гданьска), где предлагается новое устройство для аудиометрии, использующее в качестве источника реальные сигналы - музыку или речь;

«Новая компактная 3D-воспроизводящая система – Тетра-громкоговоритель» и др.

Научные семинары под руководством ведущих специалистов были сгруппированы по сессиям, в частности, сессия «Акустика и психоакустика». В ней можно выделить семинары на тему «Акустические стимулы: как алгоритмы предсказывают звуковую реальность», «Выбор и тренировка участников для слушательских тестов» и др. На сессии «Звук в кино» - семинары «Рей Долби и технические инновации в лаборатории Dolby», «Аудиоэффекты в звуковом дизайне» и др.

Как и на всех предыдущих конгрессах проходили студенческие мероприятия – научные сессии, ассамблеи, соревнования звукозаписей и др.

15 февраля 2019

Ирина Алдошина

Пока никто еще не оставлял комментарии. Вы можете быть первым.

Возможность оставлять комментарии доступна только для зарегистрированных пользователей.

145 конгресс AES – научные результаты

Новые статьи

Итоги XIX Конкурса имени Бабушкина

Церемония награждения лауреатов

Участники XIX Всероссийского Конкурса творческих работ студентов-звукорежиссеров им. Виктора Бабушкина

Положение о Девятнадцатом Всероссийском конкурсе творческих работ студентов-звукорежиссеров имени В.Б. Бабушкина

149 конгресс AES – научные результаты

Звукорежиссеры на Национальном открытом чемпионате творческих компетенций Artmasters

148 конгресс AES - научные результаты

Стереофонические микрофонные системы

Аналоговые системы шумоподавления

Результаты XVIII Всероссийского Конкурса творческих работ студентов-звукорежиссеров им. В.Б. Бабушкина

Люди

Теория

История

События

Технология

Практика

О журнале