Все электроакустические преобразователи (громкоговорители, микрофоны, телефоны и др.), а также каналы передачи вносят свои искажения в передаваемый звуковой сигнал, то есть воспринимаемый звуковой сигнал всегда не идентичен оригиналу. Идеология создания звуковой аппаратуры, получившая в 60-е годы название High-Fidelity, «высокой верности» живому звуку, в значительной степени не достигла своей цели. В те годы уровни искажений звукового сигнала в аппаратуре были еще очень высокими, и казалось, что достаточно их снизить — и звук, воспроизведенный через аппаратуру, будет практически неотличим от исходного.
Однако, несмотря на успехи в конструировании и развитии технологии, которые привели к значительному снижению уровней всех видов искажений в аудиоаппаратуре, по-прежнему не составляет особого труда отличить натуральный звук от воспроизведенного. Именно поэтому в настоящее время в различных странах в научно-исследовательских институтах, университетах и фирмах-производителях в большом объеме проводятся работы по изучению слухового восприятия и субъективной оценки различных видов искажений. По результатам этих исследований публикуется множество научных статей и докладов. Практически на всех конгрессах AES представляются доклады по этой теме. Некоторые современные результаты, полученные за последние два-три года, по проблемам субъективного восприятия и оценке нелинейных искажений звукового сигнала в аудиоаппаратуре и будут представлены в данной статье.
При записи, передаче и воспроизведении музыкальных и речевых сигналов через аудиоаппаратуру возникают искажения временной структуры сигнала, которые могут быть разделены на линейные и нелинейные.
Линейные искажения изменяют амплитудные и фазовые соотношения между имеющимися спектральными компонентами входного сигнала и за счет этого искажают его временную структуру. Такого рода искажения субъективно воспринимаются, как искажения тембра сигнала, и поэтому проблемам их снижения и субъективным оценкам их уровня уделялось очень много внимания со стороны специалистов на протяжении всего периода развития звукотехники.
Требование к отсутствию линейных искажений сигнала в аудиоаппаратуре может быть записано в форме:
y(t) = K·x(t - T), где x(t) — входной сигнал, y(t) — выходной сигнал.
Это условие допускает только изменение сигнала в масштабе с коэффициентом К и его сдвиг во времени на величину Т. Оно определяет линейную связь между входным и выходным сигналами и приводит к требованию, чтобы передаточная функция H(ω), под которой понимается частотно-зависимое отношение комплексных амплитуд сигнала на выходе и на входе системы при гармонических воздействиях, была постоянная по модулю и имела линейную зависимость аргумента (то есть фазы) от частоты | H(ω) | = К, φ(ω) = -T·ω. Поскольку функция 20·lg | H(ω) | называется амплитудно-частотной характеристикой системы (АЧХ), а φ(ω) — фазо-частотной характеристикой (ФЧХ), то обеспечение постоянного уровня АЧХ в воспроизводимом диапазоне частот (снижение ее неравномерности) в микрофонах, акустических системах и др. является главным требованием для улучшения их качества. Методы их измерений введены во все международные стандарты, например, IEC268-5. Пример АЧХ современного контрольного монитора фирмы Marantz с неравномерностью 2 дБ показан на рисунке 1.
Рис. 1. АЧХ контрольного монитора фирмы Marantz
Следует отметить, что такое снижение величины неравномерности АЧХ является огромным достижением в конструировании аудиоаппаратуры (например, контрольные мониторы, представленные на выставке в Брюсселе в 1956 году, имели неравномерность 15 дБ), которое стало возможным в результате применения новых технологий, материалов и методов проектирования.
Влияние неравномерностей АЧХ (и ФЧХ) на субъективно воспринимаемое искажение тембра звучания достаточно детально исследовано. Обзор основных полученных результатов постараемся сделать в дальнейшем.
Рис. 2. Различные типы нелинейных передаточных функций в аппаратуре
Рис. 3. Конструкция электродинамического громкоговорителя
Рис. 4. Зависимость гибкости подвеса от величины смещения звуковой катушки
Нелинейные искажения характеризуются появлением в спектре сигнала новых составляющих, отсутствующих в первоначальном сигнале, количество и амплитуды которых зависят от изменения входного уровня. Появление дополнительных составляющих в спектре обусловлено нелинейной зависимостью выходного сигнала от входного, то есть нелинейностью передаточной функции. Примеры такой зависимости показаны на рисунке 2. Причиной нелинейности могут являться конструктивные и технологические особенности электроакустических преобразователей.
Например, в электродинамических громкоговорителях (рисунок 3) к числу основных причин относятся:
Нелинейные искажения возникают практически во всех элементах звукового тракта: микрофонах, усилителях, кроссоверах, процессорах эффектов и т. д.
Представленная на рисунке 2 зависимость между входным и выходным сигналами (например, между приложенным напряжением и звуковым давлением для громкоговорителя) может быть аппроксимирована в виде полинома:
y(t) = h1·x(t) + h2·x2(t) + h3·x3(t) + h4·x4(t) + … (1).
Если на такую нелинейную систему подать гармонический сигнал, т. е. x(t) = A·sin ωt, то в выходном сигнале будут присутствовать компоненты с частотами ω, 2ω, 3ω, …, nω и т. д. Например, если ограничиться только квадратичным членом, то появятся вторые гармоники, т. к.
y(t) = h1·A·sin ωt + h2·(A sin ωt)² = h1·A·sin ωt + 0,5·h2·А²·sin 2ωt + const.
В реальных преобразователях при подаче гармонического сигнала могут появиться гармоники второго, третьего и более высоких порядков, а также субгармоники (1/n)·ω (рисунок 5). Для измерения такого вида искажений наиболее широкое распространение получили методы измерений уровня дополнительных гармоник в выходном сигнале (обычно только второй и третьей).
Рис. 5. Продукты нелинейных искажений в громкоговорителях
В соответствии с международными и отечественными стандартами производится запись АЧХ второй и третьей гармоники в заглушенных камерах и измеряется коэффициент гармонических искажений n-порядка:
KГn = pfn / pср·100%
где pfn—- среднеквадратичное значение звукового давления, соответствующее n-гармонической составляющей. По нему рассчитывается общий коэффициент гармонических искажений:
Кг = (KГ2² + KГ3² +KГ4² +KГ5² + ...)1/2
Рис. 6. Зависимость КНИ от частоты для разных значений входного напряжения
Например, в соответствии с требованиями МЭК 581-7, для акустических систем класса Hi-Fi полный коэффициент гармонических искажений не должен превышать 2% в диапазоне частот 250…1000 Гц и 1% в диапазоне свыше 2000 Гц. Пример зависимости коэффициента гармонических искажений для низкочастотного громкоговорителя диаметром 300 мм (12") от частоты для разных значений входного напряжения, меняющегося от 10 до 32 В, показан на рисунке 6.
Следует отметить, что слуховая система чрезвычайно чувствительна к наличию нелинейных искажений в акустических преобразователях. «Заметность» гармонических составляющих зависит от их порядка, в частности, к нечетным составляющим слух наиболее чувствителен. При многократном прослушивании восприятие нелинейных искажений обостряется, особенно при прослушивании отдельных музыкальных инструментов. Частотная область максимальной чувствительности слуха к этим видам искажений находится в пределах 1…2 кГц, где порог чувствительности составляет 1…2%.
Однако такой метод оценки нелинейности не позволяет учесть все виды нелинейных продуктов, возникающих в процессе преобразования реального звукового сигнала. В результате может быть ситуация, когда акустическая система с КНИ в 10% может субъективно оцениваться выше по качеству звучания, чем система с КНИ в 1%, из-за влияния высших гармоник.
Поэтому поиски других способов оценки нелинейных искажений и их корреляции с субъективными оценками все время продолжаются. Особенно актуально это в настоящее время, когда уровни нелинейных искажений значительно снизились и для дальнейшего их снижения необходимо знание реальных порогов слышимости, поскольку уменьшение нелинейных искажений в аппаратуре требует значительных экономических затрат.
Наряду с измерениями гармонических составляющих в практике проектирования и оценки электроакустической аппаратуры используются методы измерений интермодуляционных искажений. Методика измерений представлена ГОСТ 16122-88 и МЭК 268-5 и основана на подведении к излучателю двух синусоидальных сигналов с частотами f1 и f2, где f1 < 1/8·f2 (при соотношении амплитуд 4:1) и измерении амплитуд звукового давления комбинационных тонов: f2 ± (n - 1)·f1, где n = 2, 3.
Суммарный коэффициент интермодуляционных искажений определяется в этом случае как:
Рис. 7. Зависимость коэффициента интермодуляционных искажений (IMD) от частоты для громкоговорителя с длинной (а) и короткой (б) катушкой
Рис. 8. Связь субъективных оценок с величиной коэффициента интермодуляционных искажений (IMD)
Ким = (ΣnКимn²)1/2
где Ким = [p·(f2 - (n - 1)·f1) + p(f2 + (n - 1)·f1)] / pcp.
Причиной возникновения интермодуляционных искажений служит нелинейная связь между выходным и входным сигналами, т. е. нелинейная передаточная характеристика. Если на вход такой системы подать два гармонических сигнала, то в выходном сигнале будут содержаться гармоники высших порядков и суммарно-разностные тоны различных порядков.
Вид выходного сигнала с учетом нелинейностей более высоких порядков показан на рисунке 5. Характеристики зависимости коэффициента интермодуляционных искажений от частоты для низкочастотного громкоговорителя со звуковыми катушками различной длины показаны на рисунке 7 (а — для более длинной катушки, б — для более короткой).
Как сказано выше, в соответствии с международными стандартами в аппаратуре измеряются только коэффициенты интермодуляционных искажений второго и третьего порядков. Измерения интермодуляционных искажений могут быть информативнее, чем гармонические, поскольку являются более чувствительным критерием нелинейности. Однако, как показали эксперименты, выполненные в работах Р. Геддса, четкой корреляции между субъективными оценками качества акустических преобразователей и уровнем интермодуляционных искажений установить не удалось — слишком большой разброс в полученных результатах (как видно из рисунка 8).
Рис. 9. Спектральный (а) и временной (б) вид многотонового сигнала
Рис. 10. Общие продукты нелинейных искажений при применении многотонового сигнала
В качестве нового критерия для оценки нелинейных искажений в электроакустической аппаратуре был предложен многотоновый метод, история и способы применения которого детально исследованы в работах А. Г. Войшвилло и др. (имеются статьи в JAES и доклады на конгрессах AES). В этом случае в качестве входного сигнала используется набор гармоник от 2-й до 20-й с произвольным распределением амплитуд и логарифмическим распределением частот в диапазоне от 1 до 10 кГц. Распределение фаз гармоник оптимизируется с целью минимизации пик-фактора многотонового сигнала. Общий вид входного сигнала и его временная структура показаны на рисунках 9а и 9б.
В выходном сигнале выделяются гармонические и интермодуляционные искажения всех порядков. Пример таких искажений для громкоговорителя показан на рисунке 10. Многотоновый сигнал по своей структуре гораздо ближе к реальным музыкальным и речевым сигналам, он позволяет выделить значительно больше различных продуктов нелинейных искажений (в первую очередь интермодуляционных) и лучше коррелирует с субъективными оценками качества звучания акустических систем. С увеличением числа составляющих гармоник данный метод позволяет получить все более детальную информацию, но при этом увеличиваются вычислительные затраты. Применение этого метода требует дальнейших исследований, в частности разработки критериев и допустимых норм на выделенные продукты нелинейных искажений с позиций их субъективных оценок.
Для оценки нелинейных искажений в акустических преобразователях используются и другие методы, например ряды Вольтера.
Однако все они не обеспечивают четкой связи между оценкой качества звучания преобразователей (микрофонов, громкоговорителей, акустических систем и др.) и уровнем нелинейных искажений в них, измеренных любыми из известных объективных методов. Поэтому представляет значительный интерес новый психоакустический критерий, предложенный в докладе Р. Геддса на последнем конгрессе AES. Он исходил из соображений, что любой параметр можно оценивать в объективных единицах, а можно и по субъективным критериям, например, температуру можно измерить в градусах, а можно в ощущениях: холодно, тепло, жарко. Громкость звука можно оценить по уровню звукового давления в дБ, а можно — в субъективных единицах: фон, сон. Поиск аналогичных критериев для нелинейных искажений и был целью его работы.
Как известно из психоакустики, слуховой аппарат является принципиально нелинейной системой, причем его нелинейность проявляется как на больших, так и на малых уровнях сигнала. Причинами нелинейности служат гидродинамические процессы в улитке уха, а также нелинейная компрессия сигнала за счет специального механизма удлинения внешних волосковых клеток. Это приводит к появлению субъективных гармоник и комбинационных тонов при прослушивании гармонических или суммарных гармонических сигналов, уровень которых может достигать 15…20% от уровня входного сигнала. Поэтому анализ восприятия продуктов нелинейных искажений, создаваемых в электроакустических преобразователях и каналах передачи, в такой сложной нелинейной системе, как слуховой аппарат, является серьезной проблемой.
Другое принципиально важное свойство слуховой системы — это эффект маскировки, заключающийся в изменении порогов слуха к одному сигналу в присутствии другого (маскера). Это свойство слуховой системы широко используется в современных системах сжатия звуковой информации при ее передаче по различным каналам (стандарты MPEG). Успехи, достигнутые в уменьшении объемов передаваемой информации за счет сжатия с использованием свойств слуховой маскировки, заставляют предположить, что эти эффекты имеют огромное значение также для восприятия и оценки нелинейных искажений.
Установленные законы слуховой маскировки позволяют утверждать, что:
Отсюда можно предположить, что при анализе нелинейных искажений в слуховой системе соблюдаются следующие правила:
Рис. 11. Эффекты маскировки
Действительно, с повышением уровня основного сигнала зона его маскировки расширяется, и все больше продуктов искажений (гармоник, суммарных и разностных искажений и др.) попадает в нее. При низких уровнях эта зона ограничена, поэтому продукты искажений высоких порядков будут более слышимы.
При измерениях нелинейных продуктов на чистом тоне в преобразователях возникают, в основном, гармоники с частотой выше основного сигнала n f. Однако в громкоговорителях могут возникать и низкие гармоники с частотами (1/n)·f. При измерениях интермодуляционных искажений (как с помощью двух сигналов, так и с помощью многотоновых сигналов) возникают продукты искажений суммарно-разностные — как выше, так и ниже основных сигналов m·f1 ± n·f2.
Учитывая перечисленные свойства слуховой маскировки, можно сделать следующие выводы: продукты нелинейных искажений более высоких порядков могут быть более слышимы, чем продукты более низких порядков. Например, практика проектирования громкоговорителей показывает, что гармоники с номерами выше пятой, воспринимаются на слух гораздо неприятнее, чем вторая и третья, даже если их уровни гораздо меньше, чем у первых двух гармоник. Обычно их появление воспринимается как дребезжание и приводит к отбраковке громкоговорителей в производстве. Появление субгармоник с половинной и ниже частотами также сразу замечается слуховой системой как призвук, даже на очень малых уровнях.
Если порядок нелинейности низкий, то с увеличением уровня входного сигнала дополнительные гармоники могут быть замаскированы в слуховой системе и не восприниматься как искажения, что подтверждается практикой проектирования электроакустических преобразователей. Акустические системы с уровнем нелинейных искажений 2% могут достаточно высоко оцениваться слушателями. В то же время хорошие усилители должны иметь уровень искажений 0,01% и ниже, что, по-видимому, связано с тем, что акустические системы создают продукты искажений низких порядков, а усилители — гораздо более высоких.
Продукты нелинейных искажений, которые возникают на низких уровнях сигнала, могут быть гораздо более слышимыми, чем на высоких уровнях. Это, казалось бы, парадоксальное утверждение также может иметь значение для практики, поскольку нелинейные искажения в электроакустических преобразователях и трактах могут возникать и при малых уровнях сигналов.
Исходя из вышесказанных соображений, Р. Геддс предложил новый психоакустический критерий для оценки нелинейных искажений, который должен был удовлетворять следующим требованиям: быть чувствительнее к искажениям более высокого порядка и иметь большее значение для низких уровней сигнала.
Проблема состояла в том, чтобы показать, что этот критерий больше соответствует субъективному восприятию нелинейных искажений, чем принятые в настоящее время методы оценок: коэффициент нелинейных искажений и коэффициент интермодуляционных искажений на двухтоновом или многотоновом сигналах.
С этой целью была проведена серия субъективных экспертиз, организованная следующим образом: тридцать четыре эксперта с проверенными порогами слуха (средний возраст 21 год) участвовали в большой серии экспериментов по оценке качества звучания музыкальных отрывков (например, мужской вокал с симфонической музыкой), в которые были введены различные виды нелинейных искажений. Выполнено это было путем «свертки» испытываемого сигнала с нелинейными передаточными функциями, свойственными преобразователям различных типов (громкоговорителям, микрофонам, стереотелефонам и др.).
Вначале в качестве стимулов были использованы синусоидальные сигналы, выполнена их «свертка» с различными передаточными функциями и определен коэффициент гармонических искажений. Затем были использованы два синусоидальных сигнала и рассчитаны коэффициенты интермодуляционных искажений. Наконец, прямо по заданным передаточным функциям был определен вновь предложенный коэффициент Gm. Расхождения оказались очень значительными: например, для одной и той же передаточной функции КНИ равен 1%, Ким — 2,1%, Gm — 10,4%. Такое различие физически объяснимо, так как Ким и Gm учитывают гораздо больше продуктов нелинейных искажений высоких порядков.
Слуховые эксперименты были выполнены на стереотелефонах с диапазоном 20 Гц…16 кГц, чувствительностью 108 дБ, макс. SPL 122 дБ. Субъективная оценка ставилась по семибальной шкале для каждого музыкального фрагмента, от «много лучше», чем опорный фрагмент (т. е. музыкальный отрывок, «свернутый» с линейной передаточной функцией), до «много хуже». Статистическая обработка результатов слуховой оценки позволила установить достаточно высокий коэффициент корреляции между средними значениями субъективных оценок и значением коэффициента Gm, который оказался равным 0,68. В тоже время для КНИ он составлял 0,42, а для Ким — 0,34 (для данной серии экспериментов).
Рис. 12. Связь коэффициента Gm с субъективными оценками
Таким образом, связь предложенного критерия с субъективными оценками качества звучания оказалась существенно выше, чем у других коэффициентов (рисунок 12). Результаты экспериментов показали также, что электроакустический преобразователь, у которого Gm меньше 1%, может считаться вполне удовлетворительным по качеству звучания в том смысле, что нелинейные искажения в нем практически неслышимы.
Разумеется, этих результатов еще недостаточно, чтобы заменить предложенным критерием имеющиеся в стандартах параметры, такие как коэффициент гармонических искажений и коэффициент интермодуляционных искажений, однако если результаты подтвердятся при дальнейших экспериментах, то, возможно, именно так и произойдет.
Поиски других новых критериев также активно продолжаются, поскольку несоответствие имеющихся параметров (особенно коэффициента гармонических искажений, оценивающего только две первые гармоники) субъективно воспринимаемому качеству звучания становится все более очевидным по мере улучшения общего качества аудиоаппаратуры.
По-видимому, дальнейшие пути решения этой проблемы пойдут в направлении создания компьютерных моделей слуховой системы, с учетом нелинейных процессов и эффектов маскировки в ней. В этой области работает Институт коммуникационной акустики в Германии под руководством Д. Блауэрта. С помощью этих моделей можно будет оценивать слышимость различных видов нелинейных искажений в реальных музыкальных и речевых сигналах. Однако, пока они еще не созданы, оценки нелинейных искажений в аппаратуре будут производиться с помощью упрощенных методов, максимально приближенных к реальным слуховым процессам.
16 октября 2015
Ирина Алдошина
Пока никто еще не оставлял комментарии. Вы можете быть первым.
Возможность оставлять комментарии доступна только для зарегистрированных пользователей.