Персональный компьютер не сразу «заговорил» и тем более «запел». Довольно долго он выполнял свое прямое предназначение, то есть решал трудоемкие вычислительные задачи в научных, индустриальных, правительственных и военных (это святое!) целях.
Развитие же цифровой аудиотехники происходило одновременно и параллельно, и основные усилия разработчиков были сосредоточены на конструировании цифровых ленточных магнитофонов конкурировавших между собой форматов.
Пересеклись цифровой звук и компьютер в серьезном промышленном масштабе, а не в рамках лабораторных исследований, в первом компьютере Apple Macintosh. Можно спорить, был ли этот компьютер первым персональным, но две вещи несомненны: это был первый компьютер с графическим (а не знаковым) интерфейсом и первый компьютер с ЦАП. Разумеется, формат 8 бит/22 кГц моно не давал возможности воспроизводить музыку с приемлемым качеством, но начало было положено. Через несколько лет на компьютерах Apple появился и встроенный АЦП, что превращало компьютер в звуковую рабочую станцию.
Раз появился «хард» в виде встроенных в компьютер АЦП и ЦАП, потребовался и «софт», то есть программы для управления процессом записи и воспроизведения звука. Первые программы представляли собой имитацию «транспорта», то есть органов управления магнитофоном. Программное окно отображало кнопки записи, воспроизведения, «перемотки», счетчик-таймер. По мере усложнения звуковой подсистемы компьютера появились регулятор уровня входной чувствительности, регулятор уровня выходной громкости, несложный двух-трехполосный эквалайзер, индикатор уровня записи, а также функции настройки «железа», то есть выбора разрядности, частоты дискретизации, формата записи, алгоритма компрессии, носителя, на который производится запись, ит. п.
В дополнение к функциям настройки записи-воспроизведения звука, входящим в операционную систему компьютера, появились и звуковые программы от сторонних производителей. Поскольку с их помощью не только записывали, но и монтировали фонограммы, такие программы стали называть аудиоредакторами. Удачный это термин с точки зрения лингвистики или нет, но он привился в профессиональном мире.
Еще одной важнейшей функцией программ-аудиоредакторов стала обработка звука. Созданные к тому времени алгоритмы цифровой обработки аудиосигналов, нашедшие применение в аппаратных цифровых приборах, были перенесены в программную среду операционных систем компьютеров, и с этого момента началось соперничество аппаратных и программных средств обработки. Еще лет пятнадцать назад превосходство первых было неоспоримым как в силу недостаточной производительности компьютеров, так и того факта, что основные ресурсы, в том числе и финансовые, разработчики вкладывали в приборы, а не в программы. Немаловажным фактором такого предпочтения было компьютерное пиратство, делавшее бессмысленным серьезные затраты на создание программ, тут же после выпуска подвергавшихся взлому и последующему нелегальному распространению.
Однако сейчас качество алгоритмов программ и аппаратов практически одинаково, тем более это справедливо в отношении программных модулей в форматах, позволяющих использовать их только в составе аппаратно-программных комплексов, то есть, проще говоря, форматов, требующих для своей работы специализированного «железа».
За время существования компьютерных звуковых станций было разработано несколько десятков форматов звуковых файлов, несовместимых между собой. Эти форматы разрабатывали как компьютерные компании, такие как Apple, IBM, Microsoft, Sun, Amiga, Atari, NeXT, Silicon Graphics, так и ряд производителей профессионального программного и аппаратного обеспечения, например, Adobe, Digidesign (ныне AVID), Macromedia, Fraunghofer Institute, Ensoniq, SADiE, Sonic Solutions. Однако большинство этих форматов давно не используются, а в употреблении осталось всего несколько форматов, доказавших свою жизнеспособность. Следует отличать форматы файлов от алгоритмов кодирования звука (кодеков) – так, файл формата, например, МР3 даже одного стандарта, то есть разрядности и частоты дискретизации, может быть создан при помощи разных кодеков разных разработчиков, что может дать и заметно различающееся звучание.
«Софт» и «железо» не существуют друг без друга. Все годы существования цифровой звукозаписи и производства технических средств для этого они развивались параллельно, но, что важно, – не всегда согласованно. Законы рыночной экономики, диктуемые, среди прочего, конкуренцией, иногда вынуждали производителей аппаратных средств действовать вопреки интересам разработчиков программ, но бывало и наоборот. Достаточно вспомнить одновременное появление в свободном доступе на бытовом рынке устройств записи компакт-дисков для цифрового копирования, программ для копирования цифровой информации – и алгоритмов защиты цифровой информации от копирования. Очевидно, что здесь одни отрасли звуковой (и, шире, цифровой) индустрии действовали вопреки интересам других отраслей.
Так или иначе, со временем сформировались два подхода к цифровой звукозаписи. Первый – это производство аудиопродукта с помощью программно-аппаратных комплексов, так называемых цифровых рабочих станций, в которых используются только собственные средства, как программы, так и звуковые карты, интерфейсы и прочая периферия. Второй подход – это выпуск исключительно программ, предназначенных для работы со звуковыми картами и интерфейсами любых производителей.
Естественно, что более массовым является второй метод, когда некое специализированное программное обеспечение устанавливается на компьютер, уже оснащенный тем или иным звуковым «железом», начиная хотя бы со встроенной звуковой карты компьютера. Долгое время встроенными звуковыми чипами или дочерними картами располагали только компьютеры Apple Macintosh, а для РС требовалось приобрести отдельную звуковую карту, они выпускались огромным количеством разных производителей. Несмотря на то что создатели операционной системы Windows сделали доступными разработчикам «железа» необходимые им коды, независимость производителей звуковых карт от разработчиков программного обеспечения и операционных систем приводила к нестабильной работе всего звукового комплекса, а то и к зависанию всего компьютера и краху системы. Поэтому для стабильного совместного функционирования программного обеспечения и аппаратной части, выпущенных разными производителями, требуется специальная программа согласования и управления, которая называется драйвер. Обычно драйвер – это небольшая служебная программа, создаваемая разработчиком звуковой карты для корректной работы с данной операционной системой, а также с программами. Драйвер может не иметь своего интерфейса, а может показываться пользователю в виде панели управления.
Драйвер многоканального аудиоинтерфейса
После установки в систему драйвер помогает программе-аудиоредактору протестировать установленную звуковую карту, определить ее функциональность (разрядность, доступные частоты дискретизации, количество входов и выходов, типы цифровых портов и т.д.).
Драйверы также являются маршрутизаторами, управляющими цифровыми потоками (ASIO и др.). Еще одна задача драйверов – согласование основной программы и подключаемых модулей (плагинов), которые существуют во множестве разных несовместимых между собой форматов(VST, AS, AU, RTAS, MAS, DAE, TDM, AP, DirectX и др.).
Современные звуковые редакторы делятся на несколько типов в зависимости от предназначения. От предназначения зависят и функциональные возможности программ: для подготовки радиорепортажей к эфиру требуются одни функции, для дубляжа кинофильмов – другие, для записи больших и сложных музыкальных произведений – третьи, для реставрации старых фонограмм – четвертые и т.д.
Стереоредакторы
Несмотря на прогресс во внедрении многоканальных surround-фонограмм, старое доброе стерео не сдает позиций, поэтому двухдорожечные (стерео) редакторы продолжают занимать видное место на рынке звуковых программ, их разрабатывают и выпускают многие компании.
Двухдорожечные программы предназначены для следующих работ:
Как правило, интерфейс этих программ включает:
За прошедшие с момента появления компьютерных звуковых программ примерно два десятилетия выработались приемы работы с фонограммами при монтаже. Во многом они перешли в компьютерную практику из опыта работы с монтажом магнитной ленты на магнитофонах, но появились и новые способы, недоступные в аналоговом «пространстве».
Например, при монтаже основным инструментом являются маркеры, то есть временные метки, расставляемые по всей длине фонограммы. При работе на аналоговых магнитофонах определенную временную позицию фонограммы можно было занести в память, нажав кнопку запоминания.
Позже можно было отмотать ленту на нужное место без повторного его поиска. Однако на аналоговом магнитофоне можно было выставить очень небольшое число таких меток, в то время как количество маркеров в компьютерном аудиоредакторе ничем не ограничено.
Интерфейс стереоредактора
Удивительно, но в методы компьютерного монтажа звука проникли многие приемы из компьютерного редактирования текстов. Выделение с помощью мыши нужных фрагментов, команды Copy, Insert, Paste, Cut, Delete, Drag-and-Drop – все это впервые появилось в текстовых редакторах и было с успехом перенесено в аудио-, MIDI- и видеомонтаж.
Однако есть и отличия от текста, связанные с непрерывным характером звука. Если просто перенести звуковой фрагмент в другое место, появится заметный бросок по уровню, щелчок и т.п. Для предотвращения имеется функция ZeroCross, или “переход через нуль”. Это означает, что длительность небольшого фрагмента звука подгоняется под совпадение с нулем по амплитуде.
Иногда путают функции ZeroCross со следующей за ней по порядку технологической операцией crossfade. Эта операция применяется для достижения незаметности соединения двух фрагментов: вместе стыка для первого фрагмента вводится затухание, а для второго – выводится плавный подъем уровня громкости до нормального. Отметим, что второй фрагмент соединяется с первым не встык, а с нахлестом. Этот прием при аналоговом монтаже магнитной ленты назывался “косая склейка” или “ласточкин хвост”.
Слово fade очень часто встречается в разных вариантах в аудиотехнологиях, что иногда вносит путаницу. К примеру, функцию cross-fade надо отличать от fade in и fade out, что означает постепенное нарастание или затухание звука в начале и конце фонограммы соответственно. Fade in иногда применяется в художественных целях, но чаще призван маскировать дефекты в самом начале фонограммы. Аналогично и fade может применяться как художественный “увод в тишину”, а может использоваться в случаях, когда в конце фонограммы уровень шума становится слишком заметным и неприятным.
Точное размещение фрагментов по временной шкале производится путем их передвижения маленькими шагами к нужному месту, так называемым “подталкиванием” (nudge, kicking).
Как уже сказано, двухдорожечные аудиоредакторы применяются, помимо монтажа, еще и для целей мастеринга. Поэтому эти программы дают широкие возможности обработки фонограмм разнообразнейшими эффектами в виде подключаемых модулей (плагинов) форматов VST, AU, Premiere, TDM, DirectX и др. Это и графические, параметрические и параграфические эквалайзеры (отметим, что параграфические эквалайзеры существуют только в программном виде). Число полос в виртуальном эквалайзере может составлять несколько сотен, добротность регулируется в любых пределах, а глубина среза-подъема может достигать бесконечности, что невозможно в «железных» эквалайзерах.
Динамическая обработка в аудиоредакторах также очень обширна: это и компрессоры (в том числе многополосные), и лимитеры, и экспандеры, и гейты, и максимайзеры. Сюда же относится и важнейшая для мастеринга функция нормализации.
Для целей реставрации используются программные шумоподавители, в которых применяются обработки разного типа – устранители гула, фона, рокота, шипения ленты, щелчков, царапин, коротких выпадений уровня. Современные достижения позволяют даже сделать менее заметными цифровые артефакты типа клиппирования, а также аналоговые нелинейные искажения вследствие перегрузки по входному уровню.
Обязательными функциями для стереоредакторов являются уменьшение или увеличение продолжительности фонограммы без изменения тональности (Time Stretch) и повышение или понижение тона без изменения длительности (Pitch Correction). Эти операции необходимы при работе с видео, с репортажами на радио и телевидении, при подготовке семплов и звуковых библиотек и др.
Для облегчения работы можно автоматизировать выполнение одинаковых операций с помощью пакетной обработки (batch-конвертер).
Большинство стереоредакторов позволяет записывать компакт-диск без помощи специальных программ для «прожига» дисков. Прямо в редакторе составляется порядок треков в таблице содержания (ТОС), выставляются паузы и производится запись.
Многодорожечные редакторы
Теперь обратимся к программам для многодорожечной записи и сведения. Такие программы часто и справедливо называются «виртуальными студиями». Каждое окно отображает какой-то компонент студии: микшерную консоль, многодорожечный магнитофон, пульт управления транспортными функциями, рэки с приборами обработки, коммутационную панель patchbay, линейку разнообразных индикаторов уровня и т.д. Многие программы предоставляют возможность одновременной работы с аудио и MIDI, поэтому также могут быть вызваны окна MIDI. При работе в пост-продакшн можно открывать окна видео на основе технологии QuickTime – это аналог телемонитора.
Хорошие профессиональные программы часто позволяют пользователю создать виртуальную микшерную консоль, сложность и функциональность которой зависит только от его потребностей и фантазии разработчиков. Можно в канальную ячейку пульта установить многополосный параметрический эквалайзер, десять посылов на эффекты, любое число субгрупп и т.п.
То же относится и к многодорожечной записи – количество дорожек в современных программах может составлять несколько сотен, все зависит от производительности компьютера.
Окна многодорожечной программы
Для начала работы с многодорожечной записью можно использовать и обычную двухканальную карту – для последовательной записи наложением этого может быть достаточно. В домашних студиях многие музыканты записывают на своей гитаре, клавишных и т. д. трек за треком, добавляя MIDI-дорожки, партию драм-машины и т.п. В этом случае много каналов в интерфейсе не требуется.
Но для профессиональной работы используются многоканальные АЦП/ЦАП-карты, а также внешние модульные АЦП/ЦАП, соединенные кабельной шиной с мультиразъемом с картой ввода-вывода. Для работы с этими картами служат драйверы асинхронного одновременного ввода-вывода. Без этих драйверов невозможно производить запись нескольких каналов звука (то есть ввод нескольких цифровых потоков) и одновременно воспроизводить записанные треки.
Некоторые программы перед началом работы предлагают пользователю вручную назначить интерфейс, который будет использоваться для ввода и вывода цифрового аудиопотока, другие программы сами находят установленную карту и отключают возможность записи со встроенного входа-выхода. Некоторые программы позволяют даже использовать одновременно несколько карт, если установлен соответствующий драйвер. (Разумеется, речь не об аппаратно-программных комплексах, а о чистом «софте»).
Многие профессиональные программы позволяют управлять т. н. outboard, то есть внешними приборами обработки и рекордерами, и наоборот, позволяют управлять программой с помощью специализированной консоли-контроллера. Для этого производится назначение внешней аппаратуры на определенные порты управления, установка параметров и пр. Управление может осуществляться по MIDI, через интерфейсы RS-422, FireWire и USB.
Несколько слов о компонентах виртуальной компьютерной студии.
Микшер, как уже сказано, может быть собран вручную пользователем, который может менять количество и состав элементов управления, начиная с количества каналов в микшере. Состав микшера можно не только усложнять, но и упрощать. Если какие-то регуляторы не нужны, можно их удалить.
Как показывает практика, с регулятором панорамы удобнее всего работать, когда он выполнен в виде передвигаемого влево-вправо фейдера. А вот вращающиеся потенциометры бывают неудобны – они плохо “слушаются” курсора мыши.
Эффект обычно включается в инсерт путем выбора из списка эффектов в меню прямо на пульте. Количество эффектов, которые можно подать на канал, определяется набором инсертов. Мастер-секция также строится аналогично подобной секции реальной консоли.
В программах для микширования в формате Surround sound в качестве мастер-фейдера используется джойстик. Но для такой работы лучше использовать не мышь, а консоль-контроллер с джойстиком.
Если виртуальная консоль на экране монитора похожа на настоящий микшер, то про рекордер этого не скажешь. Он гораздо больше похож на своего предшественника – MIDI-секвенсер. Звук на дорожках представлен в виде волны, которую можно увеличивать или уменьшать по горизонтали и по вертикали. В окне рекордера продублирована и некоторая текущая информация из окна микшера, например, положение регулятора панорамы, уровень громкости дорожки, статус кнопок Solo, Mute, Bypass и др. Это сделано для того, чтобы, не обращаясь к окну микшера, контролировать параметры каждого трека.
Запись звука в виртуальной студии похожа на запись с помощью многодорожечного магнитофона – в то время как на одни дорожки идет запись, другие можно включить на воспроизведение и подать в наушники исполнителю или в мониторы звукорежиссеру. Однако в виртуальной студии в полной мере раскрываются достоинства нелинейной записи и монтажа. На ленточном магнитофоне выполнимы, хотя и ограниченно, такие операции, как переброс фрагментов на другие треки, клонирование дорожек и их раздельная обработка эффектами. Но вот горизонтальное перемещение фрагментов, изменение их длительности, изменение высоты треков, fade in и fade out в многодорожечной фонограмме и т.д. на аналоговом магнитофоне невозможны.
Окно транспорт-контроля в виртуальной студии похоже на пульт магнитофона, но регулятор скорости воспроизведения позволяет менять темп без изменения высоты. Тайм-код может быть отображен как SMPTE-код (часы/минуты/секунды/кадры), как MIDI-код (такты/доли/биты), как обычный временной код (минуты/секунды/миллисекунды) и в семплах.
При обработке открывается окно эффектов, отображающее соответствующий прибор или приборы. Одни разработчики рисуют эффект в виде слайдера или простого окошка для ввода цифр, другие – красочную трехмерную картину, подробно отображающую дизайн реального устройства.
Коротко коснусь вопросов системных требований и особенностей работы компьютеров в целом.
Пожалуй, главной проблемой компьютерных рабочих звуковых станций является латентность, то есть задержка сигнала между входом и выходом, АЦП и ЦАП. Повышение тактовой частоты процессора компьютера почти не снижает латентность, поскольку причина ее возникновения не в процессоре. Однако с помощью некоторых решений можно значительно снизить влияние латентности на работу системы. В числе таких решений – переменный размер буфера для цифровых данных, алгоритмы “предвидения” (look-ahead) и др.
Производительность современных компьютеров очень высока и продолжает расти. Фактически полемика между сторонниками систем на основе специализированных DSP и native-систем на базе центрального процессора компьютера утрачивает актуальность. Раньше серьезная студия, занятая, к примеру, в производстве сложных фонограмм для высокобюджетных кинофильмов, не могла «экономить на спичках» и приобретала дорогую станцию на базе аппаратно-программного комплекса. А теперь не только скромная промо-студия или музыкант, но и профессиональная коммерческая студия вполне могут обойтись системой на основе мощного компьютера (с необходимым периферийным звуковым оборудованием) и легального пакета программного обеспечения.
07 октября 2015
Анатолий Вейценфельд
Пока никто еще не оставлял комментарии. Вы можете быть первым.
Возможность оставлять комментарии доступна только для зарегистрированных пользователей.