Как избавится от задержки гитара

Аппаратная задержка при записи. Часть 1.

Буквально вчера во время занятия один из моих студентов натолкнул меня на очень интересную мысль, а именно — на задержку при записи. Собственно, эту мысль я сегодня проверил и решил отразить результаты измышлений в статье.

Сразу говорю: это больше для тех, кто записывается, кто рубится за всякие миллисекунды и так далее. Для остальных чтение может быть просто неинтересным, так как аппаратозадротство в этой статье — выше 80 лвл.

Сначала о том зерне сомнений, что было коварно заложено в мою душу хитрым студентом. Суть его сводилась к тому, что у каждого аудио-интерфейса, даже достаточно крутого, всегда есть задержка. Это очевидно, так как эта задержка обусловлена самой сутью интерфейса: оцифровки-переоцифровки, потом выдача обратно аналогового сигнала в наушники или мониторы, плюс обработка звука — это и есть по сути основа нашей latency.

Теория заключалась в том, что мы слышим метр или фанеру, под которые пишемся, с определенной задержкой, соответственно, так или иначе наша игра будет отставать от центрального бита в DAW. Мне сразу вспомнилось, что все же наверное в штайнберге, эппле и прочих сидят умные дядьки, которые для нейтрализации сего эффекта запилили всякие delay compensation и прочее. Ну, действительно ведь: возьми записанный аудио-файл, сдвинь его ровно на величину latency — и вот оно, вот именно так по идее и должно все звучать.

В общем, я решил проверить, работают ли все эти компенсации в реальности, а также при настройках DAW по умолчанию. Я использую Logic 9.1.8, на днях попробую также проверить всю эту кухню на Logix Pro X. Кто хочет — попробуйте проверить на других DAW типа Cubase, Sonar и так далее.

Читайте также:  Как звучит первая струна шестиструнной гитары

В качестве аудио-интерфейса у меня выступает Fractal Audio Axe-FX II, подключенный к компьютеру через USB. Гитара фактически подключена к нему, оцифровывается, обрабатывается процессором (производитель утверждает, что внутренняя задержка Акса — не более 2 мс) и после этого без ЦАП-АЦП преобразования идет уже в компьютер, то есть у нас работает только АЦП Акса при записи, и ЦАП его же при воспроизведении.

Все файлы сохранялись без сжатия в формате AIFF, дабы избежать возможных искажений и артефактов.

На Аксе я взял пресет без блоков вообще. Почему я не использовал его в режиме Bypass, будет понятно потом. В моем случае задержка составила 15мс.

Проверял я теорию следующим образом. Для начала я создал трек (Software instrument, повесил на него Ultrabeat), на котором натыкал четвертями метроном: опять же, будет потом ясно, почему я не использовал для написания статьи встроенный клик, однако ради справедливости скажу, что с ним я тоже пробовал провести весь этот опыт и результаты были абсолютно идентичны.

Теперь задача была в том, чтобы записать гитару и посмотреть, действительно ли гитара будет иметь некоторую задержку относительно метра. Но тут было самое интересное: очевидно, что если бы я просто попытался играть четверти синхронно с метром, то это так или иначе давало определенную ошибку по ритму. И тогда я сделал очень простую вещь: я пустил весь мониторинг в наушники, которые просто положил на датчики гитары. В этом случае гитара «сыграет» одновременно с метрономом: струны и звукосниматели сработают по факту как мембрана микрофона.

Чтобы так как мембрана эта крайне неэффективная и звук получается тихим, я и натыкал трек с «метрономом», который сделал громким и выбрал адово громкий и мерзкий звук 🙂 И именно поэтому я не использовал Акс в bypass-режиме: мне пришлось поднять громкость в Output на 20 дБ, чтобы звук, который «сыграет» гитара, был громче: без этого вообще разобрать так или иначе его тяжело и он почти полностью сливается с фоном.

Итак, я включил запись и записал «гитару». Повторю: при этом опыте отсутствует ошибка и неритмичность играющего: сам метроном фактически играет на гитаре. После этого я открыл полученный аудио-файл в Sound Forge Pro. Чтобы картинка была лучше, я сделал нормализацию сигнала, в остальном каких-либо обработок файла не было. На всякий случай я проверил, не вызывает ли процесс нормализации каких-либо сдвигов по времени (ну мало ли). Нет, не вызывает, все хорошо. Вот как выглядит полученная «партия»:

Меня сразу же заинтересовало то, что происходит перед первым «ударом по струнам», и я решил померять, сколько примерно времени составляет этот непонятный хвост перед ним. Я измерил интервал от самого начала до первого роста пика, получилось примерно так:

Получилось 10 мс (третье окно слева, почему второе показывает 009 — непонятно, но не суть важно). При этом форма сигнала перед кликом очень похожа на то, как звучит фон между кликами. То есть это не просто пустой участок: там есть информация, и эта информация была записана с нашей гитары. Иными словами, когда включилась запись, то первые 10 миллисекунд не было никакого удара метронома, а гитара уже писалась.

Мне стало интересно: что же будет, если сделать просто Bounce трека с метрономом? Мало ли, Лоджик зачем-то добавляет какую-то микрозадержку сам именно в аудио-файлы. Сказано — сделано: баунснул, открыл в том же Форже.

По-моему, никакого хвоста перед кликом нет, проверим же, увеличим:

Действительно, лупит прям с самого начала. Интересно, как же будет выглядеть аудио-файл, если в левый канал полностью увести метроном, а в правый — гитару? Будет ли задержка относительно друг друга? Проверим.

Вот оно: партия гитары отстает от партии метронома на те же 10 мс.

В чем, собственно, цимус? А вот в чем. Известно, что в большинстве случаев торопливая игра (на опережение — когда гитара играет раньше барабанов, к примеру) слушается значительно слабее, чем если мы играем четко в барабаны или находимся.

То есть, условно говоря, нам лучше играть или как можно более синхронно, или немного отставать, пропуская ударные вперед. Давайте попробуем выясним, как на слух воспримется такое расхождение по сути одинаковых сигналов. Для этого я свел их в один канал:

Вот так это звучит:

На мой слух, очевидно слышны два отдельных звука. Поэтому я считаю, что задержка в данном случае «гитары» относительно метра на 10 мс можно расценить именно как опоздание. То есть это уже не «оттяжка назад» — это мы просто и банально разъехались с метром.

Конечно, на реальной партии столь заметного расхождения не будет: атака у электрогитары очень жирная и сырая, поэтому скорее всего опоздание на те же 10 мс не будут расцениваться как аритмия, особенно при учете того, что зачастую чисто человеческий фактор дает ритмическую ошибку, скорее всего, больше, чем 10 миллисекунд, даже в случае очень крутой ритмической работы.

Но любопытно-то не это, а вот что. Представим себе , что вы капитально заморочились на ритме, отрабатываете, замеряете и так далее. Получается, что в случае записи занятий в DAW (а записывать себя — один из наиболее эффективных методов контроля за собой) у вас в любом случае будет фора. В данном случае это те же 10 мс, в зависимости от аппарата и программ эта цифра, понятно, будет меняться. Очевидно, что подавляющее большинство народу несильно владеет работой во всех этих программах, а значит, вряд ли они лазят по настройкам, компенсируют задержки и так далее. Поэтому скорее всего такая фора есть у всех этих, не столь замороченных людей, так как при установках по умолчанию получаются вот такие результаты, как показано выше.

Так вот, представим опять же, что вы занимались-занимались — и таки дозанимались: результат, получаемый на записи, вас полностью устраивает. Спешки нет, все круто. Однако в реальности это вполне может означать, что играете вы как раз с этой самой спешкой, потому что для того, чтобы ваша гитара в данном случае совпала с метром — вам придется торопиться на эти самые 10 мс. Иными словами, запись в DAW при таких настройках не дает адекватной картины ритмического взаимодействия вас и метронома.

Попробуем узнать, сколько же длится эта самая атака при игре на гитаре. Я взял и записал просто одну ноту, переведя Акс в режим Bypass, то есть это гитара, записаная, что называется, «в линию». Я решил попробовать получить короткую атаку: играл почти плоским медиатором по третьей струне (без оплетки), играл достаточно резко, чтобы медиатор проскакивал струну как можно быстрее и взаимодействовал с ней как можно меньше. Получилось вот так:

Атака — это участок перед пиком: резкий рост амплитуды возникает тогда, когда медиатор соскакивает со струны и она начинает колебаться. Все, что мы видим до этого — это взаимодействие медиатора и струны. Под периодом атаки лично я подразумеваю именно этот участок. Почему именно этот? Да потому, что даже на чистом звуке гитара будет компрессирована достаточно сильно и эта едва слышимая сейчас атака будет весьма конкретно уже слушаться и являться по сути полноценной частью нашей ноты. А следовательно, если наша атака начнется перед барабанами, то она уже перетянет на себя внимание и по факту мы окажемся впереди барабанов, что вроде как недопустимо.

По длине он получился в районе 15-17 мс:

Что ж, весьма сравнимо по длительности с той форой, которую нам дает аппаратура.

Ладно, смысл-то заключается в том, что даже играя с опережением на 10 мс, то есть буквально атакуя на более чем половину периода атаки раньше метра, мы все равно будем звучать «ровно» — наша атака совпадет с началом клика, и все будет хорошо.

Другими словами, чисто ритмическая работа при игре и записи в DAW и при игре просто под клик из телефона/железного метронома и т. п. будет различаться. И мы, сидя дома и записываясь в кубейс, проверяя себя и будучи довольными, что у нас все получается, рискуем сильно разочароваться в результате, когда речь зайдет об игре с внешним источником ритма, будь то тот же железный метроном или барабанщик. При одном условии: если мы это услышим. Ведь не забывайте, что тренируясь годами под тот же кубейс, в голове складывается совершенно другая картина и понимание того, что такое ровно и что такое спешка, поскольку опять же для получения абсолютного ровняка вам придется рубить вперед клика и это станет вашей нормой. Эту норму подкрепит та же самая проверка в том же кубейсе — по сеточке посмотреть, экспортнуть аудио и проверить в редакторе и так далее.

Плюс для многих, особенно начинающих, услышать что-либо реально только уже пост-фактум: в реальном времени в процессе игры большая часть внимания сосредоточена на игре непосредственно, поэтому оценить ровность для них возможно по большей части только после записи. Стоит ли говорить, что если такого человека записать в тот же кубейс дома под клик или фанеру из кубейса, и если его записать на студии одновременно с барабанщиком (звуки от гитары и от барабанщика не будут как-либо задерживаться, так как пойдут на запись через сумматор, например), то результат будет сильно отличаться?

Что же делать? Как же быть? А вот все это будет рассмотрено уже во второй части (да-да, я знаю про ползунок в лоджике под названием Recording delay), и пока желающие могут сами попробовать поэкспериментировать на своем оборудовании и в своих секвенсорах, какая задержка будет и какие смещения получатся лично у них. Делитесь результатами 🙂

Обновление

Сегодня провел абсолютно аналогичные тесты в Cubase SX 3: у меня второй системой стоит Windows 7, поэтому нашел на внешнем диске первый попавшийся древний кубейс, поставил и сходу начал тестировать. То есть, как и в прошлый раз, все настройки — по умолчанию, ровно так, как их выставляет производитель программы.

Настройки оборудования при выборе Акса основным устройством выглядят так:

Задержка какая-то абсолютно дикая, ну да ладно: мы же тут за чистоту эксперимента, соответственно, дефолтные настройки не меняем.

Записываю гитару аналогично тому, как делал это в Лоджике. Потом взял и померял задержку начала получившегося начала «клика» гитары в самом Кубейсе:

Получилось, как видим, 615 сэмплов задержки.

15 Комментариев:

Повторил запись метронома через наушники-гитару.
Записывал в Reaper, интерфейс — Yamaha THR10 через USB. В настройках ASIO самой ямахи была написана задержка на запись 16 мс, на воспроизведение 19 мс.
Приложил наушник, записал, посмотрел в самом сексвенсоре. Записанный клик отстает от оригинального. Но ничтожно мало, на 18 фреймов. Частота дискретизации 44,1 кГц, подсчитал отставание: 408 микросекунд. Могу приложить картинку получившегося.
Сейчас продолжу, поищу где отключается компенсация задержки в Рипере, надо с ней еще поиграть.

Отключил компенсацию задержки. Разница между кликом и записью составила почти 36 милисекунд. Это как раз и есть сумма 16 мс записи и 19 мс воспроизведения. Если уменьшить размер буфера в два раза до 256 фреймов, сумма задержек воспроизведения и записи составляет 20 мс, эту же величину показывает разница клика и записи.

Привет. Хочу дополнить кое-чем, указать на ускользнувшие от внимания существенные факты и представить свое видение проблемы.
Да, общеизвестно, что на входе и выходе звуковой карты есть задержка. И она больше чем мы полагаем. Ее можно замерить, можно воспользоваться уже готовыми замерами по ряду аудиоинтерфейсов, ветка на небезызвестном форуме http://forum.rmmedia.ru/showthread.php?t=72423. Там и софт для замера и результаты для многих карт.
На первый взгляд задержка большая, но чисто логически рассуждая (могу и ошибиться, но…) выходную задержку вообще можно не брать в расчет. Почему? Выходная задержка в одинаковой степени касается и гитары и всех других звуков, в том числе и метронома. Если у нас из-за нее метроном опаздывает на столько же, на сколько и гитара, то можно говорить, что задержки нет. При условии, что хост никак эту задержку сам не компенсирует. Но опять же, логично, что хост будет компенсировать ее для всех инструментов (и клика) и задержки опять не должно быть. А входная задержка порядка 1-2 мс настолько мала, что как раз ею мы можем смело пренебречь, или хотя бы расслабиться, потому что изменить это нам не дано (если только играть полностью в аналог))
И если я прав в умозаключениях по поводу пренебречь выходной задержкой в своем предыдущем абзаце, то когда мы играем под внешний клик через компьютер, нам уже придется с нею считаться, особенно учитывая ее реальные размеры показанные в тестах. Вот тут могу только обратиться к опыту «крутых перцев». Есть товарищи, которые уверяют, что ощущают эту задержку, типа я поливаю 32-ми 64-ми и слышу опоздание относительно атаки медиатором. Но уверяют, что если уменьшить до возможного минимума входную задержку (типа 128 сэмплов и ниже), то уже не чувствуют.
Ну, что тут посоветовать… действительно надо выставлять самую минимальную задержку. Для записи у меня всегда задержка 64-82 сэмпла, это порядка 1,4-1,7 мс. По ее поводу я уже абсолютно не парюсь.

С хостами разобрались. Но вот, существенное упущение в статье – скорость звука, особенно при работе с внешним кликом.
Она такая – 30 сантиметров это 1 мс, один метр – это 3 мс, 2 метра – 6 мс и так далее.
Согласитесь – много. Если действительно задрачиваться по поводу отсутствия задержки, то может быть только такой вариант – в аналоговый микшер подают внешний клик и микрофон снимающий гитару комбика и гитаристу с микшера наушники, чтоб сразу в ухо). Задержка будет лишь от скорости прохождения цепи током. Во всех остальных случаях метроном лежит себе в сторонке, слышим мы его с задержкой «чем дальше – тем больше».
К чему все это? Ведь метроном можно положить перед собой на столе и подвинуть поближе к уху, даже до расстояния 30 см и достичь пренебрежительного уровня задержки.
Вот к чему. Играет целая рок-группа в своей репетиционной. Индивидуальных систем мониторинга у них нет, просто драмер играет как чувствует ритм или под клик в ухо, а все остальные играют под драмера. Собственно так сыгрывались и сыгрываются тысячи команд, в том числе и самых-самых. Все они стоят в немаленькой комнате и естественное отставание между ними из-за скорости звука следующее – в 3 метрах от драмера – 10 мс, в 6 метрах – 20 мс, в 9 метрах – 30 мс. Согласитесь, что стоять в 5-6 метрах от драмера обычное дело, а то и дальше.
Можно привыкнуть к определенному времени задержки в репзале и соответственно звуку, а потом выйти на концертную площадку, где все будет подзвучено мониторами без задержки и нужно звучать и не испытывать дискомфорта от изменившегося звучания.
Особенно это актуально в студии. Есть рокеры, которые не признают раздельной записи, не любят играть сидя на стуле и замотанными в наушники. Им нужна только совместная игра, атмосфера зала и все такое прочее. Они встают все посреди комнаты, а режиссеры как-то по возможности минимизируют протечки звука в микрофоны, драмера немного огородят звуковыми панелями, гитарный кабинет, вокалиста. Чтобы и группа работала в привычной ауре и микрофоны писали по возможности максимально свой инструмент.
Что получается – музыканты опять слышат драмера с задержкой и им кажется играют они вовремя, а микрофоны пишут каждого и микшируют уже с фиксированной задержкой – другой звук, не тот что в зале в том или ином месте. Но группа звучит)
В общем, это просто кое-какая инфа для размышления о задержках от скорости звука и как это встречается на практике.

Как делаю я. Двумя словами – не парюсь. Если записываю трек, то всегда играю под барабанную дорожку, вавку. Входную задержку ставлю самую минимальную. При записи непрерывной партии можно ориентироваться только по пикам. В идеале и по возможности пики баса и гитары должны совпадать (или может кто-то любит, чтоб бас запаздывал) и действительно в хорошо сыгранной партии они совпадают. В крайнем случае, можно подвинуть немного, без фанатизма. Я поступаю иначе, не люблю задрачиваться двигать ноты, просто прописываю два дубля риффа для подстраховки и все, если нота просела или съехала, можно заменить дублем. Если оба дубля не работают, переписываю заново. Геморно – но на пользу играющему (от сдвигов руками пользы мне нет), интереснее, да и с опытом все лучше и лучше и меньше дублей требуется.
Так же и с гитарами – лево, право. Их уже надо между собой синхронизировать и не только по времени. Но все по тому же принципу и вместе с басом (+ я еще и с драмсами). Пишу DIайники, то есть чистую гитару, где атаку и все пики отследить не составляет труда.
В целом мораль такая, что если на слух при исполнении все ровно и качает, то на записи у меня и пики совпадают, и ничего двигать не нужно, при воспроизведении тоже качает.
Точно также и при записи упражнений, при игре с хостовским метрономом, когда я сдвигаю позицию и появляется задержка, ощущения от звука меняются и визуально по пикам отслуживается.
Короче, получается, что если чувствовать самому, то проблемы в известной степени нет, а вот в любой ситуации человеческий фактор куда как более значим.
Много получилось)

Dmitri, это все верно, однако задержка звука из-за расстояния между источником и слушателем так или иначе «компенсируется», на мой взгляд, головой. Обратный эффект этой компенсации используется в психоакустической обработке: дать голове определенным образом измененный звук, чтобы нам казалось, типа звук находится над нами и т. п.
А тут получается, что источник звука буквально в ухе (ну в наушнике, скажем), а задержка есть. Диссонанс 🙂

Вообще, согласен по многим факторам, однако вот по поводу «чувствовать самому» — тут имею несколько отличное мнение. Если сбит прицел или вообще его как такового нет (что там может по ритму чувствовать начинающий?), то на свои чувства полагаться — крайне неразумно.

Макс
22 апреля 2014, 17:50

«На первый взгляд задержка большая, но чисто логически рассуждая (могу и ошибиться, но…) выходную задержку вообще можно не брать в расчет. Почему? Выходная задержка в одинаковой степени касается и гитары и всех других звуков, в том числе и метронома. Если у нас из-за нее метроном опаздывает на столько же, на сколько и гитара, то можно говорить, что задержки нет. «

Вот тут в общем случае я лично не согласен. Это справедливо если мониторить гитару через хост. Но если мониторить в обход (с живого усилителя или напрямую с процессора), никакой выходной задержки у гитары не будет.

А про живой бэнд — да, конечно, там вообще у всех все по-разному, гитара для барабанщика будет всегда прилично опаздывать, если гитарист играет точно на свой слух (звук от удара сначала к гитаристу летит через 3 метра, потом гитара летит назад от усилителя к барабанщику).

20 миллисекунд — это ведь 0,02 секунды, так? Неужели живой музыкант способен так точно попадать в ритм барабанов, чтобы не опережать или не отставать от них на 0,02 секунды?

Источник

Оцените статью