☠️ Убить трубу.

Содержание

🎬 Что такое «труба»
⚡ Откуда она берётся
📊 Почему её не видно на АЧХ
🧠 Психоакустика: как мозг слышит время
🎶 Слух — это тренировка
🛠️ Что мы сделали в M1
🎯 Вместо вывода: вижу = слышу
✨ Напоследок

🎬 Что такое «труба»

Триллер о пугающей физике отражений в чашке, призраках фазовых искажений и почему ты их не слышишь, но они есть.

«Труба» — слово из нашего внутреннего звукорежиссёрского сленга. У него нет официального определения и нет упоминаний в технической литературе. У кого работа связана со звуком — понимает, о чём речь: о паразитных фазово-частотных искажениях в чашке наушников, из-за которых чистый сигнал на выходе звучит так, будто его пропустили через жестяную трубу.

Парадокс «трубы» в том, что на привычных графиках её не видно. График АЧХ может быть идеально ровным, а наушники всё равно «трубят». Ты надеваешь — и сразу слышишь, что с этими наушниками что-то не так по сравнению с предыдущими. Но сформулировать, в чём именно разница, не можешь. На АЧХ оба наушника могут выглядеть одинаково. Технически инструмент тот же. А на слух — разные. Это и есть «труба». Она ощущается, но не описывается. И со временем мозг учится слышать её как фоновый шум, на разбор которого уходят ресурсы, — за часы работы такие наушники утомляют сильнее, чем должны.

Эта статья — про физику «трубы». Откуда она берётся, почему её не видно на привычных графиках, почему её всё-таки слышно, и что мы сделали в M1, чтобы её обнулить.

⚡ Откуда она берётся

Изодинамическая мембрана наушников постоянно колеблется. Амплитуда хода — порядка 1–2 миллиметров на самых низких частотах; на высоких амплитуда уже микроскопическая. Колебания идут во всём звуковом диапазоне — от десятков циклов в секунду на басу до десятков тысяч на верхних ВЧ. На каждом цикле мембрана излучает звук в обе стороны попеременно — половина энергии идёт к уху, половина — назад, внутрь чашки.

И вот тут начинается интересное.

🎾 Аналогия — мяч и стена

Брось мяч в подушку — он останется в подушке. Брось в стену — отскочит обратно. Звуковая волна — это тот же мяч. Если за мембраной материал, который поглощает энергию, — волна гасится. Если жёсткая стенка — отскакивает.

В чашке наушников после мембраны стоит задняя стенка. И боковые стенки. И сложная геометрия креплений. Каждая такая поверхность — это потенциальная «стена», от которой звук отражается обратно. Звуковая волна с задней стороны бьётся о стенки чашки и возвращается обратно множеством путей. В итоге в ухо приходит не один звук, а исходный звук плюс его эхо, пришедшее на доли миллисекунды позже.

💧 Аналогия — круги на воде

Брось два камня в воду рядом друг с другом, с небольшой задержкой. На поверхности встречаются два набора кругов. Где гребень одной волны встречает гребень другой — высота удваивается. Где гребень встречает впадину — они гасят друг друга, и в этой точке вода не колышется вообще. Это явление называется интерференцией.

Со звуком — то же самое. Исходная волна и её отражение в чашке встречаются. На одних частотах они складываются, на других гасятся. На выходе из чашки в ухо — уже не оригинальный сигнал, а его искажённая копия с провалами и подъёмами по частоте, которых в записи не было. Если посмотреть на это в графике, получится зубчатый узор, который называется comb filter — гребёнчатый фильтр.

Гребёнчатый фильтр (comb filter)

Но эта искажённая картинка по частоте — только полбеды.

🥁 Аналогия — опаздывающий барабанщик

В группе барабанщик задаёт тайминг. Если он бьёт на одну восьмую позже всех остальных — рассыпается весь грув. Звук вроде тот же, ноты те же, но что-то не сходится. Точно так же работает и групповая задержка — это сдвиг во времени, с которым разные частоты доходят до уха. В идеале все частоты должны прийти одновременно. В реальности — нет. И когда одна частота опаздывает на миллисекунду от другой, мозг это слышит как «размытость», «нечёткость», «грязь». Атака удара перестаёт быть точечной — она размазывается во времени.

🐚 Аналогия — морская раковина

Поднеси к уху раковину — услышишь «шум океана», который на самом деле никакой не океан, а собственный резонанс воздуха в полости раковины. Чем больше раковина — тем ниже её гудение. Чем меньше — тем выше. Это работает на том же принципе, что и резонанс в чашке наушников: звуковая волна попадает в полость и начинает раскачиваться на частоте, которая определяется геометрией. Простейшая формула для полости, открытой с одной стороны (а чашка наушников — это и есть полость, открытая со стороны уха):

f = c / (4 · L)

Здесь c — скорость звука в воздухе (343 м/с), L — глубина полости в метрах.

Что даёт формула на практике

Полость	Глубина	Резонанс	Частотная зона
Морская раковина	5 см	~1,7 кГц	Нижняя середина
Чашка наушников	2 см	~4,3 кГц	Верхняя середина / формантная зона голоса
Чашка наушников	1 см	~8,5 кГц	Нижние ВЧ

Это очень упрощённая модель — формула описывает идеальный жёсткий резонатор без потерь. В реальной чашке всё сложнее: мембрана сама вибрирует и поглощает часть энергии, амбушюр работает как мягкая граница, материалы стенок частично гасят отражения, форма далека от правильной геометрии. Но идея верна: каждая чашка имеет свою собственную резонансную частоту, на которой звук гудит сильнее, чем нужно. И если эту частоту не задемпфировать конструктивно, она будет окрашивать каждый звук в записи своим гулом.

Интерференция и её следствие comb filter, групповая задержка, резонанс — всё это и есть «труба». Не одна вещь, а целый комплекс явлений. И все они происходят во времени, не на отдельных частотах.

📊 Почему её не видно на АЧХ

АЧХ делает стоп-кадр КАКИЕ частоты воспроизводят наушники. Импульс — КАК эти частоты приходят и уходят во времени.

По одному кадру футбольного матча нельзя понять, что произошло — забили гол или пробили мимо. По АЧХ нельзя понять, что мембрана делает во времени.

Чтобы увидеть «трубу», нужны графики, показывающие поведение во времени.

🛀 Аналогия — хлопок в ванной

Хлопни в ладоши в комнате с коврами — короткий «хлоп», и тишина. Хлопни в кафельной ванной — «хлоп» и реверберация, эхо, гул, который умирает примерно за секунду. Сама громкость хлопка одинаковая. А вот хвост — совсем разный.

Импульсная характеристика (Impulse Response, IR) — это именно такой график. Подали в наушники идеальный короткий импульс — и смотрим, как мембрана его воспроизвела и как затем затухла. У хороших наушников после основного пика мембрана возвращается в покой почти моментально. У плохих — продолжает дёргаться ещё миллисекунды, и эти дёргания и есть «труба», видимая невооружённым глазом.

Импульсная характеристика M1, левый канал, замер в REW.

Impulse response — это характеристика всей сигнальной цепи (ЦАП → усилитель → наушники → микрофон), а не только мембраны. Чтобы IR показывал именно свойства наушников, в замере должен использоваться качественный усилитель с низким выходным импедансом и высоким damping factor. Иначе график будет характеризовать в первую очередь усилитель: мембрана низкоомных наушников при высоком output impedance плохо демпфируется и продолжает дёргаться по инерции. Замеры, представленные выше, выполнены в условиях, где вклад остальных элементов цепи в IR пренебрежимо мал. Для контекста: если в той же сигнальной цепи померить наушники именитых брендов из этой качественной категории, но по цене x10, их impulse response зачастую будет медленнее.

Вот реальный импульсный отклик M1, левый канал, замер в REW. Главный пик резкий — это атака. Сразу за ним отрицательный отскок до −60% — естественное возвратное движение мембраны. Через 100 мкс остаточный положительный отскок ~+20%. Дальше серия колебаний с амплитудой меньше 10%. К одной миллисекунде уровень уже ниже 5% от основного пика (то есть около −26 дБ). После этого — почти ровная линия.

В абсолютных цифрах это одно из самых быстрых импульсных затуханий, которые сейчас существуют в мониторных наушниках. У большинства известных моделей этой категории затухание происходит существенно медленнее.

Если посмотреть на период этих остаточных колебаний — он составляет около 100–150 мкс. Это соответствует частоте 7–10 кГц. И это та самая частота, которую предсказала формула для нашей геометрии чашки. Физика никуда не делась — резонанс на 7 кГц физически возникает. Но за счёт демпфирования его энергия в импульсной характеристике живёт меньше миллисекунды. Это и есть «обнулённая труба» — не отсутствие отражений, а отсутствие их накопления во времени.

🎹 Аналогия — расстроенное пианино

Есть ещё один график, который называется waterfall (или CSD, или burst decay). Это пианино, у которого ты последовательно нажал все клавиши и смотришь, как каждая нота затухает. У идеального пианино все ноты затухают одинаково ровно и без посторонних обертонов. У расстроенного — какая-то нота тянется дольше других, какая-то даёт паразитный звон, какая-то быстро глохнет. Так и в наушниках: waterfall показывает, как энергия на каждой частоте умирает во времени. Длинные хвосты на одних частотах и быстрое затухание на других — это «расстроенное пианино», то есть «труба».

Waterfall M1 — измерения Бойцова

На waterfall у M1 видно, что основная энергия (красно-оранжевая зона) затухает практически одинаково ровно по всему диапазону до 5–6 периодов. Никаких «затянувшихся нот» в проблемных зонах нет. Лёгкие колебания в районе 4–5 кГц — это та же первая мода чашки, что мы видели в импульсе, но прижатая на 20–30 дБ ниже основной энергии.

Если бы мы смотрели только на АЧХ — мы бы этого не увидели вообще. На графике АЧХ M1 выглядит ровно. А на графиках во времени видно, какой работой это «ровно» обеспечено.

АЧХ M1

🧠 Психоакустика: как мозг слышит время

Ты можешь спросить: если «труба» сидит в области десятых долей дБ или нескольких миллисекунд, как это вообще можно услышать?

Можно. Просто механизм не такой, как ты привык думать.

👁️ Аналогия — бинокулярное зрение

У нас два глаза. Каждый видит чуть-чуть свою картинку. Мозг сравнивает их и из разницы вытаскивает информацию о расстоянии до объекта, о его объёме, о пространстве. Если бы у нас был один глаз — мы бы видели плоско.

Так же работает и слух. У нас два уха. Звук от источника, который не точно перед нами, приходит в одно ухо чуть раньше, чем в другое. Эта разница — иногда в десятые доли миллисекунды. Мозг сравнивает приход звука в левое и правое ухо и из разницы строит звуковое пространство: где источник, как далеко, движется ли он.

Когда наушники вносят «трубу» — они ломают эти таймовые соотношения. Не на громкость влияет, не на частоту, а именно на время. И мозг чувствует: «что-то не так с пространством». Сцена «сжимается», инструменты «слипаются», атаки «размазываются». Ты не можешь объяснить почему — потому что объяснить можно только если знаешь, что именно искать.

И ещё. Мозг постоянно сравнивает то, что слышит, с тем, что ожидает услышать. У него огромная база накопленного опыта — как звучат настоящие удары, голоса, инструменты, помещения. Когда что-то в записи не сходится с ожиданиями — мозг тратит ресурсы, чтобы разобраться. Не на уровне сознания. На уровне фоновой обработки. И именно поэтому от плохих наушников «устаёшь» — мозг работает на пределе, разбираясь с потоком данных, в котором что-то не сходится. От хороших наушников не устаёшь — потому что нечего разбирать, всё на своих местах.

🎶 Слух — это тренировка

«Я не звукорежиссёр, я не услышу разницу».

Это самая распространённая мысль, которую слышим от людей, впервые узнающих про «трубу». И это неправда.

🔧 Аналогия — настройщик пианино

Настройщик за несколько секунд понимает, что не так с инструментом. Не потому, что у него «золотой слух». А потому, что он за свою жизнь настроил тысячу пианино и знает, как именно звучит каждый возможный дефект. Слух у него физиологически такой же, как у любого человека. Разница — в тренировке.

То же самое работает и со слухом на «трубу». Когда ты впервые надеваешь наушники без неё — первое ощущение чаще всего: «что-то странное, кажется звук какой-то сухой». Это потому, что мозг привык компенсировать «трубу» как фоновый шум, и теперь её отсутствие воспринимается как «чего-то не хватает».

Через несколько дней работы привычка меняется. Через несколько недель — ты возвращаешься на старые наушники и слышишь «трубу» так же отчётливо, как настройщик пианино слышит расстройку. Просто потому, что научился слушать в эту сторону.

И именно из-за этого продюсеры с большим стажем так чувствительны к этой теме. Они не слышат каких-то особых частот — у них точно такой же организм, как у любого из нас. Просто они тысячи часов работали со звуком и научились различать, что именно звучит «не так». Это знание не имеет ничего общего с врождённым «слухом», это чистая практика.

🛠️ Что мы сделали в M1

Когда команда садилась за разработку M1, главная проблема, которую нужно было решить, формулировалась не как «сделать ещё одни наушники с хорошей АЧХ». Их и так на рынке хватает. Главная проблема была — обнулить «трубу». Без этого невозможно построить тот самый «микроскоп» вижу-слышу, который нужен продюсеру для контроля сложного быстрого продакшна — где высокая скорость ударов в минуту, плотный синтез, переплетённые барабаны, и каждая миллисекунда в миксе имеет значение.

Это сразу определило конструктивные решения. Каждое из них — это компромисс с физикой, и каждое подбиралось эмпирически, через измерения и отслушку. Получить эталонный звук драйвера на чистой теории невозможно — полное теоретическое моделирование наушников аналитически неосуществимо. Метод конечных элементов (FEM — Finite Element Method, когда сложная форма разбивается компьютером на миллионы мелких элементов и считается поведение каждого) — это мощный инструмент, но он решает задачу с большими допущениями. Реальная чашка с реальной мембраной на реальном ухе, особенно на высоких частотах, где включаются дифракция, парциальные моды мембраны и сложное поведение мембраны как излучателя, даёт расхождения с моделью, которые ничем кроме отслушки не закрываются.

🍞 Аналогия — выпечка хлеба

Чуть больше дрожжей — другая структура мякиша. Изменил температуру в духовке — другая корка. Поменял муку — переделывай весь рецепт. Параметров много, все взаимозависимы, и единственный способ узнать, получилось ли, — когда хлеб испечётся и ты его разрежешь.

Так и с драйвером: меняешь натяжение мембраны — нужно подстроить демпфирование. Подкрутил демпфирование — изменилась чувствительность по басу. Изменил геометрию подвеса — переделываешь магнитную систему. И проверить, удачно или нет, можно только одним способом: попробовать на вкус. В случае с хлебом — буквально. В случае с драйвером — отслушать.

За год работы над M1 было сделано огромное количество чертежей, десять прототипов конструкции самих наушников и 64 итерации мембраны. Каждая мембрана не просто измерялась — она шла в отслушку. Тестовый материал — десятки референсных треков, половина из которых — собственный продакшн одного из создателей. Это треки, в которых каждая миллисекунда известна по приборам: где какой транзиент, где какой фазовый рисунок, что именно должно происходить с волной в каждом её участке. И по тому, что именно из этой известной структуры пропадало или искажалось в каждой новой итерации драйвера, определяли, куда крутить следующую правку.

Конкретные решения, которые легли в финальную версию

1. Овальная форма чашки без острых углов

В прямоугольной или цилиндрической полости звук бьётся между параллельными стенками и накапливается в стоячие волны — это самый эффективный механизм формирования «трубы». В чашке со сглаженной геометрией звуковые отражения уходят в разные стороны, не возвращаясь повторно к одной и той же точке.

Бытовая аналогия: эхо в прямоугольной комнате с твёрдыми параллельными стенами живёт долго и гудит — каждый, кто хоть раз был в пустом помещении до ремонта, это слышал. В комнате со скошенными непараллельными стенами (так профессионально проектируют студии звукозаписи) эхо рассыпается практически мгновенно.

2. Точно настроенный тракт стравливания

Это собирательное название всей системы дренажа избыточного давления и снижения резонансов: куда уходит энергия, которая образуется за мембраной, как она проходит сквозь конструктивные элементы и в каком объёме выходит наружу.

На рынке полноразмерных планаров глубина чашки лежит в диапазоне 18–26 мм по доступным замерам — это даёт первую резонансную моду чашки в области 3–4 кГц.

У M1 полная глубина 12 мм (3 мм амбушюр + 9 мм от мембраны до задней стенки). Это сдвигает резонанс с критичных 3–4 кГц на ~7 кГц. На 7 кГц длина волны короче — её существенно проще задемпфировать тонкими акустическими материалами. Звук на этой частоте, если бы он вообще успел накопиться, прошёл бы через демпфирующие слои и потерял бы энергию до того, как стал бы заметным резонансом.

3. Равномерное распределение силы по мембране и контроль её парциальных мод

Мембрана размером 46×60 мм — это не точечный излучатель, а площадь. Если магнитное поле распределено по ней неравномерно, разные участки мембраны двигаются с разной амплитудой. На определённых частотах мембрана начинает не двигаться целиком как поршень, а разбиваться на отдельные колеблющиеся зоны — это парциальные моды. Каждая такая мода добавляет свой звон.

У M1 магнитная система спроектирована так, чтобы сила распределялась максимально равномерно — это убирает парциальные моды как источник цветности.

В сумме эти решения дают то, что видно на импульсной характеристике: чистый главный пик, быстрое затухание, отсутствие длинных хвостов. И то, что видно на waterfall: ровное затухание по всему диапазону без длинных «нот».

🎯 Вместо вывода: вижу = слышу

Современный продакшн — это работа с видимой волной. Открываешь DAW, увеличиваешь сигнал, и можно дозумиться до отдельного семпла. При частоте дискретизации 48 кГц это разрешение 0,02 миллисекунды на пиксель. То есть продюсер сегодня физически видит на экране события длиной в десятые доли миллисекунды — переходы, фазовые конфликты, зигзаги. Видит фазовое несоответствие между бочкой и басом в области 60–100 Гц — те самые пара семплов смещения, из-за которых саб теряет силу. Видит конфликт между снейром и мид-басом на 200–400 Гц — в зоне, где эти инструменты пересекаются и маскируют друг друга. Видит, где идёт ровный sustain, а где появился микрощелчок.

Это исторически очень недавняя возможность. До прихода удобных DAW в начале нулевых такое разрешение было либо недоступно вовсе, либо доступно только на крайне дорогом студийном оборудовании. Продюсер 80-х – 90-х слышал проблему, но не мог её точно увидеть. Реалтайм-анализаторы, которые показывают честное миллисекундное разрешение того, что происходит со звуком прямо сейчас, — стали массовыми только к середине нулевых.

И вот тут — парадокс, который объясняет, почему массово эта проблема до сих пор не решена. За эти десятилетия звукорежиссёры научились видеть, что происходит со звуком, с миллисекундным разрешением. А производители наушников — особенно крупные легендарные бренды — за те же годы к фулл-разработке этих звукорежиссёров почти не привлекают. Большие корпорации инерционны, и R&D в них настроен на массовый рынок и эффектный, аудиофильски-привлекательный звук, а не на точный мониторинг. Разработка опирается на инженерные интуиции, на личные предпочтения создателей, на тестирование рандомными фокус-группами с целью продать побольше — а не сделать точнее. Случайные попадания в хорошие характеристики у отдельных моделей бывают, но именно случайные, в отсутствие системного подхода.

Этот разрыв бьёт по обеим сторонам — и по продюсерам, и по слушателям. Продюсер годами пересаживается с одной «легендарной» модели на другую, в каждой прокачивает свой внутренний АЦП, повышает пороги восприятия — но так и не находит того самого «вижу = слышу», потому что эту задачу никто системно не ставил. Аудиофил, не имея компетенций различать правду от окрашенности, тоже бесконечно тратится: купил «легендарные» наушники, год слушал, прокачал свой АЦП в этой конкретной «трубе», начал слышать её ограничения, почувствовал что чего-то не хватает — пошёл за следующими, в которых сидит «труба» другого вида. И так по кругу, годами. Индустрия идеально подстроена под этот цикл — каждая новая модель продаётся как «новый уровень», а по сути это просто другая окрашенность за другую цену.

Сейчас ситуация для современного звукорежиссёра выглядит так:

👁️ Видеть с миллисекундным разрешением

Любой современный DAW даёт эту возможность в базе.

👂 Слышать с тем же разрешением

99% наушников на рынке не позволяют этого делать.

Дело в наушниках. Они показывают «общую картину» — звучит сцена или не звучит, узнаваем инструмент или нет. Но 2–4-миллисекундные ошибки в плотном миксе в них тонут. Тонут в «трубе». И продюсер оказывается в очень странной позиции: глазами видит проблему, но услышать её не может, потому что наушники эту разницу размазывают в собственной цветности.

Когда «труба» обнулена — визуальное и слуховое разрешение наконец синхронизируются. Видишь косяк — слышишь его в наушниках. Видишь фазовый конфликт баса длиной 2 мс — слышишь именно его, а не «что-то с басом, надо разобраться». Информация, которую DAW даёт глазам, начинает совпадать с информацией, которую наушники дают ушам.

Отсюда и пришло название «аудиомикроскопы». Микроскоп даёт глазам разрешение, которого у них изначально нет. У нас наушники, которые дают слуху разрешение, эквивалентное тому, которое DAW уже давно даёт глазам. Слух наконец-то догоняет зрение.

И в этом смысле «труба» — это не просто акустический дефект. Это разрыв между тем, что продюсер видит на экране, и тем, что он способен услышать в реальности.

Этот разрыв мы и закрывали в M1.

✨ Напоследок

M1 — не классический коммерческий продукт. Идея родилась из практической потребности продюсера, который тридцать лет работает в нейрофанке: высокая скорость ударов в минуту, плотный синтез, ювелирный звуковой дизайн, переплетённые ритмические партии. На таком материале наушники с «трубой» превращают любое сведение в борьбу с фоновым шумом, которого нет в самом сигнале.

За эти тридцать лет на руках побывали разные «легендарные» модели крупных аудиофильских брендов — каждая обещала студийный мониторинг и каждая на деле окрашивала звук по-своему, делая его эффектнее, приятнее, «теплее», но не была правдой. Ближе всего к честному отображению оказались Fostex RP MK3. Но и у них были свои минусы из-за пластиковой чашки и каптоновой мембраны: лёгкая трубность, размытая середина в районе 300 Гц, недостаточно густой саб, задранные ВЧ, после которых у некоторых начинается тиннитус, и тугое жёсткое оголовье. M1 строился с целью сохранить честность мониторинга и одновременно убрать эти болезни.

Дорогие планары от уважаемых производителей — это отличные наушники, и для классики, джаза, аудиофильского винила они работают прекрасно. Но для современного EDM-продакшна они подкрашивают звук, делают его слаще для восприятия. Это нормально и допустимо для слушателя. Для продюсера это значит, что в финальном миксе он сводит под одну акустическую картину, а слушатель в наушниках или колонках услышит совсем другую.

Когда стало ясно, что инструмент работает — было принято решение построить его производство для коллег и учеников по доступной цене. Цель: чтобы у продюсера без студии за миллион была возможность контролировать звук на том же уровне, что у продюсера с топовым оборудованием. Чтобы конкурировать не финансами, а руками и идеями.

M1 — идейные наушники. От пользователя к пользователю. В них заложен личный опыт и решение личных болей, а не просто желание соскамить денег с покупателя.

🎧 Для продюсеров

При использовании M1 ваша музыка станет лучше — вы будете слышать, что с ней реально происходит. Каждая ошибка фазы, каждый невычищенный артефакт, любой щелчок и шорох — видны на анализаторе и слышны одновременно.

🎵 Для аудиофилов

В M1 музыка становится правдой. Не «более тёплой», не «более воздушной», не «более музыкальной» — а такой, какой её записал звукорежиссёр. Правду нужно принять. После того, как принимаешь — назад уже не возвращаешься. Потому что когда слышишь, как реально звучит хороший микс, разница между ним и плохим миксом становится очевидной. А все остальные наушники начинают звучать как разные степени окрашенности — какая-то приятная, какая-то нет, правда искажена.

Блог