Данная программа принадлежит идея Роберта Алана Монро, защищена авторскими правами изобретателя!
Источник - сайт Журнал "Звукорежиссер"
Дата публикации: 10.1999
Ирина Алдошина
Бинауральный слух и пространственная локализация
Наличие двух приемников слуха обеспечивает человеку возможность воспринимать пространственный звуковой мир и оценивать перемещение звуковых сигналов в пространстве. Информация, которая поступает на оба слуховых канала, обрабатывается в периферической части слуховой системы (подвергается спектрально-временному анализу) и затем передается в высшие отделы головного мозга, где путем сравнения этой информации из двух разных каналов формируется единый пространственный слуховой образ.
Восприятие через два приемника информации, иначе называемое бинауральным слухом, дает человеку огромные преимущества, основные из которых следующие:
- локализация сигналов как от одиночных, так и от множественных источников,что позволяет формировать пространственную перспективу и оценивать пространственное звуковое поле(например, в помещении).
- разделение сигналов,приходящих от различных звуковых источников из различных точек пространства.
- выделение сигналов выбранного звукового источника на фоне других звуковых сигналов, например выделение прямого звука на фоне реверберирующих сигналов в помещении, выделение речи на фоне шумов и т.д.
Анализ бинауральных слуховых эффектов представляет особый научный интерес, в частности для изучения функционирования и спецификации полушарий головного мозга, а также громадный практический интерес в связи с развитием и промышленным внедрением бинауральных технологий для создания систем пространственной звукозаписи и звуковоспроизведения (стереофонические системы, пространственные системы типа Dolby Digital и др.), для синтеза трехмерных виртуальных звуковых полей (технология 3D-Sound,техника аурализации, создание адаптивных процессоров и др.), для развития новых методов метрологии и оценки звуковой аппаратуры.
Обеспечение пространственной панорамы, разделимости и выделения сигналов на фоне других сигналов и шумов является важнейшей задачей звукорежиссера при записи и обработке звука, а поскольку это требует использования бинауральных свойств слуха, то анализ этих свойств и является целью данной статьи.
К числу основных свойств бинаурального слуха можно отнести: пространственную локализацию, эффект предшествования, бинауральное суммирование громкости, бинауральную демаскировку, бинауральные биения и слияние звуков при определении высоты, эффекты "правого" и "левого" уха при восприятии речи и музыки и др.
Начнем рассмотрение этих свойств с пространственной локализации.
Бинауральная пространственная локализация
Прослушивая звучание симфонического оркестра в концертном зале (или пение хора в большом соборе), слушатель отчетливо воспринимает и разделяет расположение инструментов в горизонтальной плоскости на сцене, их расположение по глубине, а также ощущает пространственность окружающего звукового образа. Эта способность и называется пространственной бинауральной локализацией. Причем механизмы локализации в горизонтальной, вертикальной плоскости и по глубине несколько различаются.
Горизонтальная (азимутальная) локализация
На рисунке 1а представлены различительные признаки направленности при прослушивании источника звука (например, громкоговорителя при его различных положениях относительно головы слушателя). Звук, исходящий из громкоговорителя, расположенного справа от слушателя, должен пройти большее расстояние к левому уху, чем к правому. Как показано на рисунке 1б, низкие звуковые частоты имеют длину волны больше, чем диаметр головы, поэтому они огибают голову, поступая в ухо, расположенное дальше (дифракция). Однако звуки высокой частоты (Рис. 1в) имеют длину волны меньше, чем диаметр головы, поэтому они "блокируются" на пути к левому уху. Эта "акустическая" тень головы уменьшает интенсивность звука, поступающего в ухо, расположенное дальше от источника звука.
Частота, Гц Длительность периода 712, половины, мс (-)max, град Частота, Гц Длительность половины периода T/2, мс (-)max, град
400 1,250 90 2000 0,250 24
800 0,625 90 2400 0,208 19
1200 0,417 42 3200 0,151 14
1600 0,313 30 4000 0,125 11
Пространственная разнесенность двух слуховых приемников (ушных раковин), и экранирующее влияние головы и торса за счет дифракционных эффектов приводит к значительным различиям между сигналами, поступающими в правое и левое ухо, что позволяет произвести локализацию звукового источника в пространстве, обусловленную тремя физическими факторами:
а) временным (Interaural Time Difference - ITD) - возникающим из-за несовпадения по времени моментов прихода одинаковых фаз звука к левому и правому уху;
б) интенсивностным (Interaural Intensity Difference - IID) - возникающим из-за неодинаковой величины интенсивностей звуковой волны вследствие дифракции ее вокруг головы и образования "акустической тени" со стороны, обратной источнику звука, как показано на рисунке 1a;
в) спектральным - возникающим из-за разницы в спектральном составе звуков, воспринимаемых левым и правым ухом, вследствие неодинакового экранирующего влияния головы и ушных раковин на низкочастотные и высокочастотные составляющие сложного звука.
а) временная разность - ITD
Разность времени прихода одинаковых фаз звука к ушам (ITD) можно легко рассчитать, зная разность хода dx звуковой волны до левого и правого уха ITD=dx/C, где С-скорость распространения звуковой волны.
Смысл величины ITD можно понять из рисунка 2. Исследования зависимости между направлением локализации источника звука в горизонтальной плоскости, определяемым углом * и временем задержки ITD, приводят к следующему простому соотношению:
ITD=а/С (*+sin *) при -90i<*<90i>T/2).В этом случае возникает неясность в фазовых соотношениях колебаний, действующих на правое и левое уши: с одинаковым основанием можно считать, что одна волна отстает по фазе от другой на время dT naeунд или опережает ее на это же время. Следовательно, предельное значение времени запаздывания, правильно воспринимаемое слухом, не должно превышать половину периода.
В соответствии с этим наибольшее значение азимутального угла *мах, определяемое временным бинауральным эффектом, с повышением частоты уменьшается. Это иллюстрируется данными табл. 1, в которой приведены расчетные значения *max, вычисленные для разных частот по формуле (1) путем подстановки ITD=T/2. Например, при частоте 3200 Гц время запаздывания ITD= Т/2 создает ощущение углового перемещения всего лишь на 14°. Однако это обстоятельство не столь существенно, так как в этой области частот при изменении направления прихода звуковых волн уже достаточно сильно сказывается дифракция звука вокруг головы, то есть вступает в силу интенсивностный фактор.
б) интенсивностная разность - IID
Как видно из рисунка 1a, по мере повышения частоты за счет дифракции образуется "акустическая тень" и интенсивность звуков, достигающих противоположного по отношению к источнику уха становиться меньше. Наибольшая разность уровней звуковых давлений, действующих на левое и правое ухо, возникает при боковом положении источника (90°). Для этого случая на рисунке 4 приведен полученный экспериментально график частотной зависимости разности уровней звуковых давлений d N у левого и правого уха. Из графика видно, что по мере повышения частоты эта разность существенно возрастает, достигая на 5000 Гц величины ~20 дБ.
Последнее обстоятельство, однако, не означает, что при повышении частоты звука обостряется локализация. Напротив, чистые тоны очень высоких частот (свыше 8000 Гц) почти не поддаются локализации. Так же слабо выражена способность человека определять направление на источник синусоидальных звуков низкой частоты (ниже 300 Гц она становится значительно хуже, а ниже 150 Гo отсутствует вообще), поэтому в современных системах "домашний театр" расположение низкочастотных блоков (subwoofer) может выбираться произвольно.
Исследования ошибок при локализации положения синусоидального источника показали (Рис. 5), что наибольшие ошибки человек совершает в области 2000-4000 Гц, где, по-видимому, происходит смена механизмов локализации от временного к интенсивностному.
Анализ способности к угловому различию двух источников, находящихся в горизонтальной плоскости, также подтвердил, что в области частот 1500-2000 Гц резко возрастает наименьшая различимая величина угла между источниками.
Интересно отметить, что минимальное различие в азимуте (угле) воспринимается, когда источники находятся перед испытуемым. В этом случае он достигает 2i. Наибольшее различие возникает, когда источники находятся справа или слева: возникает так называемый "конус неопределенности" с каждой стороны уха (Рис. 6), внутри которого изменение положения источника звука не вызывает ощущение изменения его положения. Это объясняется тем, что при расположении источника сбоку получается большая разница и в интенсивности, и во времени, поэтому сдвиги источника дают малое относительное изменение общей разности. И поэтому для локализации очень важно движение головы - это изменяет положение конуса и сводит на нет его влияние.
с) спектральные различия
Наибольшая острота локализации достигается при восприятии сложных звуков и звуковых импульсов, когда, кроме рассмотренных ранее причин, сказывается еще и спектральный фактор. Например, если звук, приходящий под углом * = 90°, содержит как низкочастотные, так и высокочастотные составляющие, то в спектре звука, действующего на дальнее ухо, высокочастотных составляющих будет меньше, так как на этих частотах скажется теневое действие головы.
Кроме того, сами ушные раковины производят сложную фильтрацию звука, зависящую от его частоты, что будет рассмотрено дальше. Существенное значение для локализации имеет также энергия переходных процессов, причем наибольшее значение имеет наличие в звуке низкочастотных составляющих переходного процесса. Поэтому при прослушивании музыкальных и речевых сигналов изменение спектрального состава сигнала, а, следовательно, и его тембра, в зависимости от его расположения, помогает в локализации.
В целом анализ способности к локализации в горизонтальной плоскости показал, что наименьший ощутимый угол отклонения источника при восприятии звуковых импульсов составляет около 3°. Эту величину следует считать угловой, или бинауральной разрешающей способностью слуха. Однако слух замечает угловое смещение на 3°, но при определении направления совершает ошибку в среднем на 12°. Поэтому точность локализации имеет величину 12° для источников, находящихся в передней полуплоскости, а для источников, расположенных позади слушателя, эта точность еще меньше.
Вертикальная (высотная) локализация
Способность определять направление прихода звука в вертикальной плоскости у человека развита значительно слабее, чем в горизонтальной. Она составляет 10-15° (по сравнению с 3° в горизонтальной). Эту способность связывают обычно с ориентацией и формой ушных раковин: если в ушной канал поставить микрофоны и записать звук от источника, находящего в разных точках медианной плоскости (также и в горизонтальной плоскости), то АЧХ (Рис. 7) будет разной при приходе звука спереди - сверху и сзади на АЧХ отчетливо видны пики за счет отражения от ушной раковины в области 4 - 8 кГц, хотя есть пики и ниже 2 кГц за счет отражения от грудной клетки и спины слушателя.
Ушная раковина имеет сложную геометрию, она действует как акустическая антенна: на низких частотах она усиливает общую энергию сигнала, на средних и высоких частотах начинают сказываться резонансы ее внутренних полостей, усиливая некоторые частоты. Кроме того, происходит интерференция прямого звука со звуком, отраженным от отдельных участков ушной раковины, то есть ушная раковина действует как фильтр, внося максимальные искажения в области 6-16 кГц, причем форма этих искажений зависит от того, спереди или сзади находится источник звука, и под каким углом подъема он расположен в медианной плоскости. Вид АЧХ сигнала, записанного на микрофоны, находящиеся в ушных раковинах при разных положениях источника, показан на рисунке 8 (они называются бинауральными передаточными функциями головы - HRTF).
Эта зависимость АЧХ звукового давления, поступающего на барабанную перепонку левого и правого уха, от положения источника, используется для сравнения спектральных компонент сигнала, приходящего спереди и сзади или и сверху, и их локализации. Поэтому широкополосные сигналы лучше локализуются, чем узкополосный шум.
Если звуковые сигналы подавать через наушники, то ушные раковины оказываются прижатыми к голове. Поскольку такая ситуация для мозгового процессора является неестественной, человек теряет способность производить локализацию в пространстве, помещая при этом источник звука как бы внутрь головы. Это свойство называется латерализацией и служит причиной значительной утомляемости людей, долгое время работающих в наушниках. В настоящее время созданы цифровые процессоры, которые производят предварительную фильтрацию сигналов в наушниках, аналогичную тому, как это делает ушная раковина. Это дает возможность "выносить" звуковой образ из головы, облегчая работу звукорежиссеров, операторов и др.
Глубинная локализация (оценка расстояния до источника)
Чувствительность слуха к расстоянию до источника имеет жизненно важное значение - гудок автомобиля, находящегося сзади близко или далеко, должен вызывать разную реакцию. Однако именно это свойство слуховой системы изучено явно недостаточно. Среди основных факторов, определяющих оценку глубины можно выделить следующие:
- уменьшение уровня звукового давления с расстоянием - на низких частотах, где длина волны большая (* *5-15 м), любой источник можно считать точечным, и звуковые волны вокруг него - сферическими. В сферической волне площадь поверхности увеличивается пропорционально квадрату расстояния, и соответственно давление падает обратно пропорционально расстоянию, то есть на 6 дБ при каждом удвоении расстояния.
Многочисленные эксперименты по смещению источника и оценке кажущего расстояния до слухового образа (выполненные в заглушенной камере и на открытом пространстве) показали, что, при удалении источника-громкоговорителя на расстояние от 1 до 10 м, слуховой образ у экспертов (в заглушенной камере при отсутствии визуального контроля) также смещался в этом же направлении, но имело место отставание слухового образа от реального источника - чем дальше, тем больше.
Ощущение удвоения расстояния до звукового объекта возникало только при уменьшении уровня звукового давления на 20 дБ (а не на 6 дБ, как при объективном измерении). При этом точность локализации была не очень велика: ошибка для широкополосного сигнала (щелчки, часы и т.i.) составляла от 3,5 до 30 см при изменении расстояния от 1 до 8 м. Если при увеличении расстояния повышать напряжение на громкоговорителе так, чтобы уровень звукового давления у слухового канала эксперта не менялся, то способность определять расстояние до источника (глубинная локализация) исчезает.
Таким образом, при отсутствии визуального контроля в условиях свободного поля, когда отраженные сигналы поглощаются (например, в заглушенной камере или в свободном пространстве), уровень звукового давления в месте расположения эксперта является решающим признаком, по которому и оценивается расстояние до источника.
При больших расстояниях (больше15 м) начинает сказываться затухание, зависящее от расстояния, проходимого звуковой волной. При этом высокочастотные составляющие затухают быстрее, и спектральный состав сигнала при удалении источника меняется (тембр становится "темнее"). Кроме того, на распространение звука оказывает влияние влажность воздуха и направление ветра на открытом пространстве.
Следует отметить, что возможности слуха по определению глубины расположения источника ограничены, имеется "акустический горизонт".
На близком расстоянии (менее 3 м), на глубинную локализацию начинает оказывать влияние также дифракция на ушной раковине и голове, то есть сказываются разности уровней интенсивностей (выше1500 Гц) и временные задержки (ниже 1500 Гц), как и в предыдущих случаях.
Приближенно локализацию по глубине при расстояниях меньше 3 м можно оценить по формуле:
L=2C dT (In? / dI), где dT - временная разность сигналов, dI - интенсивностная.
При этом на близких расстояниях меняется спектральный состав при смещении звукового источника за счет дифракционных эффектов, то есть меняется тембр ("тускнеет" при приближении к источнику).
Таким образом, при изменении расстояния до источника меняется одновременно громкость и тембр, что и служит различительными признаками.
Общая точность глубинной локализации не очень велика, при смещении широкополосного звукового источника от 50 до 150 см ошибки составляют 15-30%.
Существенную роль для глубинной локализации играет личный опыт, если слушателю знаком сигнал, а если он имеет возможность сделать визуальную оценку, то точность глубинной локализации многократно увеличивается.
Точность глубинной локализации звукового источника значительно повышается в закрытом реверберирующем помещении. Роль реверберации в оценке удаленности источника, например, распределения музыкантов по глубине оркестра, исключительно велика. При перемещении звукового источника по глубине меняется отношении энергии прямого звука к энергии отраженного (реверберационного) звука, что помогает точнее определить расстояние до источника. Важнейшее значение имеет также разность по времени между прямым звуком и приходом первых отражений и соотношение их по уровням.
Приближенно, глубинную локализацию в помещении можно оценить следующим образом:
где a - коэффициент поглощения, S -площадь поверхности, Ерев/Епр - отношение плотностей отраженной и прямой энергии.
Субъективное ощущение "акустики зала" определяется целым рядом параметров, некоторые из них прямо связаны с пространственной локализацией:
Пространственное впечатление (камерность, интимность, близость) - определяет для слушателя кажущийся размер пространства. Разные стили музыки требуют разных его значений. Композитор (звукорежиссер, исполнитель и др.) должен иметь в виду этот параметр, иначе будет несоответствие стиля музыки размеру помещения (например, звучание органа в маленькой комнате), что очень четко ощущается слушателями.
Пространственное впечатление определяется разницей во времени между прямым звуком и первыми отражениями. В залах с "интимной" акустикой эта разница составляет для слушателей в центре зала 15-30 мс. Если эти отражения имеют похожие спектр и огибающую, и их громкость не выше прямого звука, то в пределах этого времени они не воспринимаются как отдельные отражения, а помогают в улучшении локализации прямого звука, в том числе глубинной. Малая разница во времени прихода первых отражений характерна для музыкальных комнат XXVIII столетия, средняя - для концертных залов 19 века, большая - для соборов.
Амбиентность - ощущение слушателя, что музыка от источника (например, оркестра) идет от всего фронта сцены, и звук окружает его со всех сторон.
Тренированный слушатель различает две составляющие в восприятии амбиентности: кажущееся расширение площади источника звука, и окружение (обволакивание), когда слушатель чувствует себя погруженным в звук, окруженным им со всех сторон.
По мнению многих экспертов, кажущееся расширение площади источника является одним из главных индикаторов акустического качества концертных залов и помещений прослушивания. Оно связано с уровнем боковых отражений - чем выше этот уровень, тем больше кажущееся расширение источника.
Кроме того, высокую связь с этим параметром показали результаты измерения на искусственной голове коэффициента внутрислуховой кросс-корреляции сигнала, усредненного в интервале 0-80 мс и измеренного в третьоктавных полосах с центральными частотами 500, 1000, 2000 Гц. Значения этого коэффициента (в соответствии с измерениями Беранека) для девятнадцати лучших залов мира составляют от 0,35 до 0,6. Кажущаяся ширина звукового источника связана также с уровнем звукового давления на низких частотах, в основном в области частот 125 и 200 Гц.
Обволакивание (окружение) - связано с ощущением позднего реверберирующего звука, поступающего со всех сторон (после 80 мс). Оно определяется конструкцией зала: наличием нерегулярностей стен, балконов и пр., то есть всеми конструктивными элементами, которые обеспечивают приход звука с разных сторон. Ощущения от звучания музыки у слушателя, к которому отраженные звуки приходят со всех сторон: от потолка, стен, пола и т.д., будут существенно отличаться от ощущений слушателя, сидящего под балконом, к которому звук приходит только с фронта. Оно связано с коэффициентом внутрислуховой кросс-корреляции, усредненного за период времени от 80 мс до1 с.
Таким образом, наш слуховой аппарат, используя разные механизмы обработки звуковых сигналов, позволяет определить и локализовать положение звукового источника в трехмерном пространстве. Именно эта способность используется при создании современных систем компьютерного моделирования трехмерных звуковых пространств (системы аурализации).
Это же свойство слуха используется и в современных системах пространственного звуковоспроизведения. Создавая искусственные условия, к которым наша слуховая система не была приспособлена в процессе естественной эволюции, например, помещая два одинаковых громкоговорителя на одинаковом расстоянии от левого и правого ушей, подавая на них одинаковые сигналы, (Рис. 9), мы заставляем наш слуховой аппарат помещать слышимый (мнимый) источник звука посередине между реальными звуковыми источниками. Пространство таких мнимых источников, создаваемых различными пространственными системами воспроизведения (стереофоническими, Surround и др.), и создает стереоэффект - по существу, это "большой обман" нашего слухового аппарата. Вопрос о том, как формируется и как управляется этот пространственный образ мнимых (виртуальных) источников, может служить предметом рассмотрения отдельной статьи.
Источник - сайт Журнал "Звукорежиссер"
Дата публикации: 01.2000
Ирина Алдошина
Бинауральный слух
Как уже было отмечено в предыдущей статье, кроме эффектов пространственной локализации, наличие бинаурального слуха, то есть двух слуховых приемников, обеспечивает целый ряд других преимуществ в получении и переработке слуховой информации.
К их числу можно отнести: бинауральную чувствительность и суммацию громкости, бинауральные слияния звукового образа и биения, эффект предшествования, бинауральную маскировку и демаскировку, эффекты "правого" и "левого" уха при восприятии речи и музыки и др.
Каждое из этих свойств слуха имеет огромное значение для восприятия окружающего нас звукового пространства и все в большей степени используется в современных звуковых технологиях записи, передачи и воспроизведения, особенно с помощью быстро развивающихся компьютерных методов обработки звука.
Остановимся в данной статье на первых трех свойствах бинаурального слуха, поскольку анализ двух последних требует дополнительных сведений о законах маскировки (на которых постараемся остановиться в дальнейшем).
Суммация звуков при бинауральном слухе
Анализ порогов слышимости, выполненный при моноуральном слушании и при бинауральном показал, что уровень слуховых порогов при бинауральном восприятии сигналов (синус, речь, шум, музыка) ниже, чем при моноуральном. Интенсивность звука для достижения порога слышимости при восприятии звука двумя слуховыми приемниками ниже на 3 дБ, то есть нужно создать в два раза больше акустическую мощность, чтобы звуковой сигнал, находящийся на пороге слышимости при прослушивании бинаурально, услышать при переходе на моноуральное прослушивание (одним ухом).
Таким образом, наличие двух слуховых приемников позволяет услышать значительно более тихие звуки, что имеет существенное значение для оценки окружающего звукового пространства.
Бинауральная суммация громкости проявляется в том, что, как показали эксперименты Флетчера, сигнал при заданном уровне громкости, например, 70 дБ, будет звучать в два раза громче, если он подается на два уха, чем на одно, то есть громкость удваивается (суммируется).
Построенные на разных частотах кривые зависимости оцененной громкости (сон) от уровня подаваемого сигнала показали, что по мере повышения уровня подаваемого сигнала преимущества бинаурального слуха возрастают: при уровне сигнала ниже 35 дБ, чтобы звуки были равногромкими при моно- и бинауральном слушании, подаваемый на два уха сигнал может быть на 3 дБ ниже по интенсивности. При уровне выше 35 дБ эта разница увеличивается, и остается примерно постоянной при дальнейшем увеличении уровня подводимого сигнала.
Дифференциальная чувствительность (то есть способность замечать различия в звуках, как по частоте, так и по интенсивности), как показали многочисленные эксперименты, при бинауральном слушании выше, чем при моноуральном.
Результаты, полученные в различных исследованиях, позволяют считать, что при бинауральном слушании дифференциальная чувствительность по интенсивности выше в 1,65 раза, по частоте выше в 1,44 раза.
Таким образом, наличие двух слуховых приемников позволяет услышать более тонкое различие звуков по высоте и по громкости, что имеет принципиально важное значение как для аудиотехники, так и для восприятия музыки.
Бинуаральное слияние звуков и биения
Несмотря на то, что в обычных условиях в оба уха звуки поступают с определенным различием во времени, по интенсивности и спектру, мы воспринимаем один слуховой образ. Мы воспринимаем один мир двумя ушами. Точнее, в оба уха поступают подобные, но не идентичные звуки, сливающиеся в единый образ. Этот процесс носит название бинаурального слияния.
Слуховая система воспроизводит бинауральное слияние в течение всего времени подачи в оба уха звуков, сходных в определенном отношении (однако совершенно разные звуки не сливаются).
Наиболее важным для бинаурального слияния являются звуки с частотой ниже 1500 Гц. Эксперименты показали, что если подавать через наушники два высокочастотных звука с разными частотами, то они воспринимаются как отдельные звуковые сигналы, однако если эти сигналы промодулировать каким- либо низкочастотным звуком, то оба сигнала сливаются в единый слуховой образ.
Полученный результат свидетельствует о том, что для бинаурального слияния слуховая система использует низкочастотную огибающую комплексного звука (его макроструктуру), несмотря на то, что детали составляющих комплексного звука (его микроструктура) различны.
Бинауральное слияние речи, например, выявляется, когда в одно ухо поступают только высокочастотные компоненты речевого звука, а в другое - только низкочастотные. Несмотря на то, что ни одно ухо не получает достаточной информации для распознавания речевого сигнала, получаемый в результате бинаурального слияния слуховой образ позволяет понять речь.
Бинауральное слияние может быть показано на эффекте "пропущенной фундаментальной" (о котором мы говорили в первой статье). При бинауральном прослушивании он может иметь место даже в том случае, если мы на одно ухо подаем четные гармоники: 200 Гц, 400 Гц, 600 Гц…, а на другое - нечетные: 300, 500, 700…, все равно будет идентифицироваться одна высота основного тона (в данном случае соответствующая 100 Гц).
Механизм бинаурального слияния звуков описан в виде математической модели, которая основывается на поиске центральной слуховой нервной системой перекрестных корреляций между звуковыми сигналами в обоих ушах. Другими словами, звуки, поступающие в уши, рассматриваются как статистические события, а механизм бинаурального слияния использует поиск общности между ними. Этот же процесс позволяет выделять периодические компоненты сигналов из шума, что важно для расширения динамического диапазона воспринимаемых звуковых сигналов при бинауральном слушании.
Когда один тон подается в правое ухо, а другой, незначительно отличающийся по частоте, - в левое, в слившемся слуховом образе воспринимаются биения, которые лежат в основе определения консонансных и диссонансных интервалов звуков. Интересная особенность бинауральных биений состоит в том, что они проявляются при полной акустической изоляции обоих звуков, поступающих в левое и правое уши. Очевидно, бинауральные биения возникают в определенном месте центральной нервной системы при взаимодействии нейронной активности, кодирующей поступающие в оба уха звуки. Нейроны, дающие ответную реакцию на огибающую бинауральных биений, обнаружены в нижних отделах головного мозга (на рисунке Superior olive (B)).
Бинауральные биения отличаются от моноуральных некоторыми особенностями: в то время как моноуральные биения могут быть слышимы при взаимодействии тонов всего воспринимаемого диапазона частот, бинауральные биения связаны с низкими частотами, и наибольшие бинауральные биения воспроизводятся при взаимодействии звуков с частотой от 300 до 600 Гц. Кроме того, бинауральные биения воспринимаются при существенной разнице в интенсивности между звуками, подаваемыми в оба уха, даже в случае, когда один из звуков подается на подпороговом уровне его интенсивности. Как уже было показано в предыдущей статье, биения возникают, когда разность частот обоих подаваемых звуков находится в пределах до 15 Гц.
Неожиданное применение нашла способность слуха различать бинауральные биения в создании так называемых "генераторов мозговых волн" (brain wave generator). Если подобрать разность частот двух сигналов поступающих в оба уха через наушники, совпадающих с альфа-, бета- и другими ритмами мозга, то можно, по мнению авторов, улучшить сон, память и др.
Эффект предшествования (эффект Хааса)
Анализ этой проблемы - одна из старейших тем в исследованиях бинаурального слуха. Эффект предшествования впервые детально описан в 1949 г., хотя о нем было известно и раньше.
В общем виде эффект предшествования заключается в том, что в пределах определенного отрезка времени ранее поступивший звуковой сигнал (фронт звуковой волны) доминирует в слуховом восприятии над звуками, поступившими позднее (эхо).
Рассмотрим, например, ситуацию, когда две акустические системы воспроизводят одинаковый сигнал одного уровня. Если слушатель находится на определенном расстоянии от них на средней линии, то в этом случае звук исходит из мнимого источника, находящегося между ними. Однако, если ввести задержку во вторую акустическую систему, то звук начнет перемещаться в сторону первой акустической системы. Как показал Хаас, при изменении задержки от 0 до 10 мс мнимый источник переместится и совпадет с первой акустической системой. При изменении задержки на второй акустической системе от 10 до 30 мс, звук будет казаться исходящим только из первой акустической системы (хотя вторая система будет продолжать воспроизводить звук той же интенсивности), то есть локализация будет производиться только по опережающему сигналу - в этом и состоит эффект Хааса. Звук второй системы как бы подавляется мозгом, хотя собственно слуховая система продолжает его слышать. Однако звук, приходящий от второй акустической системы, создает определенные ощущения обьема.
При дальнейшем увеличении задержки от 30 до 50 мс, слушатель ощущает, что звук идет и из второй системы, хотя локализация продолжает идти на первую. Только при задержке более ~50 мс (это зависит от характера сигнала - речь, музыка и др.), ощущается звук второй системы, как эхо.
Разумеется, эти эффекты зависят от соотношения интенсивностей сигналов, от степени их подобия и их спектрального состава.
Это свойство бинауральной слуховой системы имеет огромное значение для оценки акустики помещения. В любом помещении слушатель воспринимает прямой звук от источника сигнала (певца, музыканта, лектора и др.) и отраженные звуки от стен помещения. Отраженные звуки поступят в уши позже, и будут иметь другое направление, чем прямой звук. Источник звука в этом случае локализуется по направлению прямого звука, а не отраженного. Хотя отраженные звуки и будут окрашивать, качественно изменять слышимый звук, восприниматься будет только ранее прибывший прямой звук. Сказанное применимо к отраженным звукам, поступившим только в определенном отрезке времени после поступления прямого звука.
В реверберационном процессе можно выделить два отрезка - "ранние" дискретные отражения до 80 мс (в зависимости от типа помещения), и "поздние" отражения со временем запаздывания больше 80 мс. Эффект предшествования подавляет ранние отраженные звуки, они интегрируются с прямым звуком в единый слуховой образ, сохраняя локализацию на источник прямого звука. Однако отраженные звуки вносят свою окраску в воспринимаемый звук, они несут информацию о пространственности, интимности, ясности и других субьективных параметрах, играющих решающую роль в оценке качества звучания в помещениях. Это показали работы известного акустика Беранека, выполненные им на протяжении многих лет в лучших залах мира. Отраженные звуки имеют важное значение для определения разборчивости речи в помещениях.
Отраженные сигналы в помещении могут восприниматься и как отдельные повторяющиеся сигналы - эхо, при этом уровень их осознанного восприятия зависит от времени задержки, соотношения их интенсивностей с прямым звуком, спектрального состава сигнала, степени заполнения паузы между приходом отраженных сигналов и др. Наличие эхо-сигналов в помещении оказывает отрицательное влияние на качество звучания музыки и разборчивость речи. Взаимосвязь порогов заметности эха от времени запаздывания и интенсивности отраженных звуков для разных сигналов (речи, скрипки, органа) показана на графике.
Наиболее низкими пороги оказываются для речи: чтобы отраженные сигналы не ухудшали разборчивость речи, необходимо, чтобы при задержке 50 мс они были ниже по уровню основного сигнала на -10 дБ, при 100 мс на -20 дБ и т.д., поэтому для повышения разборчивости речи необходимо обеспечивать высокий уровень прямого звука. Существенное влияние на пороги заметности эха оказывает спектр запаздывающих сигналов: исследования показали, что порог эха при высокочастотных сигналах ниже, чем при низкочастотных. При высокочастотных шумах, а еще в большей степени при высокочастотных импульсах, направление прихода звука распознается по бинауральной разности времени. В таких случаях (начиная с частоты 1,6 кГц) сравниваются, по-видимому, изменения огибающих сигнала за малые интервалы времени.
Наконец, влияние на пороги заметности эха оказывает направление прихода отраженных звуков: оценка мешающего влияния отраженных сигналов на речевой сигнал показала, что при боковом падении звука порог эхо на 5 дБ ниже чем при фронтальном. Все эти данные особенно важно учитывать при построении систем звукоусиления, т.к. иначе это может привести к появлению сильных эхо-сигналов и потере разборчивости речи.
В помещениях, не имеющих сильных концентраций отражений, правильная локализация на источник звука благодаря действию эффекта предшествования сохраняется, даже когда энергия отражений превышает энергию прямого звука (до определенных пределов ~10дБ). Появление мешающего эха следует рассматривать как границу возможностей использования эффекта предшествования (первой волны).
В 1987 г. были опубликованы исследования Клифтона, который показал, что этот эффект является динамическим, и требует определенного времени для "обучения" слуховой системы: если в заглушенной камере установить два громкоговорителя и подать на них два коротких импульса, следующих друг за другом, то в первый момент времени слушатель воспринимает их как отдельные щелчки, затем (при повторении их со скважностью 10-12 периодов в секунду), восприятие второго импульса ослабевает и становится слышен только один импульс от первого громкоговорителя, а второй добавляет только некоторую обьемность. Интересно, что если сделать небольшую паузу и повторить эксперимент, то слушатель сразу слышит один звуковой образ от первого громкоговорителя. Можно предположить, что слуховая система за период "обучения" строит определенную модель акустического пространства, создавая таким образом основу для распознавания прямых звуков от их отражений. Задача создания модели (образа) акустического пространства - важная работа, выполняемая высшими отделами нервной системы.
Все эти свойства бинауральной слуховой системы (пространственная локализация, слияние слухового образа, эффект предшествования и др.), используются в настоящее время в развитии мощной индустрии "бинауральных технологий", включающих в себя создание программно-аппаратных средств, новых приборов, технологий звукозаписи и др. К числу наиболее эффективно развивающихся технологий в настоящее время можно отнести создание трехмерных виртуальных звуковых пространств (т.н. "аурализация", бинауральная стереофония, адаптивные процессоры и др.). Основные принципы их создания мы постараемся изложить в следующих публикациях.
Источник - сайт ИД Компьютерра.
Дата публикации: 13.11.2000
Петр Семилетов,
roxton@chat.ru
Читая буклеты или надписи на обложках альбомов в стилях нью-эйдж, амбиент и медитативной музыки, либо купив набор кассет скоростного обучения какому-либо иностранному языку, можно столкнуться с терминами, которые простому смертному кажутся весьма таинственными — «эффект Кирлиана», «стагнация нейтрофилов», альфа-тета-бета-волны... Вот последние... Что это за штуки? Так называемые «мозговые волны» (brainwaves) представляют собой излучаемые мозгом электромагнитные волны малой интенсивности, с частотой от 1 до 40 герц, которые успешно фиксируются приборами, например, электроэнцефалографом (ЭЭГ).
Выделяют пять основных групп этих волн:
Дельта-волны (0,5-3 Гц): Появляются в период глубокого сна, транса, гипноза.
Тета-волны (4-7 Гц): Возникают во время сна, глубокой релаксации и медитации. Увеличивают способности памяти, фокусировку внимания, стимулируют фантазию, способствуют ярким снам. Некоторые люди отмечают, что полчаса тета-волн в день заменяют 4 часа обычного сна.
Альфа-волны (8-12 Гц): Фиксируются в состоянии, пограничном между сном и пробуждением, медитации, вызывают положительные эмоции, чувство комфорта и гармонии. Используются в различных «скоростных» методиках аудио/видеообучения, например, на кассетах с курсами по изучению иностранных языков. Даже чтение учебника под тета-волны способствует большему усвоению материала. В альфа-диапазоне лежит также полоса частот, известная как «резонанс Шульмана» (частоты, резонирующие с магнитным полем Земли).
Бета-волны (13-30 Гц): Возникают в активном, бодром состоянии. Высокая активность бета-волн всегда соответствует большому выделению стресс-гормонов.
Гамма-волны (30 Гц и выше) — идут бок о бок с понятиями «гиперсознание», «гиперреальность». Во всяком случае, так полагает лауреат Нобелевской премии, сэр Фрэнсис Крик и некоторые другие ученые.
Установлено, что стимуляция мозга этими волнами извне приводит его в состояние, в котором волны возникали натуральным путем. Например, крайне возбужденного (бета-состояние) человека можно расслабить, стимулировав мозг десятигерцовыми волнами на протяжении пяти минут.
Сама технология процесса замысловата. Человек, как известно, весьма туг на ухо и слышит звук в диапазоне от 16 герц до 20 килогерц. Есть, конечно же, исключения, но... Это исключения. А наша задача — стимулировать мозг через ухо, причем с помощью стереонаушников. КОЛОНКИ НЕ ПОДХОДЯТ! Другие способы мы рассматривать не будем, так как говорим о мозговых волнах в звуке. Проблемка — ухо мозговые волны не слышит, но надо. На помощь приходят бинауральные колебания (binaural beats). Почему бинауральные? Потому, что технология рассчитана на работу ТОЛЬКО со стереоматериалом, предназначенным для ДВУХ ушей. Напомню, что слово “aural” означает «ушной, слуховой, акустический», и т.д.
Суть рассматриваемой технологии проще пояснить на примере. Пусть нам нужно стимулировать мозг 10-ю герцами. Для этого... Подаем в левое ухо равномерный тон в 500 герц, а в правое — на 510 Гц. Их «микширование» происходит уже в мозге. При этом 510 Гц — 500 Гц дают нам как раз 10 Гц. Эта разница, воспринимаемая мозгом, именуется бинауральным колебанием.
В нашем примере с тем же результатом можно применять такие пары значений, как, скажем, 400 и 410, 800 и 810, но не выше 1000. Умение чередовать и применять различного типа волны — целое искусство, и материала по этому поводу хватит на толстую книгу. Дэйвид Джонсон, больший специалист по этому вопросу, чем я, советует следующее:
Мгновенная релаксация и снятие стресса — используйте частоты между 5 и 10 Гц для различных уровней релаксации.
Замена сна — тридцатиминутная сессия на 5-ти герцах заменяет 2—3 часа сна, позволяя просыпаться рано утром более бодрым. Попробуйте слушать по полчаса перед засыпанием и утренним подъемом.
Борьба с бессонницей — волны между 4 и 6 герц в первые 10 минут, затем переход к частотам ниже 3,5 Гц (на 20-30 минут), постепенно спускаясь к 2,5 Гц перед окончанием.
Поднятие тонуса — тета-волны (4-7 Гц) по 45 минут в день.
Отчетливые зрительные образы (напр., для художников) — немного волн на 6 герцах, затем повышение к 10.
Облегчение мигрени и головной боли — экспериментируйте с комбинациями альфа и тета.
Снижение симптомов депрессии — и вновь, комбинации альфа и тета, преимущественно тета.
Ускоренное обучение — от 7 до 9 герц, пока играет обучающая запись. Это повышает усвоение материала. Также в процессе обучения (напр., путем чтения) делать каждый полчаса 10-тиминутные перерывы, в коих прослушивать альфа-волны (10 герц).
Программирование подсознания — используйте от 5 до 7 герц пока играет запись (Джонсон имеет в виду нечто вроде полуторачасовых повторений «я спокоен, я расслаблен»), либо сделайте свою собственную запись и добавьте в нее волны, смикшировав их с записью и отрегулировав громкость.
Улучшение интуиции — в этой области помогут тета-волны, 4-7 герц.
Достижение высоких состояний сознания — и вновь тета, с минимум получасовым сеансом в день. Ждите результатов где-то через месяц.
Литературы по синхронизации мозговых волн предостаточно (я имею в виду англоязычную), однако для ее изучения необходимо более-менее разбираться в науке и медицине (а также иностранных терминах). С шестидесятых годов прошлого века вышли сотни, если не тысячи солидных книг и научных статей, посвященных этому вопросу.
У нас, в ex-USSR, к сожалению, ситуация обстоит несколько иначе. Не столь давно мои слова о мозговых волнах в одной, казалось бы, образованной литературной тусовке были попросту осмеяны, как, впрочем, и нейролингвистическое программирование. Еще бы! Такие зарубежные издания, как Scientific American, Alchohol, Physiological Review, Brain, British Journal of Psychology, Journal of Personality and Social Psychology, Electroencephalography and Clinical Neurophysiology регулярно освещают проблему, седые профессоры пишут толстые книги, а наша культурная «элита» поднимает чужие знания на смех...
Между тем синхронизация мозговых волн применяются на Западе для лечения депрессий, мигреней и головных болей, аутизма, рассеянности внимания, алкогольной и наркотической зависимостей. Продаются специальные медитативные устройства, основанные на мозговых волнах (диапазон цен таких вещей от 200 до 500 долларов и выше), а также специальные очки к ним — очки с мигающими изнутри «лампочками». Впрочем, недавно мне стало известно, что подобные чудо-агрегаты начинают воплощаться в жизнь и российскими изобретателями, например Евгением Калягиным
Следует помнить, что стимуляция мозговыми волнами
КАТЕГОРИЧЕСКИ ПРОТИВОПОКАЗАНА:
Людям, страдающим эпилепсией, а также аритмией и другими сердечными заболеваниями. Стимуляция человека из первой категории бета-волнами (конкретнее — 25 герц) определенной интенсивности в течение 30 минут вызывает припадок.
Людям, имеющим сердечные стимуляторы.
Принимающим психоактивные наркотические вещества и стимуляторы. К пьяным это тоже относится.
Больным с тяжелыми расстройствами психики.
Если вы используете синхронизацию с мозговыми волнами в своем материале, то долг чести — предупредить об этом слушателей, например, на обложке диска или в комментарии к файлу. Кроме того, не забудьте упомянуть, что не несете никакой ответственности за возможные последствия прослушивания вашего материала.
Для генерирования мозговых волн существует множество как «железных», так и программных средств. Обыкновенному пользователю, не знакомому с цифровой обработкой звука, подойдет продукт Brainwave Generator от Noromaa Solutions. На сайте доступна shareware-версия, впрочем, вполне функциональная. Это удобный синхронизатор мозговых волн, который генерирует не только звуковые, но и визуальные эффекты, выводимые на монитор или внешние стробоскопические очки. Осторожно — ходят слухи, что Курт Кобэйн оттого и застрелился, что подолгу смотрел на психоделическую «мигалку», находясь «под кайфом». Brainwave Generator оснащен множеством хорошо описанных пресетов — на обычном английском рассказывается, как и для чего этот пресет сделан. Запускаете продукт вместо MP3-плеера, и синхронизируетесь...
Звукорежиссеры найдут полезным средство Brainwave Synchronizer, доступный из меню Transform в редакторе Cool Edit Pro 1.x (далее CEP). Окно этого эффекта содержит в себе слайдеры Low/High, которыми вы задаете собственно частоту волн, а слайдер Intensity влияет на их интенсивность — например, для бета-волн лучше устанавливать значения до 25, а для альфа — выше 60. Сверху расположен график частот, где ось x представляет собой время, а y — частоту.
Экспериментируйте, если есть желание. К слову, есть еще один способ создания «мозговых волн» — зная механизм бинауральных колебаний, мы можем генерировать волны с помощью простого синтеза частот. В том же CEP есть мощный тоновый генератор (Generate > Tones). Однако гораздо удобнее подготовить петлю с «мозговыми волнами», используя Brainwave Synchronizer. Вначале вам понадобится несущая (“carrier”), то есть материал, который вы промодулируете волнами. Это может быть обычный шум, например, розовый, или какой-нибудь тон. Эффект действует лучше всего, когда оба канала одинаковы — например, если в качестве несущей вы используете шум морских волн, записанный в стерео, то придется конвертировать его в моно, а затем снова в стерео, чтобы «выровнять» каналы.
Чтобы все работало, повторюсь, слушать нужно в наушниках, а также выключив различные улучшающие звук средства звуковой карты (например, в AWE — 3D Stereo Enhancement).