stringtranslate.com

Временная оболочка и тонкая структура

Временная огибающая (ENV) и временная тонкая структура (TFS) — это изменения амплитуды и частоты звука , воспринимаемые людьми с течением времени. Эти временные изменения отвечают за несколько аспектов слухового восприятия, включая громкость , высоту тона и восприятие тембра , а также пространственный слух .

Сложные звуки, такие как речь или музыка, разлагаются периферической слуховой системой человека на узкие частотные диапазоны. Полученные узкополосные сигналы передают информацию в различных временных масштабах от менее одной миллисекунды до сотен миллисекунд. Дихотомия между медленными сигналами «временной огибающей» и более быстрыми сигналами «временной тонкой структуры» была предложена для изучения нескольких аспектов слухового восприятия (например, громкости , высоты тона и восприятия тембра , анализа слуховой сцены , локализации звука ) в двух различных временных масштабах в каждой частотной полосе. [1] [2] [3] [4] [5] [6] [7] За последние десятилетия множество психофизических, электрофизиологических и вычислительных исследований, основанных на этой дихотомии огибающей/тонкой структуры, изучили роль этих временных сигналов в звуковой идентификации и коммуникации, то, как эти временные сигналы обрабатываются периферической и центральной слуховой системой, а также влияние старения и повреждения улитки на временную слуховую обработку. Хотя дихотомия огибающей/тонкой структуры является предметом дискуссий и остаются вопросы относительно того, как на самом деле кодируются временные сигналы тонкой структуры в слуховой системе, эти исследования привели к появлению ряда приложений в различных областях, включая обработку речи и звука, клиническую аудиологию и реабилитацию сенсоневральной потери слуха с помощью слуховых аппаратов или кохлеарных имплантатов .

Определение

Выходы моделируемых кохлеарных фильтров, центрированных на 364, 1498 и 4803 Гц (снизу вверх) в ответ на сегмент речевого сигнала, звук «en» в «sense». Эти выходные сигналы фильтров похожи на формы волн, которые можно было бы наблюдать в местах на базилярной мембране, настроенных на 364, 1498 и 4803 Гц. Для каждой центральной частоты сигнал можно рассматривать как медленно меняющуюся огибающую (E BM ), наложенную на более быструю временную тонкую структуру (TFS BM ). Огибающая для каждого полосового сигнала показана толстой линией.

Понятия временной оболочки и временной тонкой структуры могут иметь разные значения во многих исследованиях. Важно провести различие между физическим (т. е. акустическим) и биологическим (или перцептивным) описанием этих сигналов ENV и TFS.

Схематическое изображение трех уровней сигналов временной огибающей (ENV) и временной тонкой структуры (TFS), передаваемых сигналом с ограниченной полосой пропускания, обрабатываемым периферической слуховой системой.

Любой звук, частотные компоненты которого охватывают узкий диапазон (называемый узкополосным сигналом), можно рассматривать как огибающую (ENV p , где p обозначает физический сигнал), наложенную на более быстро колеблющийся носитель, временную тонкую структуру (TFS p ). [8]

Многие звуки в повседневной жизни, включая речь и музыку, являются широкополосными; частотные компоненты распространяются в широком диапазоне, и не существует четко определенного способа представления сигнала в терминах ENV p и TFS p . Однако в нормально функционирующей улитке сложные широкополосные сигналы разлагаются путем фильтрации на базилярной мембране (БМ) внутри улитки на серию узкополосных сигналов. [9] Таким образом, форму волны в каждом месте на БМ можно рассматривать как огибающую (ENV BM ), наложенную на более быстро колеблющийся носитель, временную тонкую структуру (TFS BM ). [10] ENV BM и TFS BM зависят от места вдоль БМ. На апикальном конце, который настроен на низкие (звуковые) частоты, ENV BM и TFS BM изменяются относительно медленно со временем, в то время как на базальном конце, который настроен на высокие частоты, как ENV BM , так и TFS BM изменяются быстрее со временем. [10]

И ENV BM , и TFS BM представлены во временных моделях потенциалов действия в слуховом нерве [11], они обозначены как ENV n и TFS n . TFS n представлен наиболее заметно в нейронах, настроенных на низкие частоты, в то время как ENV n представлен наиболее заметно в нейронах, настроенных на высокие (звуковые) частоты. [11] [12] Для широкополосного сигнала невозможно манипулировать TFS p, не влияя на ENV BM и ENV n , и невозможно манипулировать ENV p, не влияя на TFS BM и TFS n . [13] [14]

Обработка временной оболочки (ENV)

Нейрофизиологические аспекты

Примеры синусоидально-амплитудно- и частотно-модулированных сигналов

Нейронное представление огибающей стимула, ENV n , обычно изучалось с использованием хорошо контролируемых модуляций ENV p , то есть синусоидально амплитудно-модулированных (AM) звуков. Кохлеарная фильтрация ограничивает диапазон скоростей AM, закодированных в отдельных волокнах слухового нерва . В слуховом нерве сила нейронного представления AM уменьшается с увеличением скорости модуляции. На уровне ядра улитки несколько типов клеток показывают усиление информации ENV n . Мультиполярные клетки могут показывать настройку полосы пропускания на тоны AM с частотами AM от 50 до 1000 Гц. [15] [16] Некоторые из этих клеток показывают превосходную реакцию на ENV n и предоставляют ингибирующие боковые полосы входов другим клеткам в ядре улитки, давая физиологический коррелят высвобождения маскировки комодуляции, феномена, при котором обнаружение сигнала в маскере улучшается, когда маскер имеет коррелированные колебания огибающей по частоте (см. раздел ниже). [17] [18]

Ответы на сигналы временной огибающей речи или других сложных звуков сохраняются вверх по слуховому пути, в конечном итоге в различных областях слуховой коры у многих животных. В первичной слуховой коре ответы могут кодировать скорости AM путем фазовой синхронизации примерно до 20–30 Гц, [19] [20] [21] [22], в то время как более высокие скорости вызывают устойчивые и часто настроенные ответы. [23] [24] Топографическое представление скорости AM было продемонстрировано в первичной слуховой коре бодрствующих макак. [25] Это представление приблизительно перпендикулярно оси тонотопического градиента, что согласуется с ортогональной организацией спектральных и временных характеристик в слуховой коре. Объединение этих временных ответов со спектральной селективностью нейронов A1 приводит к появлению спектрально -временных рецептивных полей , которые часто хорошо улавливают корковые ответы на сложные модулированные звуки. [26] [27] Во вторичных слуховых корковых полях ответы становятся временно более вялыми и спектрально более широкими, но все еще способны синхронизироваться по фазе с основными особенностями речи и музыкальных звуков. [28] [29] [30] [31] Настройка на частоты AM ниже примерно 64 Гц также обнаружена в слуховой коре человека [32] [33] [34] [35] , как показали методы визуализации мозга ( фМРТ ) и записи коры у пациентов с эпилепсией ( электрокортикография ). Это согласуется с нейропсихологическими исследованиями пациентов с повреждениями мозга [36] и с представлением о том, что центральная слуховая система выполняет некоторую форму спектрального разложения ENV p входящих звуков. Было показано, что диапазоны, в которых корковые ответы хорошо кодируют сигналы временной огибающей речи, предсказывают способность человека понимать речь. В верхней височной извилине человека (ВВИЗ) была обнаружена передне-задняя пространственная организация настройки спектрально-временной модуляции в ответ на речевые звуки, при этом задняя ВВИЗ настроена на быстро меняющиеся во времени речевые звуки с низкой спектральной модуляцией, а передняя ВВИЗ настроена на медленно меняющиеся во времени речевые звуки с высокой спектральной модуляцией. [37]

Один неожиданный аспект фазовой синхронизации в слуховой коре наблюдался в ответах, вызванных сложными акустическими стимулами со спектрограммами, которые демонстрируют относительно медленные огибающие (< 20 Гц), но которые переносятся быстрыми модуляциями, достигающими сотен Герц. Речь и музыка, а также различные модулированные шумовые стимулы имеют такую ​​временную структуру. [38] Для этих стимулов корковые ответы фазово синхронизированы как с огибающей, так и с тонкой структурой, вызванной взаимодействиями между неразрешенными гармониками звука, таким образом отражая высоту звука и превышая типичные нижние пределы корковой фазовой синхронизации огибающими в несколько десятков Герц. Эта парадоксальная связь [38] [39] между медленной и быстрой корковой фазовой синхронизацией с несущей «тонкой структурой» была продемонстрирована как в слуховой [38], так и в зрительной [40] коре. Также было показано, что он в полной мере проявляется в измерениях спектрально-временных рецептивных полей первичной слуховой коры, давая им неожиданно высокую временную точность и избирательность, граничащую с разрешением 5-10 мс. [38] [40] Основные причины этого явления были приписаны нескольким возможным источникам, включая нелинейную синаптическую депрессию и облегчение и/или корковую сеть таламического возбуждения и коркового торможения. [38] [41] [42] [43] Существует много функционально значимых и перцептивно значимых причин сосуществования этих двух дополнительных динамических режимов реагирования. Они включают в себя способность точно кодировать начала и другие быстрые «события» в ENV p сложных акустических и других сенсорных сигналов, особенности, которые имеют решающее значение для восприятия согласных (речи) и ударных звуков (музыки), а также текстуры сложных звуков. [38] [44]

Психоакустические аспекты

Восприятие ENV p зависит от того, какие частоты AM содержатся в сигнале. Низкие частоты AM, в диапазоне 1–8 Гц, воспринимаются как изменения воспринимаемой интенсивности, то есть колебания громкости (восприятие, которое также может быть вызвано частотной модуляцией, FM); при более высоких частотах AM воспринимается как шероховатость, причем наибольшее ощущение шероховатости возникает около 70 Гц; [45] при еще более высоких частотах AM может вызывать слабое восприятие высоты тона, соответствующее частоте модуляции. [46] Ливни, потрескивание огня, стрекотание сверчков или скачущие лошади создают «звуковые текстуры» — коллективный результат многих подобных акустических событий, — восприятие которых опосредовано статистикой ENV n . [47] [48]

Порог слухового обнаружения для AM как функция скорости AM, называемый функцией передачи временной модуляции (TMTF), [49] является наилучшим для скоростей AM в диапазоне от 4 до 150 Гц и ухудшается за пределами этого диапазона [49] [50] [51] Частота среза TMTF дает оценку временной остроты (временного разрешения) для слуховой системы. Эта частота среза соответствует постоянной времени около 1–3 мс для слуховой системы нормально слышащих людей.

Коррелированные колебания огибающей по частоте в маскере могут помочь обнаружить чистый тональный сигнал, эффект, известный как освобождение комодуляционной маскировки. [18]

AM, применяемая к данному носителю, может перцептивно мешать обнаружению целевого AM, наложенного на тот же носитель, эффект, называемый маскировкой модуляции . [52] [53] Шаблоны модуляции-маскировки настраиваются (большая маскировка происходит для маскировки и целевых AM, близких по частоте модуляции), что предполагает, что слуховая система человека оснащена частотно-селективными каналами для AM. Более того, AM, применяемая к спектрально удаленным носителям, может перцептивно мешать обнаружению AM на целевом звуке, эффект, называемый помехой обнаружения модуляции . [54] Понятие каналов модуляции также подтверждается демонстрацией эффектов селективной адаптации в области модуляции. [55] [56] [57] Эти исследования показывают, что пороги обнаружения AM выборочно повышаются выше порогов до воздействия, когда несущая частота и скорость AM адаптера аналогичны таковым у тестового тона.

Слушатели-люди чувствительны к относительно медленным сигналам AM "второго порядка", которые соответствуют колебаниям силы AM. Эти сигналы возникают из-за взаимодействия различных скоростей модуляции, ранее описанных как "биения" в области огибающей частоты. Восприятие AM второго порядка интерпретировалось как результат нелинейных механизмов в слуховом пути, которые производят слышимый компонент искажения на частоте биений огибающей во внутреннем спектре модуляции звуков. [58] [59] [60]

Интерауральные временные различия в огибающей обеспечивают бинауральные сигналы даже на высоких частотах, где TFS n использовать невозможно. [61]

Модели обычной обработки конвертов

Схема общей части модели восприятия огибающей Торстена Дау и EPSM.

Самая простая компьютерная модель обработки ENV — это модель интегратора с утечкой . [62] [49] Эта модель извлекает временную огибающую звука (ENV p ) с помощью полосовой фильтрации, полуволнового выпрямления (за которым может следовать быстродействующая амплитудная компрессия ) и низкочастотной фильтрации с частотой среза между примерно 60 и 150 Гц. Интегратор с утечкой часто используется со статистикой принятия решения, основанной либо на результирующей мощности огибающей, либо на отношении максимума/минимума, либо на коэффициенте амплитуды. Эта модель учитывает потерю слуховой чувствительности для скоростей AM выше, чем примерно 60–150 Гц для широкополосных шумовых носителей. [49] Основываясь на концепции частотной селективности для AM, [53] модель восприятия Торстена Дау [63] включает в себя широко настроенные полосовые фильтры модуляции (со значением Q около 1) для учета данных из широкого спектра психоакустических задач и, в частности, обнаружения AM для шумовых носителей с различной полосой пропускания, принимая во внимание их внутренние колебания огибающей. Эта модель была расширена для учета высвобождения маскировки комодуляции (см. разделы выше). [64] Формы фильтров модуляции были оценены [65], и «модель спектра мощности огибающей» (EPSM), основанная на этих фильтрах, может учитывать шаблоны маскировки AM и различение глубины AM. [66] EPSM была расширена для прогнозирования разборчивости речи [67] и для учета данных из широкого спектра психоакустических задач. [68] Также была разработана физиологически обоснованная модель обработки, имитирующая реакции ствола мозга, для учета обнаружения AM и шаблонов маскировки AM. [69]

Обработка временной тонкой структуры (TFS)

Нейрофизиологические аспекты

Фазовая синхронизация, зарегистрированная в нейроне в кохлеарном ядре в ответ на синусоидальный акустический стимул на наилучшей частоте клетки (в данном случае 240 Гц). Стимул был примерно на 20 дБ выше наилучшей частоты нейрона. Нейронные выходы (потенциалы действия) показаны на верхнем следе, а форма волны стимула — на нижнем следе.

Нейронное представление временной тонкой структуры, TFS n , изучалось с использованием стимулов с хорошо контролируемым TFS p : чистых тонов, гармонических сложных тонов и частотно-модулированных (ЧМ) тонов.

Слуховые нервные волокна способны представлять низкочастотные звуки посредством своих фазово-синхронизированных разрядов (т. е. информации TFS n ). Верхний предел частоты для фазовой синхронизации зависит от вида. Он составляет около 5 кГц у кошки, 9 кГц у сипухи и всего 4 кГц у морской свинки. Мы не знаем верхнего предела фазовой синхронизации у людей, но текущие косвенные оценки предполагают, что он составляет около 4–5 кГц. [70] Фазовая синхронизация является прямым следствием процесса трансдукции с увеличением вероятности открытия канала трансдукции, происходящего при растяжении стереоцилий, и уменьшением открытия канала, происходящим при толкании в противоположном направлении. Это привело некоторых к предположению, что фазовая синхронизация является эпифеноменом. Верхний предел, по-видимому, определяется каскадом фильтров нижних частот на уровне внутренней волосковой клетки и синапса слухового нерва . [71] [72]

Информация TFS n в слуховом нерве может использоваться для кодирования (аудио)частоты низкочастотных звуков, включая отдельные тоны и более сложные стимулы, такие как частотно-модулированные тоны или устойчивые гласные (см. роль и применение в речи и музыке).

Слуховая система идет на некоторую длину, чтобы сохранить эту информацию TFS n с наличием гигантских синапсов (концевых луковиц Хельда) в вентральном кохлеарном ядре . Эти синапсы контактируют с кустистыми клетками (сферическими и шаровидными) и точно передают (или усиливают) временную информацию, присутствующую в слуховых нервных волокнах, в более высокие структуры в стволе мозга . [73] Кустистые клетки проецируются на медиальную верхнюю оливу , а шаровидные клетки проецируются на медиальное ядро ​​трапециевидного тела (MNTB). MNTB также характеризуется гигантскими синапсами (чашечками Хельда) и обеспечивает точно рассчитанное по времени торможение латеральной верхней оливы . Медиальная и латеральная верхняя олива и MNTB участвуют в кодировании межушных различий во времени и интенсивности. Существует общее мнение, что временная информация имеет решающее значение в локализации звука, но все еще остается спорным вопрос о том, используется ли та же самая временная информация для кодирования частоты сложных звуков.

Остается несколько проблем с идеей о том, что TFS n важен для представления частотных компонентов сложных звуков. Первая проблема заключается в том, что временная информация ухудшается по мере прохождения через последовательные этапы слухового пути (предположительно из-за низкочастотной дендритной фильтрации). Следовательно, вторая проблема заключается в том, что временная информация должна быть извлечена на раннем этапе слухового пути. В настоящее время такой этап не выявлен, хотя существуют теории о том, как временная информация может быть преобразована в информацию о скорости (см. раздел Модели нормальной обработки: Ограничения).

Психоакустические аспекты

Часто предполагается, что многие перцептивные способности зависят от способности монауральной и бинауральной слуховой системы кодировать и использовать сигналы TFS n, вызванные компонентами в звуках с частотами ниже примерно 1–4 кГц. Эти способности включают различение частоты, [74] [4] [75] [76] различение основной частоты гармонических звуков, [75] [4] [76] обнаружение FM на частотах ниже 5 Гц, [77] распознавание мелодии для последовательностей чистых тонов и сложных тонов, [74] [4] латерализацию и локализацию чистых тонов и сложных тонов, [78] и сегрегацию одновременных гармонических звуков (таких как звуки речи). [79] Похоже, что сигналы TFS n требуют правильного тонотопического ( местного ) представления для оптимальной обработки слуховой системой. [80] Более того, восприятие музыкальной высоты звука было продемонстрировано для сложных тонов со всеми гармониками выше 6 кГц, что показывает, что оно не полностью зависит от нейронной фазовой синхронизации с сигналами TFS BM (т.е. TFS n ). [81]

Что касается обнаружения FM, то современная точка зрения предполагает, что в нормальной слуховой системе FM кодируется с помощью сигналов TFS n , когда частота FM низкая (<5 Гц) и когда несущая частота ниже примерно 4 кГц, [77] [82] [83] [84] и с помощью сигналов ENV n , когда FM быстрая или когда несущая частота выше 4 кГц. [77] [85] [86] [87] [84] Это подтверждается записями отдельных блоков в нижнем стволе мозга. [73] Согласно этой точке зрения, сигналы TFS n не используются для обнаружения FM с частотой выше примерно 10 Гц, потому что механизм, декодирующий информацию TFS n , «медлителен» и не может отслеживать быстрые изменения частоты. [77] Несколько исследований показали, что слуховая чувствительность к медленной FM на низкой несущей частоте связана с распознаванием речи как у людей с нормальным слухом, так и у людей с нарушениями слуха, когда восприятие речи ограничено акустическими ухудшениями (например, фильтрацией) или сопутствующими речевыми звуками. [88] [89] [90] [91] [92] Это говорит о том, что надежная разборчивость речи определяется точной обработкой сигналов TFS n .

Модели нормальной обработки: ограничения

Разделение звука на ENV p  и TFS p , по-видимому, частично вдохновлено тем, как синтезируются звуки, и наличием удобного способа разделения существующего звука на ENV и TFS, а именно преобразованием Гильберта . Существует риск, что этот взгляд на слуховую обработку [93] будет доминировать под влиянием этих физических/технических концепций, подобно тому, как кохлеарное частотно-местное отображение долгое время концептуализировалось в терминах преобразования Фурье . Физиологически нет никаких указаний на разделение ENV и TFS в слуховой системе на стадиях вплоть до кохлеарного ядра . Только на этой стадии становится очевидным, что параллельные пути, потенциально усиливающие информацию ENV n или TFS n (или что-то похожее на нее), могут быть реализованы через временные характеристики ответа различных типов клеток кохлеарного ядра. [73] Поэтому может быть полезно лучше моделировать типы клеток кохлеарного ядра, чтобы понять истинные концепции параллельной обработки, созданные на уровне кохлеарного ядра. Эти концепции могут быть связаны с разделением ENV и TFS, но вряд ли реализуются подобно преобразованию Гильберта.

Вычислительная модель периферической слуховой системы [94] [95] может использоваться для моделирования реакций слуховых нервных волокон на сложные звуки, такие как речь, и количественной оценки передачи (т. е. внутреннего представления) сигналов ENV n и TFS n . В двух имитационных исследованиях [96] [97] информация о средней частоте и синхронизации импульсов была количественно оценена на выходе такой модели для характеристики, соответственно, краткосрочной частоты нейронной активации (ENV n ) и уровня синхронизации из-за фазовой синхронизации (TFS n ) в ответ на звуки речи, ухудшенные вокодерами. [98] [99] Наилучшие модельные прогнозы разборчивости вокодированной речи были получены при включении сигналов ENV n и TFS n , что свидетельствует о том, что сигналы TFS n важны для разборчивости, когда речевые сигналы ENV p ухудшены.

На более фундаментальном уровне аналогичное вычислительное моделирование использовалось для демонстрации того, что функциональная зависимость едва заметных частотных различий человека от частоты чистого тона не учитывалась, если не была включена временная информация (особенно это касается средних и высоких частот, даже выше номинального среза в физиологической фазовой синхронизации). [100] [101] Однако недостаток большинства моделей TFS заключается в том, что оптимальная производительность модели с временной информацией обычно переоценивает производительность человека.

Альтернативная точка зрения заключается в том, что информация TFS n на уровне слухового нерва преобразуется в информацию о скорости и месте (ENV n ) на более поздней стадии слуховой системы (например, в нижнем отделе ствола мозга). Несколько исследований моделирования предположили, что нейронные механизмы декодирования TFS n основаны на корреляции выходов соседних мест. [102] [103] [104] [105] [106]

Роль в восприятии речи и музыки

Роль временной оболочки в восприятии речи и музыки

Спектры амплитудной модуляции (слева) и спектры частотной модуляции (справа), рассчитанные на основе корпуса английских или французских предложений. [107]

ENV p играет важную роль во многих аспектах слухового восприятия, включая восприятие речи и музыки. [2] [7] [108] [109] Распознавание речи возможно с использованием сигналов, связанных с ENV p , даже в ситуациях, когда исходная спектральная информация и TFS p сильно деградируют. [110] Действительно, когда спектрально локальный TFS p из одного предложения объединяется с ENV p из второго предложения, слышны только слова второго предложения. [111] Наиболее важными для речи являются частоты ENV p ниже примерно 16 Гц, что соответствует колебаниям со скоростью слогов. [112] [107] [113] С другой стороны, контур основной частотывысоты тона ») звуков речи в первую очередь передается с помощью сигналов TFS p , [107] хотя некоторая информация о контуре может быть воспринята с помощью быстрых колебаний огибающей, соответствующих основной частоте. [2] Для музыки медленные скорости ENV p передают информацию о ритме и темпе, тогда как более быстрые скорости передают начальные и конечные свойства звука (атака и затухание соответственно), которые важны для восприятия тембра. [114]

Роль TFS в восприятии речи и музыки

Считается , что способность точно обрабатывать информацию TFS p играет роль в нашем восприятии высоты тона (т. е. воспринимаемой высоты звуков), важном ощущении для восприятия музыки, а также в нашей способности понимать речь, особенно в присутствии фонового шума. [4]

Роль TFS в восприятии высоты тона

Хотя механизмы извлечения высоты тона в слуховой системе все еще являются предметом дискуссий, [76] [115] информация TFS n может быть использована для извлечения высоты тона низкочастотных чистых тонов [75] и оценки отдельных частот низкопорядковых (примерно 1-8-я) гармоник сложного звука, [116] частот, из которых может быть извлечена основная частота звука в соответствии, например, с моделями сопоставления шаблонов восприятия высоты тона. [117] Роль информации TFS n в восприятии высоты тона сложных звуков, содержащих промежуточные гармоники (примерно 7-16-я), также была предложена [118] и может быть объяснена временными или спектрально-временными [119] моделями восприятия высоты тона. Ухудшенные сигналы TFS n , передаваемые устройствами кохлеарной имплантации, также могут быть частично ответственны за нарушение восприятия музыки реципиентами кохлеарной имплантации. [120]

Роль сигналов TFS в восприятии речи

Считается, что сигналы TFS p важны для идентификации говорящих и для идентификации тона в тональных языках . [121] Кроме того, несколько исследований вокодеров предположили, что сигналы TFS p способствуют разборчивости речи в тишине и шуме. [98] Хотя трудно отделить сигналы TFS p от сигналов ENV p , [109] [122] есть данные из исследований слушателей с нарушениями слуха, что восприятие речи в присутствии фонового шума может быть частично объяснено способностью точно обрабатывать TFS p , [92] [99] хотя способность «слушать в провалах» флуктуирующих маскировщиков, по-видимому, не зависит от периодических сигналов TFS p . [123]

Роль в восприятии окружающего звука

Звуки окружающей среды можно в широком смысле определить как неречевые и немузыкальные звуки в среде слушателя, которые могут передавать значимую информацию об окружающих объектах и ​​событиях. [124] Звуки окружающей среды весьма неоднородны с точки зрения их акустических характеристик и типов источников и могут включать в себя человеческие и животные вокализации, водные и погодные явления, механические и электронные сигнальные звуки. Учитывая большое разнообразие источников звука, которые порождают звуки окружающей среды, как ENV p , так и TFS p играют важную роль в их восприятии. Однако относительный вклад ENV p и TFS p может значительно различаться для конкретных звуков окружающей среды. Это отражено в разнообразии акустических мер, которые коррелируют с различными перцептивными характеристиками объектов и событий. [125] [126] [127]

Ранние исследования подчеркнули важность временной структуры на основе огибающей в восприятии событий окружающей среды. Например, Уоррен и Вербрюгге продемонстрировали, что сконструированные звуки стеклянной бутылки, упавшей на пол, воспринимались как отскакивающие, когда высокоэнергетические области в четырех различных частотных диапазонах были временно выровнены, создавая амплитудные пики в огибающей. [128] Напротив, когда та же самая спектральная энергия была распределена случайным образом по диапазонам, звуки были слышны как разрывы. Более поздние исследования с использованием моделирования вокодером обработки кохлеарного импланта продемонстрировали, что многие звуки с временной структурой могут восприниматься с небольшой исходной спектральной информацией, основанной в первую очередь на временных подсказках. [126] [127] Такие звуки, как шаги, скачки лошади, полет вертолета, игра в пинг-понг, хлопки в ладоши, печатание были идентифицированы с высокой точностью 70% или более с одним каналом широкополосного шума с модуляцией огибающей или только с двумя частотными каналами. В этих исследованиях акустические измерения на основе огибающей, такие как количество всплесков и пиков в огибающей, прогнозировали способности слушателей идентифицировать звуки, основанные в первую очередь на сигналах ENV p . С другой стороны, идентификация кратких звуков окружающей среды без сильной временной закономерности в ENV p может потребовать гораздо большего количества частотных каналов для восприятия. Такие звуки, как автомобильный гудок или свисток поезда, плохо идентифицировались даже при наличии 32 частотных каналов. [126] Слушатели с кохлеарными имплантатами, которые передают информацию о огибающей для определенных частотных диапазонов, но не передают TFS p , имеют значительно сниженные способности к идентификации распространенных звуков окружающей среды. [129] [130] [131]

Кроме того, отдельные звуки окружающей среды обычно слышны в контексте более крупных слуховых сцен, где звуки из нескольких источников могут перекрываться по времени и частоте. При прослушивании в слуховой сцене точная идентификация отдельных звуков окружающей среды зависит от способности отделять их от других источников звука или слуховых потоков в слуховой сцене, что подразумевает дальнейшую опору на сигналы ENV p и TFS p (см. Роль в анализе слуховой сцены).

Роль в анализе слуховой сцены

Анализ слуховой сцены относится к способности воспринимать отдельно звуки, исходящие из разных источников. Любое акустическое различие может потенциально привести к слуховой сегрегации, [132] и поэтому любые сигналы, основанные либо на ENV p , либо на TFS p, вероятно, помогут в разделении конкурирующих источников звука. [133] Такие сигналы включают такие восприятия, как высота тона. [134] [135] [136] [137] Бинауральные сигналы TFS p , создающие интерауральные временные различия , не всегда приводили к четкой сегрегации источника, особенно при одновременном предъявлении источников, хотя сообщалось об успешной сегрегации последовательных звуков, таких как шум или речь. [138]

Влияние возраста и потери слуха на обработку временной огибающей

Аспекты развития

В младенчестве поведенческие пороги обнаружения AM [139] и пороги прямой или обратной маскировки [139] [140] [141], наблюдаемые у 3-месячных детей, аналогичны наблюдаемым у взрослых. Электрофизиологические исследования, проведенные у 1-месячных младенцев с использованием чистых тонов AM 2000 Гц, указывают на некоторую незрелость в ответе огибающей (EFR). Хотя спящие младенцы и седированные взрослые показывают одинаковое влияние скорости модуляции на EFR, оценки младенцев в целом были хуже, чем у взрослых. [142] [143] Это согласуется с поведенческими исследованиями, проведенными с детьми школьного возраста, которые показали различия в порогах обнаружения AM по сравнению со взрослыми. Дети систематически показывают худшие пороги обнаружения AM, чем взрослые, до 10–11 лет. Однако форма TMTF (порогового значения) похожа на таковую у взрослых для детей младше 5 лет. [144] [145] Сенсорные и несенсорные факторы для этого длительного созревания все еще обсуждаются, [146] но результаты, как правило, больше зависят от задачи или от сложности звука для младенцев и детей, чем для взрослых. [147] Что касается развития обработки речи ENV p , исследования вокодера показывают, что младенцы в возрасте от 3 месяцев способны различать изменение согласных, когда сохраняется более быстрая информация ENV p слогов (< 256 Гц), но в меньшей степени, когда доступна только самая медленная информация ENV p (< 8 Гц). [148] Дети старше 5 лет демонстрируют схожие способности, что и взрослые, различать изменения согласных на основе сигналов ENV p (< 64 Гц). [149]

Нейрофизиологические аспекты

Влияние потери слуха и возраста на нейронное кодирование , как правило, считается меньшим для медленно меняющихся огибающих ответов (т. е. ENV n ), чем для быстро меняющейся временной тонкой структуры (т. е. TFS n ). [150] [151] Улучшенное кодирование ENV n после потери слуха, вызванной шумом, наблюдалось в периферических слуховых ответах от отдельных нейронов [152] и в центральных вызванных ответах от слухового среднего мозга. [153] Улучшение кодирования ENV n узкополосных звуков происходит во всем диапазоне частот модуляции, кодируемых отдельными нейронами. [154] Для широкополосных звуков диапазон частот модуляции, кодируемых в нарушенных ответах, шире нормы (распространяется на более высокие частоты), как и ожидалось из-за сниженной селективности частоты, связанной с дисфункцией наружных волосковых клеток. [155] Улучшение, наблюдаемое в ответах нейронной оболочки, согласуется с улучшенным слуховым восприятием модуляций после повреждения улитки, которое, как обычно полагают, является результатом потери компрессии улитки, которая происходит при дисфункции наружных волосковых клеток из-за возраста или чрезмерного воздействия шума. [156]  Однако влияние дисфункции внутренних волосковых клеток (например, более поверхностный рост ответа при легком-умеренном повреждении и более крутой рост при тяжелом повреждении) может запутать эффекты дисфункции наружных волосковых клеток на общий рост ответа и, таким образом, кодирование ENV n . [152] [157] Таким образом, неудивительно, что относительные эффекты дисфункции наружных волосковых клеток и внутренних волосковых клеток были предсказаны с помощью моделирования для создания индивидуальных различий в разборчивости речи на основе силы кодирования огибающей речи по сравнению с шумом.

Психоакустические аспекты

Для синусоидальных носителей, которые не имеют собственных колебаний огибающей (ENV p ), TMTF примерно плоская для частот AM от 10 до 120 Гц, но увеличивается (т.е. порог ухудшается) для более высоких частот AM, [51] [158] при условии, что спектральные боковые полосы не слышны. Форма TMTF для синусоидальных носителей одинакова для молодых и пожилых людей с нормальными аудиометрическими порогами, но пожилые люди, как правило, имеют более высокие пороги обнаружения в целом, что предполагает более низкую «эффективность обнаружения» сигналов ENV n у пожилых людей. [159] [160] При условии, что носитель полностью слышен, способность обнаруживать AM обычно не подвергается неблагоприятному воздействию кохлеарной потери слуха и иногда может быть лучше, чем обычно, как для шумовых носителей [161] [162] , так и для синусоидальных носителей, [158] [163], возможно, потому, что набор громкости (необычно быстрый рост громкости с увеличением уровня звука) «увеличивает» воспринимаемое количество AM (т. е. сигналы ENV n ). В соответствии с этим, когда AM отчетливо слышен, звук с фиксированной глубиной AM, по-видимому, колеблется больше для ослабленного уха, чем для нормального уха. Однако способность обнаруживать изменения глубины AM может быть нарушена кохлеарной потерей слуха. [163] Речь, которая обрабатывается шумовым вокодером таким образом, что в основном информация об огибающей передается по нескольким спектральным каналам, также использовалась при исследовании обработки огибающей при нарушении слуха. Здесь люди с нарушениями слуха не могли использовать такую ​​информацию огибающей так же, как и люди с нормальным слухом, даже после того, как были приняты во внимание факторы слышимости. [164] Дополнительные эксперименты показывают, что возраст отрицательно влияет на бинауральную обработку ENV p, по крайней мере, на низких звуковых частотах. [165]

Модели нарушения обработки временной оболочки

Модель восприятия обработки ENV [63] , которая включает селективные (полосовые) фильтры AM, учитывает многие перцептивные последствия кохлеарной дисфункции, включая повышенную чувствительность к AM для синусоидальных и шумовых носителей, [166] [167] аномальную прямую маскировку (скорость восстановления от прямой маскировки, как правило, ниже, чем обычно у слабослышащих слушателей), [168] более сильные эффекты интерференции между AM и FM [82] и улучшенную временную интеграцию AM. [167] Модель Торстена Дау [63] была расширена для учета дискриминации сложных паттернов AM людьми с нарушениями слуха и эффектов систем шумоподавления. [169] Эффективность людей с нарушениями слуха была лучше всего отражена, когда модель объединила потерю периферической амплитудной компрессии в результате потери активного механизма в улитке [166] [167] [168] с увеличением внутреннего шума в области ENVn. [166] [167] [82] Феноменологические модели, имитирующие реакцию периферической слуховой системы, показали, что нарушение чувствительности AM у людей, страдающих хроническим шумом в ушах с клинически нормальными аудиограммами, можно предсказать по существенной потере слуховых нервных волокон с низкой спонтанной скоростью и некоторой потере слуховых нервных волокон с высокой спонтанной скоростью. [170]

Влияние возраста и потери слуха на обработку TFS

Аспекты развития

Очень немногие исследования систематически оценивали обработку TFS у младенцев и детей. Частотно-следящая реакция (FFR), которая, как считается, отражает фазово-синхронизированную нейронную активность, по-видимому, похожа на реакцию взрослых у месячных младенцев при использовании чистого тона (с центром на 500, 1000 или 2000 Гц), модулированного на частоте 80 Гц с глубиной модуляции 100%. [142]

Что касается поведенческих данных, шестимесячным младенцам требуются более крупные частотные переходы для обнаружения изменения FM в тоне 1 кГц по сравнению со взрослыми. [171] Однако 4-месячные младенцы способны различать два разных FM-размаха, [172] и они более чувствительны к FM-сигналам, разворачивающимся от 150 Гц до 550 Гц, чем на более низких частотах. [173] У детей школьного возраста эффективность обнаружения изменения FM улучшается в возрасте от 6 до 10 лет, а чувствительность к низкой частоте модуляции (2 Гц) остается низкой до 9 лет. [174]

Что касается звуков речи, то только одно исследование с использованием вокодера изучало способность детей школьного возраста полагаться на сигналы TFSp для обнаружения изменений согласных, показав те же способности у 5-летних детей, что и у взрослых. [149]

Нейрофизиологические аспекты

Психофизические исследования показали, что ухудшенная обработка TFS из-за возраста и потери слуха может лежать в основе некоторых надпороговых дефицитов, таких как восприятие речи; [10] однако, продолжаются споры о лежащих в основе нейронных коррелятах. [150] [151] Сила фазовой синхронизации с временной тонкой структурой сигналов (TFS n ) в условиях тихого прослушивания остается нормальной в периферических одиночных нейронных ответах после кохлеарной потери слуха. [152] Хотя эти данные предполагают, что фундаментальная способность волокон слухового нерва отслеживать быстрые колебания звука остается нетронутой после кохлеарной потери слуха, дефицит силы фазовой синхронизации действительно возникает в фоновом шуме. [175] Это открытие, которое согласуется с общим наблюдением, что слушатели с кохлеарной потерей слуха испытывают больше трудностей в шумных условиях, является результатом сниженной селективности кохлеарной частоты, связанной с дисфункцией наружных волосковых клеток. [156]  Хотя только ограниченные эффекты возраста и потери слуха наблюдались с точки зрения силы кодирования TFS n узкополосных звуков, более существенные дефициты наблюдались в качестве кодирования TFS n в ответ на широкополосные звуки, которые более актуальны для повседневного прослушивания. Резкая потеря тонотопичности может произойти после потери слуха, вызванной шумом, когда волокна слухового нерва, которые должны реагировать на средние частоты (например, 2–4 кГц), имеют доминирующие ответы TFS на более низкие частоты (например, 700 Гц). [176]  Примечательно, что потеря тонотопичности обычно происходит только для кодирования TFS n , но не для кодирования ENV n , что согласуется с более значительными перцептивными дефицитами при обработке TFS. [10] Эта тонотопическая деградация, вероятно, имеет важные последствия для восприятия речи и может объяснять ухудшенное кодирование гласных после потери слуха, вызванной шумом, при которой большая часть улитки реагирует только на первую форманту, устраняя нормальное тонотопическое представление второй и третьей формант.

Психоакустические аспекты

Несколько психофизических исследований показали, что пожилые люди с нормальным слухом и люди с нейросенсорной тугоухостью часто демонстрируют ухудшение производительности при выполнении слуховых задач, которые, как предполагается, зависят от способности монауральной и бинауральной слуховой системы кодировать и использовать сигналы TFS n , такие как: различение звуковой частоты, [76] [177] [178] различение основной частоты гармонических звуков, [76] [177] [178] [179] обнаружение FM на частотах ниже 5 Гц, [180] [181] [91] распознавание мелодий для последовательностей чистых тонов и сложных звуков, [182] латерализация и локализация чистых тонов и сложных тонов, [78] [183] ​​[165] и сегрегация одновременных гармонических звуков (таких как звуки речи). [79] Однако остается неясным, в какой степени дефициты, связанные с потерей слуха, отражают более слабую обработку TFS n или сниженную кохлеарную частотную селективность. [182]

Модели нарушения обработки

Качество представления звука в слуховом нерве ограничено рефрактерностью, адаптацией, насыщением и сниженной синхронизацией (фазовой синхронизацией) на высоких частотах, а также стохастической природой потенциалов действия. [184] Однако слуховой нерв содержит тысячи волокон. Следовательно, несмотря на эти ограничивающие факторы, свойства звуков достаточно хорошо представлены в ответе нерва популяции в широком диапазоне уровней [185] и звуковых частот (см. Volley Theory ).

Кодирование временной информации в слуховом нерве может быть нарушено двумя основными механизмами: снижением синхронности и потерей синапсов и/или волокон слухового нерва. [186] Влияние нарушенного временного кодирования на слуховое восприятие человека было исследовано с использованием физиологически вдохновленных инструментов обработки сигналов. Снижение нейронной синхронности было смоделировано путем дрожания фаз многочастотных компонентов речи, [187] хотя это имеет нежелательные эффекты в спектральной области. Потеря волокон слухового нерва или синапсов была смоделирована путем предположения (i) что каждое афферентное волокно работает как стохастический сэмплер звуковой волны с большей вероятностью срабатывания для более интенсивных и устойчивых звуковых характеристик, чем для более низкоинтенсивных или переходных характеристик, и (ii) что деафферентацию можно смоделировать путем уменьшения количества сэмплеров. [184] Однако это также имеет нежелательные эффекты в спектральной области. Как дрожание, так и стохастическая субдискретизация ухудшают представление TFS n больше, чем представление ENV n . Как дрожание, так и стохастическая субдискретизация ухудшают распознавание речи на шумном фоне, не ухудшая распознавание в тишине, подтверждая аргумент о том, что TFS n важен для распознавания речи на фоне шума. [3] Как дрожание, так и стохастическая субдискретизация имитируют эффекты старения на восприятие речи. [188]

Передача через слуховые аппараты и кохлеарные имплантаты

Временная огибающая передачи

Люди с кохлеарной потерей слуха обычно имеют меньший, чем обычно, динамический диапазон между уровнем самого слабого обнаруживаемого звука и уровнем, на котором звуки становятся некомфортно громкими. [189] [190] Чтобы сжать большой диапазон уровней звука, встречающихся в повседневной жизни, в небольшой динамический диапазон человека с нарушением слуха, слуховые аппараты применяют амплитудную компрессию , которая также называется автоматической регулировкой усиления (AGC). Основной принцип такой компрессии заключается в том, что величина усиления, применяемая к входящему звуку, постепенно уменьшается по мере увеличения входного уровня. Обычно звук разделяется на несколько частотных «каналов», и AGC применяется независимо в каждом канале. В результате сжатия уровня AGC уменьшает величину флуктуации огибающей во входном сигнале (ENV p ) на величину, которая зависит от скорости флуктуации и скорости, с которой усиление изменяется в ответ на изменения входного уровня звука. [191] [192] AGC также может изменять форму огибающей сигнала. [193] Кохлеарные имплантаты — это устройства, которые электрически стимулируют слуховой нерв, тем самым создавая ощущение звука у человека, который в противном случае был бы глубоко или полностью глухим. Электрический динамический диапазон очень мал, [194] поэтому кохлеарные имплантаты обычно включают АРУ до того, как сигнал будет отфильтрован в несколько частотных каналов. [195] Затем сигналы каналов подвергаются мгновенному сжатию, чтобы сопоставить их с ограниченным динамическим диапазоном для каждого канала. [196]

Кохлеарные имплантаты отличаются от слуховых аппаратов тем, что весь акустический слух заменяется прямой электрической стимуляцией слухового нерва, достигаемой с помощью электродной решетки, помещенной внутрь улитки. Следовательно, здесь другие факторы, помимо обработки сигнала устройством, также вносят большой вклад в общий слух, такие как этиология, здоровье нерва, конфигурация электрода и близость к нерву, а также общий процесс адаптации к совершенно новому режиму слуха. [197] [198] [199] [200] Почти вся информация в кохлеарных имплантатах передается колебаниями огибающей в разных каналах. Этого достаточно, чтобы дать разумное восприятие речи в тишине, но не в шумных или реверберирующих условиях. [201] [202] [203] [204] [121] [110] [205] [206] [207] [208] Обработка в кохлеарных имплантатах такова, что TFSp отбрасывается в пользу фиксированных импульсных последовательностей, амплитудно-модулированных ENVp в пределах каждой полосы частот. Пользователи имплантатов чувствительны к этим модуляциям ENVp, но производительность варьируется в зависимости от места стимуляции, уровня стимуляции и от человека к человеку. [209] [210] TMTF показывает форму фильтра нижних частот, похожую на ту, что наблюдается у нормально слышащих слушателей. [210] [211] [212] Информация о высоте голоса или музыкальной высоте, передаваемая в основном посредством слабых периодических сигналов в ENVp, приводит к ощущению высоты тона, которое недостаточно заметно для поддержки восприятия музыки, [213] [214] идентификации пола говорящего, [215] [216] лексических тонов, [217] [218] или просодических сигналов. [219] [220] [221] Слушатели с кохлеарными имплантами восприимчивы к помехам в области модуляции , [222] [223] , что, вероятно, способствует трудностям при прослушивании в шуме.

Временная передача тонкой структуры

Слуховые аппараты обычно обрабатывают звуки, фильтруя их в несколько частотных каналов и применяя АРУ в каждом канале. Другая обработка сигнала в слуховых аппаратах, такая как шумоподавление, также включает фильтрацию входного сигнала в несколько каналов. [224] Фильтрация в каналы может влиять на TFS p звуков в зависимости от таких характеристик, как фазовая характеристика и групповая задержка фильтров. Однако такие эффекты обычно невелики. Кохлеарные имплантаты также фильтруют входной сигнал в частотные каналы. Обычно ENV p  сигнала в каждом канале передается на имплантированные электроды в виде электрических импульсов фиксированной частоты, которые модулируются по амплитуде или длительности. Информация о TFS p отбрасывается. Это подтверждается наблюдением, что люди с кохлеарными имплантами имеют очень ограниченную способность обрабатывать информацию TFS p , даже если она передается на электроды, [225] возможно, из-за несоответствия между временной информацией и местом в улитке, куда она доставляется [76] Уменьшение этого несоответствия может улучшить способность использовать информацию TFS p и, следовательно, привести к лучшему восприятию высоты тона. [226] Некоторые системы кохлеарных имплантов передают информацию о TFS p в каналах кохлеарных имплантов, которые настроены на низкие звуковые частоты, и это может улучшить восприятие высоты тона низкочастотных звуков. [227]

Эффекты обучения и пластичность обработки временной оболочки

Перцептивное обучение, являющееся результатом обучения, было описано для различных слуховых задач обнаружения или различения AM, [228] [229] [230], что предполагает, что реакции центральных слуховых нейронов на сигналы ENV p являются пластичными и что практика может изменить схему обработки ENV n . [230] [231]

Пластичность обработки ENV n была продемонстрирована несколькими способами. Например, способность нейронов слуховой коры различать сигналы времени начала голоса для фонем ухудшается после умеренной потери слуха (20-40 дБ HL), вызванной акустической травмой. [232] Интересно, что потеря слуха в процессе развития снижает корковые реакции на медленные, но не быстрые (100 Гц) стимулы AM, параллельно с поведенческой эффективностью. [233] Фактически, временная потеря слуха (15 дней), происходящая во время «критического периода», достаточна для повышения порогов AM у взрослых песчанок. [234] Даже нетравматическое воздействие шума снижает способность нейронов коры к фазовой синхронизации, а также поведенческую способность животных различать различные звуки AM. [235] Поведенческое обучение или протоколы сопряжения, включающие нейромодуляторы, также изменяют способность нейронов коры к фазовой синхронизации со звуками AM. [236] [237] У людей потеря слуха может привести к несбалансированному представлению речевых сигналов: сигналы ENV n усиливаются за счет сигналов TFS n (см.: Влияние возраста и потери слуха на обработку временной огибающей). Аудиальная тренировка может снизить представление речевых сигналов ENV n для пожилых слушателей с потерей слуха, которые затем могут достичь уровней, сопоставимых с теми, которые наблюдаются у пожилых слушателей с нормальным слухом. [238] Наконец, интенсивное музыкальное обучение вызывает как поведенческие эффекты, такие как более высокая чувствительность к изменениям высоты тона (для высоты тона мандаринского диалекта), так и лучшую синхронизацию ответов ствола мозга на f0-контур лексических тонов у музыкантов по сравнению с немузыкантами. [239]

Клиническая оценка чувствительности к ТФС

Были разработаны быстрые и простые в применении психофизические тесты, чтобы помочь врачам в скрининге способностей к обработке TFS и диагностике надпороговых временных дефицитов слуховой обработки, связанных с повреждением улитки и старением. Эти тесты также могут быть полезны для аудиологов и производителей слуховых аппаратов для объяснения и/или прогнозирования результата настройки слуховых аппаратов с точки зрения воспринимаемого качества, разборчивости речи или пространственного слуха. [240] [241] Эти тесты в конечном итоге могут использоваться для рекомендации наиболее подходящей скорости сжатия в слуховых аппаратах [242] или использования направленных микрофонов. Необходимость таких тестов подтверждается сильными корреляциями между порогами обнаружения медленной FM или спектрально-временной модуляции и вспомогательной разборчивостью речи в конкурирующих фонах для людей с нарушениями слуха. [90] [243] Клинические тесты можно разделить на две группы: тесты, оценивающие возможности обработки монофонического звука TFS (тест TFS1), и тесты, оценивающие бинауральные возможности (бинауральная высота звука, TFS-LF, TFS-AF).

TFS1: этот тест оценивает способность различать гармонический сложный тон и его частотно-транспонированную (и, таким образом, негармоническую) версию. [244] [245] [246] [159] Бинауральная высота тона: эти тесты оценивают способность обнаруживать и различать бинауральную высоту тона и распознавать мелодию с использованием различных типов бинауральной высоты тона. [182] [247] TFS-LF: этот тест оценивает способность различать низкочастотные чистые тона, которые идентичны для двух ушей, от тех же тонов, отличающихся по интерауральной фазе. [248] [249] TFS AF: этот тест оценивает самую высокую звуковую частоту чистого тона, до которой можно различить изменение интерауральной фазы. [250]

Объективные измерения с использованием сигналов огибающей и TFS

Искажение сигнала, аддитивный шум, реверберация и стратегии обработки звука, такие как подавление шума и компрессия динамического диапазона, могут влиять на разборчивость речи и качество речи и музыки. [251] [252] [253] [254] [255] Эти изменения в восприятии сигнала часто можно предсказать, измерив связанные изменения в огибающей сигнала и/или временной тонкой структуре (TFS). Объективные измерения изменений сигнала в сочетании с процедурами, которые связывают изменения сигнала с различиями в слуховом восприятии, приводят к появлению показателей слуховой производительности для прогнозирования разборчивости речи и качества речи.

Изменения в TFS можно оценить, пропустив сигналы через банк фильтров и вычислив когерентность [256] между входом и выходом системы в каждой полосе. Разборчивость, предсказанная из когерентности, точна для некоторых форм аддитивного шума и нелинейных искажений, [251] [255], но плохо работает для подавления шума идеальной бинарной маской (IBM). [253] Качество речи и музыки для сигналов, подверженных шуму и искажению клиппинга, также моделировалось с использованием когерентности [257] или с использованием когерентности, усредненной по коротким сегментам сигнала. [258]

Изменения в огибающей сигнала можно измерить с помощью нескольких различных процедур. Наличие шума или реверберации уменьшит глубину модуляции сигнала, а многополосное измерение глубины модуляции огибающей выходного сигнала системы используется в индексе передачи речи (STI) для оценки разборчивости. [259] Хотя STI точен для приложений с шумом и реверберацией, он плохо работает для нелинейной обработки, такой как сжатие динамического диапазона. [260] Расширение STI оценивает изменение модуляции путем кросс-корреляции огибающих входных и выходных речевых сигналов. [261] [262] Связанная процедура, также использующая кросс-корреляции огибающей, — это мера кратковременной объективной разборчивости (STOI), [253] которая хорошо подходит для своего предполагаемого применения при оценке подавления шума, но которая менее точна для нелинейных искажений. [263] Метрики разборчивости на основе огибающей также были получены с использованием банков фильтров модуляции [67] и шаблонов частотно-временной модуляции огибающей. [264] Кросс-корреляция огибающей также используется для оценки качества речи и музыки. [265] [266]

Измерения огибающей и TFS также можно объединить для формирования метрик разборчивости и качества. Семейство метрик для разборчивости речи, [263] качества речи, [267] [268] и качества музыки [269] было получено с использованием общей модели слуховой периферии [270] , которая может представлять потерю слуха. Использование модели нарушенной периферии приводит к более точным прогнозам для слушателей с нарушениями слуха, чем использование модели с нормальным слухом, а объединенная метрика огибающей/TFS, как правило, более точна, чем метрика, которая использует только модуляцию огибающей. [263] [267]

Смотрите также

Ссылки

  1. ^ Viemeister NF, Plack CJ (1993). «Анализ времени». Психофизика человека . Springer Handbook of Auditory Research. Том 3. Springer, Нью-Йорк, штат Нью-Йорк. С. 116–154. doi :10.1007/978-1-4612-2728-1_4. ISBN 978-1-4612-7644-9.
  2. ^ abc Rosen S (июнь 1992). «Временная информация в речи: акустические, слуховые и лингвистические аспекты». Philosophical Transactions of the Royal Society of London. Series B, Biological Sciences . 336 (1278): 367–73. Bibcode :1992RSPTB.336..367R. doi :10.1098/rstb.1992.0070. PMID  1354376.
  3. ^ ab Drullman R (январь 1995). "Временная огибающая и тонкие структурные сигналы для разборчивости речи". Журнал Акустического общества Америки . 97 (1): 585–92. Bibcode : 1995ASAJ...97..585D. doi : 10.1121/1.413112. PMID  7860835.
  4. ^ abcde Moore BC (декабрь 2008 г.). «Роль временной тонкой структурной обработки в восприятии высоты тона, маскировке и восприятии речи для людей с нормальным и слабым слухом». Журнал Ассоциации исследований в области отоларингологии . 9 (4): 399–406. doi :10.1007/s10162-008-0143-x. PMC 2580810. PMID  18855069 . 
  5. ^ De Boer E (сентябрь 1956). «Высота тона негармонических сигналов». Nature . 178 (4532): 535–6. Bibcode :1956Natur.178..535B. doi :10.1038/178535a0. PMID  13358790. S2CID  4241424.
  6. ^ Zeng FG, Nie K, Liu S, Stickney G, Del Rio E, Kong YY, Chen H (сентябрь 2004 г.). «О дихотомии в слуховом восприятии между временной огибающей и тонкими структурными сигналами». Журнал акустического общества Америки . 116 (3): 1351–4. Bibcode : 2004ASAJ..116.1351Z. doi : 10.1121/1.1777938. PMID  15478399.
  7. ^ ab Plomp R (1983). «Восприятие речи как модулированного сигнала». Труды 10-го Международного конгресса фонетических наук, Утрехт : 19–40.
  8. ^ Гильберт Д. (1912). Grundzüge einer allgemeinen Теория линейного интегрального воздействия. Библиотеки Калифорнийского университета. Лейпциг, Б.Г. Тойбнер.
  9. ^ Ruggero MA (июль 1973). «Реакция на шум слуховых нервных волокон у беличьей обезьяны». Журнал нейрофизиологии . 36 (4): 569–87. doi :10.1152/jn.1973.36.4.569. PMID  4197339.
  10. ^ abcd Мур BC (2014-05-04). Слуховая обработка временной тонкой структуры: эффекты возраста и потери слуха . Нью-Джерси: World Scientific Publishing Company. ISBN 9789814579650.
  11. ^ ab Joris PX, Louage DH, Cardoen L, van der Heijden M (июнь 2006 г.). «Индекс корреляции: новая метрика для количественной оценки временного кодирования». Hearing Research . 216–217: 19–30. doi :10.1016/j.heares.2006.03.010. PMID  16644160. S2CID  32416471.
  12. ^ Heinz MG, Swaminathan J (сентябрь 2009 г.). «Количественная оценка огибающей и тонкоструктурного кодирования в ответах слухового нерва на химерную речь». Журнал Ассоциации исследований в области отоларингологии . 10 (3): 407–23. doi :10.1007/s10162-009-0169-8. PMC 3084379. PMID  19365691 . 
  13. ^ Søndergaard PL, Decorsière R, Dau T (2011-12-15). «О связи между многоканальной огибающей и временной тонкой структурой». Труды Международного симпозиума по слуховым и аудиологическим исследованиям . 3 : 363–370.
  14. ^ Шамма С., Лоренци С. (май 2013 г.). «О балансе огибающей и временной тонкой структуры при кодировании речи в ранней слуховой системе». Журнал акустического общества Америки . 133 (5): 2818–33. Bibcode : 2013ASAJ..133.2818S. doi : 10.1121/1.4795783. PMC 3663870. PMID  23654388. 
  15. ^ Joris PX, Schreiner CE, Rees A (апрель 2004 г.). «Нейронная обработка амплитудно-модулированных звуков». Physiological Reviews . 84 (2): 541–77. doi :10.1152/physrev.00029.2003. PMID  15044682.
  16. ^ Фризина РД (август 2001 г.). «Подкорковые нейронные механизмы кодирования для слуховой временной обработки». Исследования слуха . 158 (1–2): 1–27. doi :10.1016/S0378-5955(01)00296-9. PMID  11506933. S2CID  36727875.
  17. ^ Pressnitzer D, Meddis R, Delahaye R, Winter IM (август 2001 г.). «Физиологические корреляты комодуляционного маскирующего высвобождения в вентральном кохлеарном ядре млекопитающих». The Journal of Neuroscience . 21 (16): 6377–86. doi :10.1523/JNEUROSCI.21-16-06377.2001. PMC 6763188 . PMID  11487661. 
  18. ^ ab Hall JW, Haggard MP, Fernandes MA (июль 1984). «Обнаружение в шуме с помощью спектрально-временного анализа паттернов». Журнал Акустического общества Америки . 76 (1): 50–6. Bibcode : 1984ASAJ...76R..50H. doi : 10.1121/1.391005. PMID  6747111.
  19. ^ Eggermont JJ ​​(апрель 1994 г.). «Временные функции передачи модуляции для AM и FM стимулов в слуховой коре кошки. Влияние типа носителя, модулирующей формы волны и интенсивности». Hearing Research . 74 (1–2): 51–66. doi :10.1016/0378-5955(94)90175-9. PMID  8040099. S2CID  4766840.
  20. ^ Биезер А., Мюллер-Прейс П. (1996). «Слуховая реактивная кора головного мозга беличьей обезьяны: нейронные реакции на амплитудно-модулированные звуки». Exp Brain Res . 108 (2): 273–84. doi :10.1007/BF00228100. PMID  8815035. S2CID  19565315.
  21. ^ Лян Л., Лу Т., Ванг Х. (май 2002 г.). «Нейронные представления синусоидальной амплитуды и частотных модуляций в первичной слуховой коре бодрствующих приматов». Журнал нейрофизиологии . 87 (5): 2237–61. doi :10.1152/jn.2002.87.5.2237. PMID  11976364. S2CID  3184199.
  22. ^ Schreiner CE, Urbas JV (январь 1988). «Представление амплитудной модуляции в слуховой коре кошки. II. Сравнение между корковыми полями». Hearing Research . 32 (1): 49–63. doi :10.1016/0378-5955(88)90146-3. PMID  3350774. S2CID  8416108.
  23. ^ Lu T, Liang L, Wang X (ноябрь 2001 г.). «Временные и скоростные представления изменяющихся во времени сигналов в слуховой коре бодрствующих приматов». Nature Neuroscience . 4 (11): 1131–8. doi :10.1038/nn737. PMID  11593234. S2CID  1417232.
  24. ^ Eggermont JJ ​​(ноябрь 1991 г.). «Измерения скорости и синхронизации кодирования периодичности в первичной слуховой коре кошек». Hearing Research . 56 (1–2): 153–67. doi :10.1016/0378-5955(91)90165-6. PMID  1769910. S2CID  4704094.
  25. ^ Baumann S, Joly O, Rees A, Petkov CI, Sun L, Thiele A, Griffiths TD (январь 2015 г.). «Топография частотного и временного представления в слуховой коре приматов». eLife . 4 . doi : 10.7554/eLife.03256 . PMC 4398946 . PMID  25590651. 
  26. ^ Depireux DA, Elhilali M, ред. (2014-01-15). Справочник современных методов в слуховой коре (первое издание). Nova Science Pub Inc. ISBN 9781628088946.
  27. ^ Kowalski N, Depireux DA, Shamma SA (ноябрь 1996 г.). «Анализ динамических спектров в первичной слуховой коре хорька. I. Характеристики одноблочных ответов на движущиеся спектры ряби» (PDF) . Journal of Neurophysiology . 76 (5): 3503–23. doi :10.1152/jn.1996.76.5.3503. hdl : 1903/5688 . PMID  8930289.
  28. ^ Mesgarani N, Chang EF (май 2012). «Избирательное корковое представление сопровождаемого говорящего при восприятии речи нескольких говорящих». Nature . 485 (7397): 233–6. Bibcode :2012Natur.485..233M. doi :10.1038/nature11020. PMC 3870007 . PMID  22522927. 
  29. ^ Джон М.С., Пиктон Т.В. (март 2000 г.). «Человеческие слуховые устойчивые реакции на амплитудно-модулированные тоны: измерения фазы и задержки». Hearing Research . 141 (1–2): 57–79. doi :10.1016/S0378-5955(99)00209-9. PMID  10713496. S2CID  12478710.
  30. ^ Atiani S, David SV, Elgueda D, Locastro M, Radtke-Schuller S, Shamma SA, Fritz JB (апрель 2014 г.). «Эмерджентная селективность для стимулов, релевантных задаче, в слуховой коре высшего порядка». Neuron . 82 (2): 486–99. doi :10.1016/j.neuron.2014.02.029. PMC 4048815 . PMID  24742467. 
  31. ^ Schreiner CE, Urbas JV (1986). «Представление амплитудной модуляции в слуховой коре кошки. I. Переднее слуховое поле (AAF)». Hearing Research . 21 (3): 227–41. doi :10.1016/0378-5955(86)90221-2. PMID  3013823. S2CID  4703229.
  32. ^ Giraud AL, Lorenzi C, Ashburner J, Wable J, Johnsrude I, Frackowiak R, Kleinschmidt A (сентябрь 2000 г.). «Представление временной огибающей звуков в человеческом мозге». Journal of Neurophysiology . 84 (3): 1588–98. doi :10.1152/jn.2000.84.3.1588. PMID  10980029. S2CID  9020690.
  33. ^ Льежуа-Шовель С., Лоренци С., Требюшон А., Режис Ж., Шовель П. (июль 2004 г.). «Обработка временной оболочки в левой и правой слуховой коре человека». Кора головного мозга . 14 (7): 731–40. дои : 10.1093/cercor/bhh033 . ПМИД  15054052.
  34. ^ Herdener M, Esposito F, Scheffler K, Schneider P, Logothetis NK, Uludag K, Kayser C (ноябрь 2013 г.). «Пространственные представления временных и спектральных звуковых сигналов в слуховой коре человека». Cortex; Журнал, посвященный изучению нервной системы и поведения . 49 (10): 2822–33. doi :10.1016/j.cortex.2013.04.003. PMID  23706955. S2CID  19454517.
  35. ^ Schönwiesner M, Zatorre RJ (август 2009 г.). «Функция передачи спектрально-временной модуляции отдельных вокселей в слуховой коре человека, измеренная с помощью фМРТ высокого разрешения». Труды Национальной академии наук Соединенных Штатов Америки . 106 (34): 14611–6. Bibcode : 2009PNAS..10614611S. doi : 10.1073/pnas.0907682106 . PMC 2732853. PMID  19667199 . 
  36. ^ Griffiths TD, Penhune V, Peretz I, Dean JL, Patterson RD, Green GG (апрель 2000 г.). «Фронтальная обработка и слуховое восприятие». NeuroReport . 11 (5): 919–22. doi :10.1097/00001756-200004070-00004. PMID  10790855. S2CID  17386864.
  37. ^ Hullett PW, Hamilton LS, Mesgarani N, Schreiner CE, Chang EF (февраль 2016 г.). «Организация спектрально-временной модуляции верхней височной извилины человека, полученная от речевых стимулов». The Journal of Neuroscience . 36 (6): 2014–26. doi :10.1523/JNEUROSCI.1779-15.2016. PMC 4748082 . PMID  26865624. 
  38. ^ abcdef Elhilali M, Fritz JB, Klein DJ, Simon JZ, Shamma SA (февраль 2004 г.). «Динамика точного времени спайков в первичной слуховой коре». The Journal of Neuroscience . 24 (5): 1159–72. doi :10.1523/JNEUROSCI.3825-03.2004. PMC 6793586 . PMID  14762134. 
  39. ^ Boer, E. de (1985). "Auditory Time Constants: A Paradox?". Временное разрешение в слуховых системах . Труды по наукам о жизни. Springer, Берлин, Гейдельберг. стр. 141–158. doi :10.1007/978-3-642-70622-6_9. ISBN 9783642706240.
  40. ^ ab Bair W, Koch C (август 1996). «Временная точность импульсных последовательностей в экстрастриарной коре головного мозга макаки» (PDF) . Neural Computation . 8 (6): 1185–202. doi :10.1162/neco.1996.8.6.1185. PMID  8768391. S2CID  8615893.
  41. ^ Simon JZ, Depireux DA, Klein DJ, Fritz JB, Shamma SA (март 2007 г.). «Временная симметрия в первичной слуховой коре: последствия для кортикальных связей». Neural Computation . 19 (3): 583–638. arXiv : q-bio/0608027 . doi :10.1162/neco.2007.19.3.583. PMID  17298227. S2CID  10011056.
  42. ^ Theunissen FE, Sen K, Doupe AJ (март 2000). «Спектрально-временные рецептивные поля нелинейных слуховых нейронов, полученные с использованием естественных звуков». The Journal of Neuroscience . 20 (6): 2315–31. doi :10.1523/JNEUROSCI.20-06-02315.2000. PMC 6772498. PMID  10704507 . 
  43. ^ Дэвид С.В., Месгарани Н., Фриц Дж.Б., Шамма СА (март 2009 г.). «Быстрая синаптическая депрессия объясняет нелинейную модуляцию спектрально-временной настройки в первичной слуховой коре естественными стимулами». Журнал нейронауки . 29 (11): 3374–86. doi :10.1523/JNEUROSCI.5249-08.2009. PMC 2774136. PMID  19295144 . 
  44. ^ Bieser A, Müller-Preuss P (март 1996). «Слуховая реактивная кора головного мозга беличьей обезьяны: нейронные реакции на амплитудно-модулированные звуки». Experimental Brain Research . 108 (2): 273–84. doi :10.1007/bf00228100. PMID  8815035. S2CID  19565315.
  45. ^ Fast H (2007). Психоакустика — Факты и Модели. Springer. ISBN 9783540231592.[ нужна страница ]
  46. ^ Бернс Э.М., Виемейстер Н.Ф. (декабрь 1981 г.). «Воспроизведенный снова SAM: Дальнейшие наблюдения за высотой тона амплитудно-модулированного шума». Журнал Акустического общества Америки . 70 (6): 1655–1660. Bibcode : 1981ASAJ...70.1655B. doi : 10.1121/1.387220.
  47. ^ McDermott JH, Simoncelli EP (сентябрь 2011 г.). «Восприятие текстуры звука с помощью статистики слуховой периферии: доказательства синтеза звука». Neuron . 71 (5): 926–40. doi :10.1016/j.neuron.2011.06.032. PMC 4143345 . PMID  21903084. 
  48. ^ МакВальтер Р., Дау Т. (2017-09-11 ) . «Каскадные амплитудные модуляции в восприятии звуковой текстуры». Frontiers in Neuroscience . 11 : 485. doi : 10.3389/fnins.2017.00485 . PMC 5601004. PMID  28955191. 
  49. ^ abcd Viemeister NF (ноябрь 1979). "Временные функции передачи модуляции на основе порогов модуляции". Журнал Акустического общества Америки . 66 (5): 1364–80. Bibcode : 1979ASAJ...66.1364V. doi : 10.1121/1.383531. PMID  500975.
  50. ^ Шефт С, Йост ВА (август 1990). «Временная интеграция при обнаружении амплитудной модуляции». Журнал Акустического общества Америки . 88 (2): 796–805. Bibcode : 1990ASAJ...88..796S. doi : 10.1121/1.399729. PMID  2212305.
  51. ^ ab Kohlrausch A, Fassel R, Dau T (август 2000 г.). «Влияние уровня и частоты несущей на пороги модуляции и обнаружения биений для синусоидальных несущих». Журнал акустического общества Америки . 108 (2): 723–34. Bibcode : 2000ASAJ..108..723K. doi : 10.1121/1.429605. PMID  10955639.
  52. ^ Bacon SP, Grantham DW (июнь 1989). «Маскировка модуляции: эффекты частоты модуляции, глубины и фазы». Журнал акустического общества Америки . 85 (6): 2575–80. Bibcode : 1989ASAJ...85.2575B. doi : 10.1121/1.397751. PMID  2745880.
  53. ^ ab Houtgast T (апрель 1989). "Частотная селективность при обнаружении амплитудной модуляции". Журнал Акустического общества Америки . 85 (4): 1676–80. Bibcode : 1989ASAJ...85.1676H. doi : 10.1121/1.397956. PMID  2708683.
  54. ^ Yost WA, Sheft S (февраль 1989). «Обработка амплитудно-модулированных тонов в критической полосе». Журнал Акустического общества Америки . 85 (2): 848–57. Bibcode : 1989ASAJ...85..848Y. doi : 10.1121/1.397556. PMID  2925999.
  55. ^ Kay RH, Matthews DR (сентябрь 1972 г.). «О существовании в слуховых путях человека каналов, избирательно настроенных на модуляцию, присутствующую в частотно-модулированных тонах». Журнал физиологии . 225 (3): 657–77. doi :10.1113/jphysiol.1972.sp009962. PMC 1331136. PMID  5076392. 
  56. ^ Tansley BW, Suffield JB (сентябрь 1983 г.). «Ход адаптации и восстановления каналов, селективно чувствительных к частотной и амплитудной модуляции». Журнал акустического общества Америки . 74 (3): 765–75. Bibcode : 1983ASAJ...74..765T. doi : 10.1121/1.389864. PMID  6630734.
  57. ^ Wojtczak M, Viemeister NF (август 2003). «Сверхпороговые эффекты адаптации, вызванные амплитудной модуляцией». Журнал акустического общества Америки . 114 (2): 991–7. Bibcode : 2003ASAJ..114..991W. doi : 10.1121/1.1593067 . PMID  12942978.
  58. ^ Lorenzi C, Simpson MI, Millman RE, Griffiths TD, Woods WP, Rees A, Green GG (ноябрь 2001 г.). "Пороги обнаружения модуляции второго порядка для чистого тона и узкополосных шумовых носителей". Журнал акустического общества Америки . 110 (5 Pt 1): 2470–8. Bibcode : 2001ASAJ..110.2470L. doi : 10.1121/1.1406160. PMID  11757936.
  59. ^ Ewert SD, Verhey JL, Dau T (декабрь 2002 г.). «Спектрально-временная обработка в области огибающей частоты». Журнал акустического общества Америки . 112 (6): 2921–31. Bibcode : 2002ASAJ..112.2921E. doi : 10.1121/1.1515735. PMID  12509013.
  60. ^ Füllgrabe C, Moore BC, Demany L, Ewert SD, Sheft S, Lorenzi C (апрель 2005 г.). «Маскировка модуляции, создаваемая модуляторами второго порядка». Журнал акустического общества Америки . 117 (4 Pt 1): 2158–68. Bibcode : 2005ASAJ..117.2158F. doi : 10.1121/1.1861892. PMC 2708918. PMID  15898657 . 
  61. ^ Klein-Hennig M, Dietz M, Hohmann V, Ewert SD (июнь 2011 г.). «Влияние различных сегментов текущей огибающей на чувствительность к интерауральным временным задержкам». Журнал акустического общества Америки . 129 (6): 3856–72. Bibcode : 2011ASAJ..129.3856K. doi : 10.1121/1.3585847. PMID  21682409.
  62. ^ Strickland EA, Viemeister NF (июнь 1996). «Cues for discrimination of envelopes» (сигналы для различения огибающих). Журнал Акустического общества Америки . 99 (6): 3638–46. Bibcode : 1996ASAJ...99.3638S. doi : 10.1121/1.414962. PMID  8655796.
  63. ^ abc Dau T, Kollmeier B, Kohlrausch A (ноябрь 1997 г.). "Моделирование слуховой обработки амплитудной модуляции. I. Обнаружение и маскировка узкополосными носителями". Журнал акустического общества Америки . 102 (5 Pt 1): 2892–905. Bibcode : 1997ASAJ..102.2892D. doi : 10.1121/1.420344. PMID  9373976. S2CID  3500293.
  64. ^ Piechowiak T, Ewert SD, Dau T (апрель 2007 г.). "Моделирование освобождения маскировки комодуляции с использованием механизма выравнивания-отмены" (PDF) . Журнал акустического общества Америки . 121 (4): 2111–26. Bibcode :2007ASAJ..121.2111P. doi :10.1121/1.2534227. PMID  17471726. S2CID  5001122.
  65. ^ Эверт SD, Дау T (сентябрь 2000 г.). «Характеристика частотной селективности для флуктуаций огибающей». Журнал Акустического общества Америки . 108 (3 Pt 1): 1181–96. Bibcode : 2000ASAJ..108.1181E. doi : 10.1121/1.1288665. PMID  11008819.
  66. ^ Wakefield GH, Viemeister NF (сентябрь 1990 г.). «Распознавание глубины модуляции шума синусоидальной амплитудной модуляции (SAM)». Журнал Акустического общества Америки . 88 (3): 1367–73. Bibcode : 1990ASAJ...88.1367W. doi : 10.1121/1.399714. PMID  2229672.
  67. ^ ab Jørgensen S, Ewert SD, Dau T (июль 2013 г.). «Модель разборчивости речи на основе мощности огибающей с несколькими разрешениями». Журнал акустического общества Америки . 134 (1): 436–46. Bibcode : 2013ASAJ..134..436J. doi : 10.1121/1.4807563. PMID  23862819.
  68. ^ Biberger T, Ewert SD (август 2016). «Прогнозирование психоакустической маскировки и разборчивости речи на основе огибающей и интенсивности». Журнал Акустического общества Америки . 140 (2): 1023–1038. Bibcode : 2016ASAJ..140.1023B. doi : 10.1121/1.4960574. PMID  27586734.
  69. ^ Nelson PC, Carney LH (август 2006). «Cues for masked Amplitude-modulation Detection». Журнал Акустического Общества Америки . 120 (2): 978–90. Bibcode : 2006ASAJ..120..978N. doi : 10.1121/1.2213573. PMC 2572864. PMID  16938985 . 
  70. ^ Verschooten E, Robles L, Joris PX (февраль 2015 г.). «Оценка пределов нейронной фазовой синхронизации с использованием массовых потенциалов». Журнал нейронауки . 35 (5): 2255–68. doi :10.1523/JNEUROSCI.2979-14.2015. PMC 6705351. PMID  25653380 . 
  71. ^ Palmer AR, Russell IJ (1986). «Фазовая синхронизация в кохлеарном нерве морской свинки и ее связь с рецепторным потенциалом внутренних волосковых клеток». Hearing Research . 24 (1): 1–15. doi :10.1016/0378-5955(86)90002-X. PMID  3759671. S2CID  40262271.
  72. ^ Weiss TF, Rose C (май 1988). «Сравнение фильтров синхронизации в различных слуховых рецепторных органах». Hearing Research . 33 (2): 175–9. doi :10.1016/0378-5955(88)90030-5. PMID  3397327. S2CID  20291529.
  73. ^ abc Paraouty N, Stasiak A, Lorenzi C, Varnet L, Winter IM (апрель 2018 г.). «Двойное кодирование частотной модуляции в вентральном кохлеарном ядре». The Journal of Neuroscience . 38 (17): 4123–4137. doi :10.1523/JNEUROSCI.2107-17.2018. PMC 6596033 . PMID  29599389. 
  74. ^ ab Moore BC (сентябрь 1973 г.). "Frequency difference limitens for short-duration tones". Журнал Акустического Общества Америки . 54 (3): 610–9. Bibcode : 1973ASAJ...54..610M. doi : 10.1121/1.1913640. PMID  4754385.
  75. ^ abc Moore B (2013-04-05). Введение в психологию слуха: Шестое издание (6-е изд.). Лейден: BRILL. ISBN 9789004252424.
  76. ^ abcdef Plack CJ (2005). Pitch - Neural Coding and Perception. Springer Handbook of Auditory Research. Springer. ISBN 9780387234724.
  77. ^ abcd Moore BC, Sek A (октябрь 1996). «Обнаружение частотной модуляции при низких скоростях модуляции: доказательства механизма, основанного на фазовой синхронизации». Журнал акустического общества Америки . 100 (4 Pt 1): 2320–31. Bibcode : 1996ASAJ..100.2320M. doi : 10.1121/1.417941. PMID  8865639.
  78. ^ ab Lacher-Fougère S, Demany L (октябрь 2005 г.). «Последствия повреждения улитки для обнаружения межушных фазовых различий». Журнал акустического общества Америки . 118 (4): 2519–26. Bibcode : 2005ASAJ..118.2519L. doi : 10.1121/1.2032747 . PMID  16266172. S2CID  1218899.
  79. ^ ab Hopkins K, Moore BC, Stone MA (февраль 2008 г.). «Влияние умеренной кохлеарной потери слуха на способность извлекать пользу из временной тонкой структурной информации в речи». Журнал акустического общества Америки . 123 (2): 1140–53. Bibcode : 2008ASAJ..123.1140H. doi : 10.1121/1.2824018. PMC 2688774. PMID  18247914 . 
  80. ^ Оксенхэм А. Дж., Бернстайн Дж. Г., Пенагос Х. (февраль 2004 г.). «Корректное тонотопическое представление необходимо для сложного восприятия высоты тона». Труды Национальной академии наук Соединенных Штатов Америки . 101 (5): 1421–5. doi : 10.1073/pnas.0306958101 . PMC 337068. PMID  14718671 . 
  81. ^ Оксенхэм А. Дж., Михейл С., Киблер М. В., Лопер А., Сантюретт С. (май 2011 г.). «Восприятие высоты тона за пределами традиционной области существования высоты тона». Труды Национальной академии наук Соединенных Штатов Америки . 108 (18): 7629–34. doi : 10.1073/pnas.1015291108 . PMC 3088642. PMID  21502495 . 
  82. ^ abc Paraouty N, Ewert SD, Wallaert N, Lorenzi C (июль 2016 г.). "Взаимодействие между амплитудной модуляцией и обработкой частотной модуляции: эффекты возраста и потери слуха" (PDF) . Журнал акустического общества Америки . 140 (1): 121–131. Bibcode :2016ASAJ..140..121P. doi :10.1121/1.4955078. PMID  27475138.
  83. ^ Demany L, Semal C (март 1989). "Пороги обнаружения для синусоидальной частотной модуляции". Журнал Акустического общества Америки . 85 (3): 1295–301. Bibcode : 1989ASAJ...85.1295D. doi : 10.1121/1.397460. PMID  2708671.
  84. ^ ab Ernst SM, Moore BC (декабрь 2010 г.). «Механизмы, лежащие в основе обнаружения частотной модуляции». Журнал акустического общества Америки . 128 (6): 3642–8. ​​Bibcode : 2010ASAJ..128.3642E. doi : 10.1121/1.3506350. PMID  21218896.
  85. ^ Цвикер, Э. (1 января 1956 г.). «Die elementaren Grundlagen zur Bestimmung der Informationskapazität des Gehörs». Acta Acustica объединилась с Acustica . 6 (4): 365–381.
  86. ^ Майвальд, Д. (1967). «Ein Funktionsschema des Gehors zur Beschreibung der Erkennbarkeit kleiner Frequenz und Amplitudenanderungen». Акустика . 18 : 81–92.
  87. ^ Saberi K, Hafter ER (апрель 1995). «Общий нейронный код для частотно- и амплитудно-модулированных звуков». Nature . 374 (6522): 537–9. Bibcode :1995Natur.374..537S. doi :10.1038/374537a0. PMID  7700378. S2CID  4236436.
  88. ^ Рагглз Д., Бхарадвадж Х., Шинн-Каннингем Б.Г. (сентябрь 2011 г.). «Обычного слуха недостаточно, чтобы гарантировать надежное кодирование надпороговых признаков, важных в повседневном общении». Труды Национальной академии наук Соединенных Штатов Америки . 108 (37): 15516–21. Bibcode : 2011PNAS..10815516R. doi : 10.1073/pnas.1108912108 . PMC 3174666. PMID  21844339 . 
  89. ^ Йоханнесен ПТ, Перес-Гонсалес П, Каллури С, Бланко ДЖЛ, Лопес-Поведа ЕА (сентябрь 2016 г.). «Влияние кохлеарной механической дисфункции, дефицитов временной обработки и возраста на разборчивость слышимой речи в шуме для слабослышащих слушателей». Тенденции в слухе . 20 : 233121651664105. doi : 10.1177/2331216516641055. PMC 5017567. PMID  27604779 . 
  90. ^ ab Lopez-Poveda EA, Johannesen PT, Pérez-González P, Blanco JL, Kalluri S, Edwards B (январь 2017 г.). «Предикторы результатов использования слуховых аппаратов». Trends in Hearing . 21 : 2331216517730526. doi : 10.1177/2331216517730526. PMC 5613846. PMID  28929903 . 
  91. ^ ab Buss E, Hall JW, Grose JH (июнь 2004 г.). «Временные тонкоструктурные сигналы речи и модуляции чистого тона у наблюдателей с сенсоневральной потерей слуха». Ухо и слух . 25 (3): 242–50. doi :10.1097/01.AUD.0000130796.73809.09. PMID  15179115. S2CID  11620271.
  92. ^ ab Strelcyk O, Dau T (май 2009). "Связь между частотной селективностью, временной обработкой тонкой структуры и восприятием речи при нарушенном слухе" (PDF) . Журнал акустического общества Америки . 125 (5): 3328–45. Bibcode :2009ASAJ..125.3328S. doi :10.1121/1.3097469. PMID  19425674. S2CID  8062937.
  93. ^ Эверт SD, Параути N, Лоренци C (январь 2018 г.). «Двухпутевая модель обнаружения слуховой модуляции с использованием временной тонкой структуры и огибающей сигналов». Европейский журнал нейронауки . 51 (5): 1265–1278. doi :10.1111/ejn.13846. PMID  29368797. S2CID  46843680.
  94. ^ Zilany MS, Bruce IC, Nelson PC, Carney LH (ноябрь 2009 г.). «Феноменологическая модель синапса между внутренней волосковой клеткой и слуховым нервом: долгосрочная адаптация с динамикой степенного закона». Журнал акустического общества Америки . 126 (5): 2390–412. Bibcode : 2009ASAJ..126.2390Z. doi : 10.1121/1.3238250. PMC 2787068. PMID  19894822 . 
  95. ^ Zilany MS, Bruce IC, Carney LH (январь 2014 г.). «Обновленные параметры и расширенные возможности моделирования для модели слуховой периферии». Журнал акустического общества Америки . 135 (1): 283–6. Bibcode : 2014ASAJ..135..283Z . doi : 10.1121/1.4837815. PMC 3985897. PMID  24437768. 
  96. ^ Wirtzfeld MR, Ibrahim RA, Bruce IC (октябрь 2017 г.). «Прогнозы разборчивости речи химеры с использованием средней скорости слухового нерва и нейронных сигналов синхронизации спайков». Журнал Ассоциации исследований в области отоларингологии . 18 (5): 687–710. doi :10.1007/s10162-017-0627-7. PMC 5612921. PMID  28748487 . 
  97. ^ Moon IJ, Won JH, Park MH, Ives DT, Nie K, Heinz MG, Lorenzi C, Rubinstein JT (сентябрь 2014 г.). «Оптимальное сочетание нейронной временной огибающей и тонких структурных сигналов для объяснения распознавания речи в фоновом шуме». The Journal of Neuroscience . 34 (36): 12145–54. doi :10.1523/JNEUROSCI.1025-14.2014. PMC 4152611 . PMID  25186758. 
  98. ^ ab Lorenzi C, Gilbert G, Carn H, Garnier S, Moore BC (декабрь 2006 г.). «Проблемы восприятия речи у людей с нарушением слуха отражают неспособность использовать тонкую временную структуру». Труды Национальной академии наук Соединенных Штатов Америки . 103 (49): 18866–9. Bibcode : 2006PNAS..10318866L. doi : 10.1073/pnas.0607364103 . PMC 1693753. PMID  17116863 . 
  99. ^ ab Hopkins K, Moore BC (июль 2011 г.). «Влияние возраста и потери слуха улитки на чувствительность тонкой временной структуры, частотную селективность и восприятие речи в шуме». Журнал акустического общества Америки . 130 (1): 334–49. Bibcode : 2011ASAJ..130..334H. doi : 10.1121/1.3585848. PMID  21786903.
  100. ^ Heinz MG, Colburn HS, Carney LH (октябрь 2001 г.). «Оценка пределов слуховой производительности: i. однопараметрическое различение с использованием вычислительной модели для слухового нерва». Neural Computation . 13 (10): 2273–316. doi :10.1162/089976601750541804. PMID  11570999. S2CID  14775452.
  101. ^ Heinz MG, Colburn HS, Carney LH (октябрь 2001 г.). «Оценка пределов слуховой производительности: II. Однопараметрическая дискриминация с вариацией случайного уровня». Neural Computation . 13 (10): 2317–38. doi :10.1162/089976601750541813. PMID  11571000. S2CID  7756946.
  102. ^ Карни, Лорел Х.; Хайнзи, Майкл Г.; Эвилсайзер, Мэри Э.; Джилкиз, Роберт Х.; Колберн, Х. Стивен (2002). «Аудиторная фазовая оппозиция: временная модель для маскированного обнаружения на низких частотах». Acta Acustica United with Acustica . 88 (3): 334–47.
  103. ^ Дэн Л., Гейслер К. Д. (декабрь 1987 г.). «Композитная слуховая модель для обработки звуков речи». Журнал Акустического общества Америки . 82 (6): 2001–12. Bibcode : 1987ASAJ...82.2001D. doi : 10.1121/1.395644. PMID  3429735.
  104. ^ Loeb GE, White MW, Merzenich MM (1983). «Пространственная кросс-корреляция. Предложенный механизм акустического восприятия высоты тона». Biological Cybernetics . 47 (3): 149–63. doi :10.1007/BF00337005. PMID  6615914. S2CID  454354.
  105. ^ Шамма С., Кляйн Д. (май 2000 г.). «Дело об отсутствующих шаблонах высоты тона: как гармонические шаблоны возникают в ранней слуховой системе». Журнал Акустического общества Америки . 107 (5 Pt 1): 2631–44. Bibcode : 2000ASAJ..107.2631S. doi : 10.1121/1.428649. hdl : 1903/6017 . PMID  10830385.
  106. ^ Shamma SA (ноябрь 1985 г.). «Обработка речи в слуховой системе. II: Латеральное торможение и центральная обработка вызванной речью активности в слуховом нерве». Журнал Акустического общества Америки . 78 (5): 1622–32. Bibcode : 1985ASAJ...78.1622S. doi : 10.1121/1.392800. PMID  3840813.
  107. ^ abc Варнет Л., Ортис-Барахас MC, Эрра Р.Г., Жервен Дж., Лоренци С. (октябрь 2017 г.). «Межлингвистическое исследование спектров речевой модуляции» (PDF) . Журнал Акустического общества Америки . 142 (4): 1976–1989. Бибкод : 2017ASAJ..142.1976V. дои : 10.1121/1.5006179. PMID  29092595. S2CID  25269485.
  108. ^ Ван Таселл DJ, Соли SD, Кирби VM, Видин GP (октябрь 1987 г.). «Огибающие речевой волны для распознавания согласных». Журнал Акустического общества Америки . 82 (4): 1152–61. Bibcode : 1987ASAJ...82.1152V. doi : 10.1121/1.395251. PMID  3680774.
  109. ^ ab Ghitza O (сентябрь 2001 г.). «О верхней частоте среза детекторов огибающей слуховой критической полосы в контексте восприятия речи». Журнал акустического общества Америки . 110 (3 Pt 1): 1628–40. Bibcode : 2001ASAJ..110.1628G. doi : 10.1121/1.1396325. PMID  11572372.
  110. ^ ab Shannon RV, Zeng FG, Kamath V, Wygonski J, Ekelid M (октябрь 1995 г.). «Распознавание речи с использованием в первую очередь временных сигналов». Science . 270 (5234): 303–4. Bibcode :1995Sci...270..303S. doi :10.1126/science.270.5234.303. PMID  7569981. S2CID  581599.
  111. ^ Смит ЗМ, Дельгутт Б, Оксенхэм АДж (март 2002). «Химерные звуки выявляют дихотомии в слуховом восприятии». Nature . 416 (6876): 87–90. Bibcode :2002Natur.416...87S. doi :10.1038/416087a. PMC 2268248 . PMID  11882898. 
  112. ^ Drullman R, Festen JM, Plomp R (февраль 1994). «Влияние размытия временной огибающей на восприятие речи». Журнал акустического общества Америки . 95 (2): 1053–64. Bibcode : 1994ASAJ...95.1053D. doi : 10.1121/1.408467. PMID  8132899.
  113. ^ Singh NC, Theunissen FE (декабрь 2003 г.). «Спектры модуляции естественных звуков и этологические теории слуховой обработки». Журнал Акустического общества Америки . 114 (6 Pt 1): 3394–411. Bibcode : 2003ASAJ..114.3394S. doi : 10.1121/1.1624067. PMID  14714819.
  114. ^ Iverson P, Krumhansl CL (ноябрь 1993 г.). «Изоляция динамических атрибутов музыкального тембра». Журнал Акустического общества Америки . 94 (5): 2595–603. Bibcode : 1993ASAJ...94.2595I. doi : 10.1121/1.407371. PMID  8270737. S2CID  16374075.
  115. ^ Cheveigné, Alain de (2005). "Модели восприятия высоты тона". Высота тона . Springer Handbook of Auditory Research. Том 24. Springer, Нью-Йорк, штат Нью-Йорк. С. 169–233. doi :10.1007/0-387-28958-5_6. ISBN 9780387234724.
  116. ^ Moore BC, Glasberg BR, Low KE, Cope T, Cope W (август 2006 г.). «Влияние уровня и частоты на слышимость парциальных тонов в негармонических сложных тонах». Журнал акустического общества Америки . 120 (2): 934–44. Bibcode : 2006ASAJ..120..934M. doi : 10.1121/1.2216906. PMID  16938981.
  117. ^ Terhardt E (май 1974). «Высота тона, консонанс и гармония». Журнал Акустического общества Америки . 55 (5): 1061–9. Bibcode : 1974ASAJ...55.1061T. doi : 10.1121/1.1914648. PMID  4833699.
  118. ^ Santurette S, Dau T (январь 2011). «Роль временной тонкой структурной информации для низкого тона высокочастотных сложных тонов». Журнал Акустического общества Америки . 129 (1): 282–92. Bibcode : 2011ASAJ..129..282S. doi : 10.1121/1.3518718. PMID  21303009.
  119. ^ Santurette S, Dau T, Oxenham AJ (декабрь 2012 г.). «О возможности кода места для низкого тона высокочастотных сложных тонов». Журнал акустического общества Америки . 132 (6): 3883–95. Bibcode : 2012ASAJ..132.3883S. doi : 10.1121/1.4764897. PMC 3528728. PMID  23231119. 
  120. ^ Gfeller K, Turner C, Oleson J, Zhang X, Gantz B, Froman R, Olszewski C (июнь 2007 г.). «Точность восприятия высоты тона, распознавания мелодии и восприятия речи в шуме у пациентов с кохлеарным имплантом». Ear and Hearing . 28 (3): 412–23. doi :10.1097/AUD.0b013e3180479318. PMID  17485990. S2CID  21933200.
  121. ^ ab Zeng FG, Nie K, Stickney GS, Kong YY, Vongphoe M, Bhargave A, Wei C, Cao K (февраль 2005 г.). «Распознавание речи с амплитудной и частотной модуляцией». Труды Национальной академии наук Соединенных Штатов Америки . 102 (7): 2293–8. Bibcode : 2005PNAS..102.2293Z. doi : 10.1073/pnas.0406460102 . PMC 546014. PMID  15677723 . 
  122. ^ Apoux F, Yoho SE, Youngdahl CL, Healy EW (сентябрь 2013 г.). «Роль и относительный вклад временной огибающей и тонких структурных сигналов в распознавание предложений нормально слышащими слушателями». Журнал акустического общества Америки . 134 (3): 2205–12. Bibcode : 2013ASAJ..134.2205A. doi : 10.1121/1.4816413. PMC 3765279. PMID  23967950 . 
  123. ^ Freyman RL, Griffin AM, Oxenham AJ (октябрь 2012 г.). «Разборчивость шепотной речи в стационарных и модулированных шумовых маскировщиках». Журнал акустического общества Америки . 132 (4): 2514–23. Bibcode : 2012ASAJ..132.2514F . doi : 10.1121/1.4747614. PMC 3477190. PMID  23039445. 
  124. ^ Дик, Фредерик; Кришнан, Салони; Лич, Роберт; Сайгин, Айше Пинар (2016). «Звуки окружающей среды». Нейробиология языка . С. 1121–1138. doi :10.1016/b978-0-12-407794-2.00089-4. ISBN 978-0-12-407794-2.
  125. ^ Лемэтр, Гийом; Гримо, Николя; Суид, Клара (2018). «Акустика и психоакустика звуковых сцен и событий». Вычислительный анализ звуковых сцен и событий . стр. 41–67. doi :10.1007/978-3-319-63450-0_3. ISBN 978-3-319-63449-4.
  126. ^ abc Шафиро, Валерий (июнь 2008 г.). «Идентификация звуков окружающей среды с различным спектральным разрешением». Ухо и слух . 29 (3): 401–420. doi :10.1097/AUD.0b013e31816a0cf1. PMID  18344871. S2CID  44607434.
  127. ^ ab Gygi, Brian; Kidd, Gary R.; Watson, Charles S. (март 2004 г.). «Спектрально-временные факторы в идентификации звуков окружающей среды». Журнал Акустического общества Америки . 115 (3): 1252–1265. Bibcode : 2004ASAJ..115.1252G. doi : 10.1121/1.1635840. PMID  15058346.
  128. ^ Уоррен, Уильям Х.; Вербрюгге, Роберт Р. (1984). «Слуховое восприятие событий ломки и отскока: исследование случая в экологической акустике». Журнал экспериментальной психологии: восприятие и производительность человека . 10 (5): 704–712. doi :10.1037/0096-1523.10.5.704. PMID  6238128.
  129. ^ Inverso, Yell; Limb, Charles J. (август 2010 г.). «Восприятие неязыковых звуков с помощью кохлеарного импланта». Ухо и слух . 31 (4): 505–514. doi :10.1097/AUD.0b013e3181d99a52. PMID  20588119. S2CID  24076889.
  130. ^ Шафиро, Валерий; Джиджи, Брайан; Ченг, Мин-Ю; Вачхани, Джей; Малви, Меган (июль 2011 г.). «Восприятие звуков окружающей среды пациентами с кохлеарным имплантом». Ухо и слух . 32 (4): 511–523. doi :10.1097/AUD.0b013e3182064a87. PMC 3115425. PMID  21248643 . 
  131. ^ Харрис, Майкл С.; Бойс, Лорен; Пизони, Дэвид Б.; Шафиро, Валерий; Моберли, Аарон К. (октябрь 2017 г.). «Взаимосвязь между восприятием звуков окружающей среды и навыками распознавания речи у опытных пользователей кохлеарных имплантов». Отология и невротология . 38 (9): e308–e314. doi :10.1097/MAO.0000000000001514. PMC 6205294 . PMID  28731964. 
  132. ^ Мур BC, Гокель HE (апрель 2012 г.). «Свойства формирования слухового потока». Философские труды Лондонского королевского общества. Серия B, Биологические науки . 367 (1591): 919–31. doi :10.1098/rstb.2011.0355. PMC 3282308. PMID  22371614 . 
  133. ^ Cusack R, Roberts B (июль 2004 г.). «Влияние различий в структуре амплитудных огибающих по гармоникам на разделение слухового потока». Hearing Research . 193 (1–2): 95–104. doi :10.1016/j.heares.2004.03.009. PMID  15219324. S2CID  2056844.
  134. ^ Vliegen J, Oxenham AJ (январь 1999). "Последовательное разделение потоков при отсутствии спектральных сигналов" (PDF) . Журнал Акустического общества Америки . 105 (1): 339–46. Bibcode :1999ASAJ..105..339V. doi :10.1121/1.424503. PMID  9921660.
  135. ^ Grimault N, Micheyl C, Carlyon RP, Arthaud P, Collet L (июль 2000 г.). «Влияние периферической разрешающей способности на перцептивную сегрегацию гармонических сложных тонов, различающихся по основной частоте». Журнал акустического общества Америки . 108 (1): 263–71. Bibcode : 2000ASAJ..108..263G. doi : 10.1121/1.429462. PMID  10923890.
  136. ^ Grimault N, Bacon SP, Micheyl C (март 2002). «Сегрегация слухового потока на основе скорости амплитудной модуляции». Журнал Акустического общества Америки . 111 (3): 1340–8. Bibcode : 2002ASAJ..111.1340G. doi : 10.1121/1.1452740. PMID  11931311.
  137. ^ Ямагиши С., Оцука С., Фурукава С., Кашино М. (июль 2017 г.). «Сравнение перцептивных свойств слухового потока между спектральными и амплитудными модуляционными областями». Исследования слуха . 350 : 244–250. doi : 10.1016/j.heares.2017.03.006 . PMID  28323019.
  138. ^ Дэвид М., Лавандье М., Гримо Н., Оксенхэм А. Дж. (сентябрь 2017 г.). «Распознавание и поток речевых звуков на основе различий в интерауральных и спектральных сигналах». Журнал акустического общества Америки . 142 (3): 1674–1685. Bibcode : 2017ASAJ..142.1674D. doi : 10.1121/1.5003809. PMC 5617732. PMID  28964066 . 
  139. ^ ab Levi EC, Werner LA (1996). «Обнаружение амплитудной модуляции у младенцев: обновление данных о 3-месячных детях». Assoc. Res. Otolaryngol . 19 : 142.
  140. ^ Werner LA (октябрь 1996 г.). «Развитие слухового поведения (или что анатомы и физиологи должны объяснить)». Ухо и слух . 17 (5): 438–46. doi :10.1097/00003446-199610000-00010. PMID  8909892. S2CID  37813999.
  141. ^ Werner LA (апрель 1999). «Передняя маскировка среди младенцев и взрослых слушателей». Журнал Акустического общества Америки . 105 (4): 2445–53. Bibcode : 1999ASAJ..105.2445W. doi : 10.1121/1.426849. PMID  10212425.
  142. ^ ab Levi EC, Folsom RC, Dobie RA (сентябрь 1995 г.). «Анализ когерентности ответов, следующих за огибающей (EFRs) и ответов, следующих за частотой (FFRs) у младенцев и взрослых». Hearing Research . 89 (1–2): 21–7. doi :10.1016/0378-5955(95)00118-3. PMID  8600128. S2CID  4764350.
  143. ^ Levi EC, Folsom RC, Dobie RA (июнь 1993 г.). «Амплитудно-модуляционный ответ (AMFR): эффекты скорости модуляции, несущей частоты, возраста и состояния». Hearing Research . 68 (1): 42–52. doi :10.1016/0378-5955(93)90063-7. PMID  8376214. S2CID  4703747.
  144. ^ Холл Дж. У., Гроуз Дж. Х. (июль 1994 г.). «Развитие временного разрешения у детей, измеренное с помощью функции передачи временной модуляции». Журнал акустического общества Америки . 96 (1): 150–4. Bibcode : 1994ASAJ...96..150H. doi : 10.1121/1.410474. PMID  7598757.
  145. ^ Питер В., Вонг К., Нарн В.К., Шарма М., Пёрди С.К., Макмахон С. (февраль 2014 г.). «Оценка спектральной и временной обработки у детей и взрослых с использованием временной функции передачи модуляции (TMTF), восприятия итерированного пульсирующего шума (IRN) и спектральной рябистой дискриминации (SRD)». Журнал Американской академии аудиологии . 25 (2): 210–8. doi :10.3766/jaaa.25.2.9. PMID  24828221.
  146. ^ Вернер LA (2007). «Проблемы слухового развития человека». Журнал коммуникативных расстройств . 40 (4): 275–83. doi :10.1016/j.jcomdis.2007.03.004. PMC 1975821. PMID  17420028 . 
  147. ^ Buss E, Hall JW, Grose JH, Dev MB (август 1999). «Развитие производительности, подобной производительности взрослых, при обратной, одновременной и прямой маскировке». Журнал исследований речи, языка и слуха . 42 (4): 844–9. doi :10.1044/jslhr.4204.844. PMID  10450905.
  148. ^ Кабрера Л., Вернер Л. (июль 2017 г.). «Использование временных сигналов младенцами и взрослыми при различении согласных» (PDF) . Ухо и слух . 38 (4): 497–506. doi :10.1097/AUD.00000000000000422. PMC 5482774 . PMID  28338496. 
  149. ^ ab Bertoncini J, Serniclaes W, Lorenzi C (июнь 2009 г.). «Распознавание звуков речи на основе временной огибающей и тонких структурных сигналов у детей 5–7 лет». Журнал исследований речи, языка и слуха . 52 (3): 682–95. doi : 10.1044/1092-4388(2008/07-0273). PMID  18952853.
  150. ^ ab Le Prell CG (2012). Потеря слуха, вызванная шумом — научные достижения. Springer Handbook of Auditory Research. Springer. ISBN 9781441995223.
  151. ^ ab Manley GA (2017). Понимание улитки. Springer Handbook of Auditory Research. Springer. ISBN 9783319520711.
  152. ^ abc Kale S, Heinz MG (декабрь 2010 г.). «Кодирование огибающей в волокнах слухового нерва после потери слуха, вызванной шумом». Журнал Ассоциации исследований в области отоларингологии . 11 (4): 657–73. doi :10.1007/s10162-010-0223-6. PMC 2975881. PMID  20556628 . 
  153. ^ Zhong Z, Henry KS, Heinz MG (март 2014). «Сенсоневральная потеря слуха усиливает нейронное кодирование огибающей информации в центральной слуховой системе шиншилл». Hearing Research . 309 : 55–62. doi : 10.1016/j.heares.2013.11.006. PMC 3922929. PMID  24315815 . 
  154. ^ Kale S, Heinz MG (апрель 2012 г.). «Временные функции передачи модуляции, измеренные по реакциям слухового нерва после нейросенсорной потери слуха». Hearing Research . 286 (1–2): 64–75. doi :10.1016/j.heares.2012.02.004. PMC 3326227 . PMID  22366500. 
  155. ^ Генри КС, Кейл С, Хайнц МГ (2014-02-17). "Вызванная шумом потеря слуха увеличивает временную точность комплексного кодирования огибающей слуховыми нервными волокнами". Frontiers in Systems Neuroscience . 8 : 20. doi : 10.3389 /fnsys.2014.00020 . PMC 3925834. PMID  24596545. 
  156. ^ ab Ruggero MA, Rich NC (апрель 1991 г.). «Фуросемид изменяет механику кортиева органа: доказательства обратной связи наружных волосковых клеток с базилярной мембраной». Журнал нейронауки . 11 (4): 1057–67. doi :10.1523/JNEUROSCI.11-04-01057.1991. PMC 3580957. PMID  2010805 . 
  157. ^ Heinz MG, Young ED (февраль 2004 г.). «Рост ответа на уровень звука в волокнах слухового нерва после потери слуха, вызванной шумом». Журнал нейрофизиологии . 91 (2): 784–95. doi :10.1152/jn.00776.2003. PMC 2921373. PMID  14534289 . 
  158. ^ ab Moore BC, Glasberg BR (август 2001 г.). «Временные функции передачи модуляции, полученные с использованием синусоидальных носителей для нормально слышащих и слабослышащих слушателей». Журнал акустического общества Америки . 110 (2): 1067–73. Bibcode : 2001ASAJ..110.1067M. doi : 10.1121/1.1385177. PMID  11519575.
  159. ^ ab Füllgrabe C, Moore BC, Stone MA (2014). «Возрастные различия в распознавании речи, несмотря на соответствующий аудиометрически нормальный слух: вклад слуховой временной обработки и познания». Frontiers in Aging Neuroscience . 6 : 347. doi : 10.3389/fnagi.2014.00347 . PMC 4292733. PMID  25628563 . 
  160. ^ Wallaert N, Moore BC, Lorenzi C (июнь 2016 г.). «Сравнение эффектов возраста на амплитудную модуляцию и обнаружение частотной модуляции». Журнал акустического общества Америки . 139 (6): 3088–3096. Bibcode : 2016ASAJ..139.3088W. doi : 10.1121/1.4953019. PMID  27369130.
  161. ^ Bacon SP, Gleitman RM (июнь 1992 г.). «Обнаружение модуляции у субъектов с относительно плоской потерей слуха». Journal of Speech and Hearing Research . 35 (3): 642–53. doi :10.1044/jshr.3503.642. PMID  1608256.
  162. ^ Мур BC, Шейлер MJ, Шоневелдт GP (август 1992). «Функции передачи временной модуляции для шума с ограниченной полосой пропускания у субъектов с кохлеарной потерей слуха». British Journal of Audiology . 26 (4): 229–37. doi :10.3109/03005369209076641. PMID  1446186.
  163. ^ ab Schlittenlacher J, Moore BC (ноябрь 2016 г.). «Распознавание глубины амплитудной модуляции субъектами с нормальным и нарушенным слухом». Журнал акустического общества Америки . 140 (5): 3487–3495. Bibcode : 2016ASAJ..140.3487S. doi : 10.1121/1.4966117 . PMID  27908066.
  164. ^ Башкент Д. (ноябрь 2006 г.). «Распознавание речи при нормальном слухе и нейросенсорной тугоухости как функция количества спектральных каналов». Журнал акустического общества Америки . 120 (5): 2908–2925. Bibcode : 2006ASAJ..120.2908B. doi : 10.1121/1.2354017. PMID  17139748.
  165. ^ ab King A, Hopkins K, Plack CJ (январь 2014 г.). «Влияние возраста и потери слуха на межушную фазовую разницу». Журнал акустического общества Америки . 135 (1): 342–51. Bibcode : 2014ASAJ..135..342K. doi : 10.1121/1.4838995. PMID  24437774.
  166. ^ abc Derleth RP, Dau T, Kollmeier B (сентябрь 2001 г.). «Моделирование временных и компрессионных свойств нормальной и нарушенной слуховой системы». Hearing Research . 159 (1–2): 132–49. doi :10.1016/S0378-5955(01)00322-7. PMID  11520641. S2CID  1288804.
  167. ^ abcd Wallaert N, Moore BC, Ewert SD, Lorenzi C (февраль 2017 г.). «Сенсоневральная потеря слуха усиливает слуховую чувствительность и временную интеграцию для амплитудной модуляции». Журнал акустического общества Америки . 141 (2): 971–980. Bibcode : 2017ASAJ..141..971W. doi : 10.1121/1.4976080. PMID  28253641.
  168. ^ ab Jepsen ML, Dau T (январь 2011 г.). «Характеристика слуховой обработки и восприятия у отдельных слушателей с сенсоневральной потерей слуха». Журнал акустического общества Америки . 129 (1): 262–81. Bibcode : 2011ASAJ..129..262J. doi : 10.1121/1.3518768. PMID  21303008.
  169. ^ Ives DT, Kalluri S, Strelcyk O, Sheft S, Miermont F, Coez A, Bizaguet E, Lorenzi C (октябрь 2014 г.). «Влияние шумоподавления на восприятие AM для слушателей с нарушениями слуха». Журнал Ассоциации исследований в области отоларингологии . 15 (5): 839–48. doi :10.1007/s10162-014-0466-8. PMC 4164688. PMID  24899379 . 
  170. ^ Paul BT, Bruce IC, Roberts LE (февраль 2017 г.). «Доказательства того, что скрытая потеря слуха лежит в основе дефицита кодирования амплитудной модуляции у лиц с шумом в ушах и без него». Hearing Research . 344 : 170–182. doi :10.1016/j.heares.2016.11.010. PMID  27888040. S2CID  205103970.
  171. ^ Аслин Р. Н. (август 1989). «Распознавание частотных переходов человеческими младенцами». Журнал Акустического общества Америки . 86 (2): 582–90. Bibcode : 1989ASAJ...86..582A. doi : 10.1121/1.398237. PMID  2768673.
  172. ^ Colombo J, Horowitz FD (апрель 1986). «Внимание младенцев к частотно-модулированным разверткам». Child Development . 57 (2): 287–91. doi :10.2307/1130583. JSTOR  1130583. PMID  3956313.
  173. ^ Leibold LJ, Werner LA (2007-09-01). "Слуховая чувствительность младенцев к чистым тонам и частотно-модулированным тонам". Младенчество . 12 (2): 225–233. CiteSeerX 10.1.1.525.6267 . doi :10.1111/j.1532-7078.2007.tb00241.x. PMID  33412743. 
  174. ^ Доус П., Бишоп Д.В. (август 2008 г.). «Созревание визуальной и слуховой временной обработки у детей школьного возраста» (PDF) . Журнал исследований речи, языка и слуха . 51 (4): 1002–15. doi :10.1044/1092-4388(2008/073). PMID  18658067. S2CID  13953101.
  175. ^ Генри КС, Хайнц МГ (октябрь 2012 г.). «Уменьшение временного кодирования при нейросенсорной потере слуха возникает в фоновом шуме». Nature Neuroscience . 15 (10): 1362–4. doi :10.1038/nn.3216. PMC 3458164 . PMID  22960931. 
  176. ^ Henry KS, Kale S, Heinz MG (февраль 2016 г.). «Искаженное тонотопическое кодирование временной огибающей и тонкой структуры при потере слуха, вызванной шумом». The Journal of Neuroscience . 36 (7): 2227–37. doi :10.1523/JNEUROSCI.3944-15.2016. PMC 4756156. PMID  26888932 . 
  177. ^ ab Moore BC, Peters RW (май 1992). «Распознавание высоты тона и фазовая чувствительность у молодых и пожилых людей и их связь с частотной селективностью». Журнал акустического общества Америки . 91 (5): 2881–93. Bibcode : 1992ASAJ...91.2881M. doi : 10.1121/1.402925. PMID  1629481.
  178. ^ ab Moore BC (2008). Moore BC (ред.). Кохлеарная потеря слуха: физиологические, психологические и технические проблемы (второе изд.). Wiley Online Library. doi :10.1002/9780470987889. ISBN 9780470987889. S2CID  142251782.
  179. ^ Хопкинс К, Мур BC (август 2007 г.). «Умеренная кохлеарная потеря слуха приводит к снижению способности использовать временную тонкую структурную информацию». Журнал Акустического общества Америки . 122 (2): 1055–68. Bibcode : 2007ASAJ..122.1055H. doi : 10.1121/1.2749457. PMID  17672653.
  180. ^ Мур BC, Скродзка E (январь 2002 г.). «Обнаружение частотной модуляции слушателями с нарушением слуха: эффекты несущей частоты, скорости модуляции и добавленной амплитудной модуляции». Журнал акустического общества Америки . 111 (1 Pt 1): 327–35. Bibcode : 2002ASAJ..111..327M. doi : 10.1121/1.1424871. PMID  11833538.
  181. ^ Grose JH, Mamo SK (декабрь 2012 г.). «Обнаружение частотной модуляции как мера временной обработки: возрастные моноуральные и бинауральные эффекты». Hearing Research . 294 (1–2): 49–54. doi :10.1016/j.heares.2012.09.007. PMC 3505233 . PMID  23041187. 
  182. ^ abc Santurette S, Dau T (январь 2007 г.). «Бинауральное восприятие высоты тона у нормально слышащих и слабослышащих слушателей». Hearing Research . 223 (1–2): 29–47. doi :10.1016/j.heares.2006.09.013. PMID  17107767. S2CID  6209193.
  183. ^ Grose JH, Mamo SK (декабрь 2010 г.). «Обработка временной тонкой структуры как функция возраста». Ухо и слух . 31 (6): 755–60. doi :10.1097/AUD.0b013e3181e627e7. PMC 2966515. PMID  20592614 . 
  184. ^ ab Lopez-Poveda EA, Barrios P ​​(2013-07-16). "Восприятие стохастически недостаточно дискретизированных звуковых волн: модель слуховой деафферентации". Frontiers in Neuroscience . 7 : 124. doi : 10.3389/fnins.2013.00124 . PMC 3712141. PMID  23882176. 
  185. ^ Young ED, Sachs MB (ноябрь 1979). «Представление устойчивых гласных во временных аспектах паттернов разряда популяций волокон слухового нерва». Журнал акустического общества Америки . 66 (5): 1381–1403. Bibcode : 1979ASAJ...66.1381Y. doi : 10.1121/1.383532. PMID  500976.
  186. ^ Zeng FG, Kong YY, Michalewski HJ, Starr A (июнь 2005 г.). «Перцептивные последствия нарушенной активности слухового нерва». Журнал нейрофизиологии . 93 (6): 3050–63. doi :10.1152/jn.00985.2004. PMID  15615831. S2CID  8628394.
  187. ^ Pichora-Fuller MK, Schneider BA, Macdonald E, Pass HE, Brown S (январь 2007 г.). «Временное дрожание нарушает разборчивость речи: моделирование слухового старения». Hearing Research . 223 (1–2): 114–21. doi :10.1016/j.heares.2006.10.009. PMID  17157462. S2CID  6541722.
  188. ^ Лопес-Поведа EA (2014-10-30). «Почему я слышу, но не понимаю? Стохастическая субдискретизация как модель деградированного нейронного кодирования речи». Frontiers in Neuroscience . 8 : 348. doi : 10.3389/fnins.2014.00348 . PMC 4214224. PMID  25400543 . 
  189. ^ Фаулер Э. П. (1936-12-01). «Метод раннего выявления отосклероза: исследование звуков, значительно превышающих порог». Архивы отоларингологии–хирургии головы и шеи . 24 (6): 731–741. doi :10.1001/archotol.1936.00640050746005.
  190. ^ Мур BC (июнь 2004 г.). «Проверка концепции невосприятия мягкости: громкость около порога для ушей с нарушением слуха». Журнал Акустического общества Америки . 115 (6): 3103–11. Bibcode : 2004ASAJ..115.3103M. doi : 10.1121/1.1738839 . PMID  15237835.
  191. ^ Stone MA, Moore BC (декабрь 1992 г.). «Силлабическая компрессия: эффективные коэффициенты компрессии для сигналов, модулированных с разной скоростью». British Journal of Audiology . 26 (6): 351–61. doi :10.3109/03005369209076659. PMID  1292819.
  192. ^ Plomp R (июнь 1988). «Отрицательный эффект амплитудной компрессии в многоканальных слуховых аппаратах в свете функции модуляции-передачи». Журнал акустического общества Америки . 83 (6): 2322–7. Bibcode : 1988ASAJ...83.2322P. doi : 10.1121/1.396363 . PMID  3411024.
  193. ^ Stone MA, Moore BC (март 2007 г.). «Количественная оценка эффектов быстродействующей компрессии на огибающую речи». Журнал акустического общества Америки . 121 (3): 1654–64. Bibcode : 2007ASAJ..121.1654S. doi : 10.1121/1.2434754. PMID  17407902.
  194. ^ Bacon S (2004). Компрессия: от улитки до кохлеарных имплантов. Springer Handbook of Auditory Research. Springer. ISBN 9780387004969.
  195. ^ Boyle PJ, Büchner A, Stone MA, Lenarz T, Moore BC (апрель 2009 г.). «Сравнение систем с двойной постоянной времени и быстродействующей автоматической регулировкой усиления (AGC) в кохлеарных имплантах». International Journal of Audiology . 48 (4): 211–21. doi :10.1080/14992020802581982. PMID  19363722. S2CID  2235920.
  196. ^ Clark GM, Blamey PJ, Brown AM, Gusby PA, Dowell RC, Franz BK, Pyman BC, Shepherd RK, Tong YC, Webb RL (1987). «Университет Мельбурна — многоэлектродный кохлеарный имплантат ядра». Достижения в области оториноларингологии . 38 : V–IX, 1–181. doi :10.1159/000414597. PMID  3318305.
  197. ^ Başkent D, Gaudrain E, Tamati TN, Wagner A (2016). «Глава 12: Восприятие и психоакустика речи у пользователей кохлеарных имплантов». В Cacace AT, de Kleine E, Holt AG, van Dijk P (ред.). Научные основы аудиологии: перспективы из физики, биологии, моделирования и медицины . Сан-Диего, Калифорния: Plural Publishing, Inc. стр. 285–319. ISBN 978-1-59756-652-0.
  198. ^ Bierer JA, Faulkner KF (апрель 2010 г.). «Определение каналов кохлеарной имплантации с плохим интерфейсом электрод-нейрон: частичные триполярные, одноканальные пороги и психофизические кривые настройки». Ухо и слух . 31 (2): 247–58. doi : 10.1097 /AUD.0b013e3181c7daf4. PMC 2836401. PMID  20090533. 
  199. ^ Lazard DS, Vincent C, Venail F, Van de Heyning P, Truy E, Sterkers O и др. (ноябрь 2012 г.). «Пред-, пред- и послеоперационные факторы, влияющие на производительность постлингвистически глухих взрослых, использующих кохлеарные имплантаты: новая концептуальная модель с течением времени». PLOS ONE . ​​7 (11): e48739. Bibcode :2012PLoSO...748739L. doi : 10.1371/journal.pone.0048739 . PMC 3494723 . PMID  23152797. 
  200. ^ Holden LK, Firszt JB, Reeder RM, Uchanski RM, Dwyer NY, Holden TA (декабрь 2016 г.). «Факторы, влияющие на результаты у реципиентов кохлеарных имплантов с имплантированной перимодиолярной электродной решеткой, расположенной в барабанной лестнице». Отология и невротология . 37 (10): 1662–1668. doi :10.1097/MAO.0000000000001241. PMC 5113723. PMID  27755365 . 
  201. ^ Boyle PJ, Nunn TB, O'Connor AF, Moore BC (март 2013 г.). «STARR: речевой тест для оценки эффективности слуховых протезов в реалистичных условиях». Ухо и слух . 34 (2): 203–12. doi :10.1097/AUD.0b013e31826a8e82. PMID  23135616. S2CID  11733708.
  202. ^ Won JH, Drennan WR, Nie K, Jameyson EM, Rubinstein JT (июль 2011 г.). «Обнаружение акустической временной модуляции и восприятие речи у слушателей с кохлеарными имплантами». Журнал акустического общества Америки . 130 (1): 376–88. Bibcode : 2011ASAJ..130..376W. doi : 10.1121/1.3592521. PMC 3155593. PMID  21786906 . 
  203. ^ Fu QJ (сентябрь 2002 г.). «Временная обработка и распознавание речи у пользователей кохлеарных имплантов». NeuroReport . 13 (13): 1635–9. doi :10.1097/00001756-200209160-00013. PMID  12352617. S2CID  44385994.
  204. ^ Friesen LM, Shannon RV, Baskent D, Wang X (август 2001 г.). «Распознавание речи в шуме как функция количества спектральных каналов: сравнение акустического слуха и кохлеарных имплантов». Журнал акустического общества Америки . 110 (2): 1150–63. Bibcode : 2001ASAJ..110.1150F. doi : 10.1121/1.1381538. PMID  11519582.
  205. ^ Мур DR, Шеннон RV (июнь 2009). «За пределами кохлеарных имплантатов: пробуждение оглохшего мозга». Nature Neuroscience . 12 (6): 686–91. doi :10.1038/nn.2326. PMID  19471266. S2CID  35141874.
  206. ^ Stickney GS, Zeng FG, Litovsky R, Assmann P (август 2004 г.). «Распознавание речи кохлеарного импланта с речевыми масками». Журнал акустического общества Америки . 116 (2): 1081–91. Bibcode : 2004ASAJ..116.1081S. doi : 10.1121/1.1772399. PMID  15376674.
  207. ^ Blamey P, Artieres F, Başkent D, Bergeron F, Beynon A, Burke E и др. (2013). «Факторы, влияющие на слуховые характеристики постлингвистически глухих взрослых, использующих кохлеарные имплантаты: обновление с 2251 пациентами» (PDF) . Аудиология и нейроотология . 18 (1): 36–47. doi :10.1159/000343189. PMID  23095305. S2CID  4668675.
  208. ^ Башкент Д., Кларк Дж., Палс К., Бенард М. Р., Бхаргава П., Сайя Дж., Сарампалис А., Вагнер А., Годрейн Э. (октябрь 2016 г.). «Когнитивная компенсация восприятия речи при нарушении слуха, кохлеарных имплантатах и ​​старении». Тенденции в области слуха . 20 : 233121651667027. doi :10.1177/2331216516670279. PMC 5056620 . 
  209. ^ Pfingst BE, Burkholder-Juhasz RA, Xu L, Thompson CS (февраль 2008 г.). «Межсайтовые паттерны обнаружения модуляции у слушателей с кохлеарными имплантами». Журнал акустического общества Америки . 123 (2): 1054–62. Bibcode : 2008ASAJ..123.1054P. doi : 10.1121/1.2828051. PMC 2431465. PMID  18247907 . 
  210. ^ ab Chatterjee M, Oberzut C (сентябрь 2011 г.). «Обнаружение и различение скорости амплитудной модуляции при электрическом слухе». Журнал Акустического общества Америки . 130 (3): 1567–80. Bibcode : 2011ASAJ..130.1567C. doi : 10.1121/1.3621445. PMC 3188971. PMID  21895095 . 
  211. ^ Shannon RV (апрель 1992 г.). «Временные функции передачи модуляции у пациентов с кохлеарными имплантами». Журнал акустического общества Америки . 91 (4 Pt 1): 2156–64. Bibcode : 1992ASAJ...91.2156S. doi : 10.1121/1.403807. PMID  1597606.
  212. ^ Cazals Y, Pelizzone M, Saudan O, Boex C (октябрь 1994 г.). «Низкочастотная фильтрация при обнаружении амплитудной модуляции, связанная с идентификацией гласных и согласных у субъектов с кохлеарными имплантами». Журнал акустического общества Америки . 96 (4): 2048–54. Bibcode : 1994ASAJ...96.2048C. doi : 10.1121/1.410146. PMID  7963020.
  213. ^ Cooper WB, Tobey E, Loizou PC (август 2008 г.). «Восприятие музыки кохлеарным имплантом и нормально слышащими слушателями по результатам измерений с помощью Монреальской батареи для оценки амузии». Ухо и слух . 29 (4): 618–26. doi :10.1097/AUD.0b013e318174e787. PMC 2676841. PMID  18469714. 
  214. ^ Galvin JJ, Fu QJ, Nogaki G (июнь 2007 г.). «Идентификация мелодического контура слушателями кохлеарных имплантов». Ухо и слух . 28 (3): 302–19. doi :10.1097/01.aud.0000261689.35445.20. PMC 3627492. PMID  17485980 . 
  215. ^ Fu QJ, Chinchilla S, Nogaki G, Galvin JJ (сентябрь 2005 г.). «Голосовая гендерная идентификация пользователей кохлеарных имплантов: роль спектрального и временного разрешения». Журнал акустического общества Америки . 118 (3 Pt 1): 1711–8. Bibcode : 2005ASAJ..118.1711F. doi : 10.1121/1.1985024. PMID  16240829.
  216. ^ Fuller CD, Gaudrain E, Clarke JN, Galvin JJ, Fu QJ, Free RH, Başkent D (декабрь 2014 г.). «Гендерная категоризация является ненормальной у пользователей кохлеарных имплантов». Журнал Ассоциации исследований в области отоларингологии . 15 (6): 1037–48. doi : 10.1007/s10162-014-0483-7. PMC 4389960. PMID  25172111. 
  217. ^ Peng SC, Lu HP, Lu N, Lin YS, Deroche ML, Chatterjee M (май 2017 г.). «Обработка акустических сигналов при лексико-тональной идентификации детьми с кохлеарными имплантами». Журнал исследований речи, языка и слуха . 60 (5): 1223–1235. doi :10.1044/2016_JSLHR-S-16-0048. PMC 5755546. PMID  28388709 . 
  218. ^ Ван В, Чжоу Н, Сюй Л (апрель 2011 г.). «Восприятие музыкальной высоты и лексического тона с кохлеарными имплантами». Международный журнал аудиологии . 50 (4): 270–8. doi :10.3109/14992027.2010.542490. PMC 5662112. PMID  21190394 . 
  219. ^ Чаттерджи М., Пэн СК (январь 2008 г.). «Обработка F0 с помощью кохлеарных имплантов: различение частоты модуляции и распознавание интонации речи». Hearing Research . 235 (1–2): 143–56. doi :10.1016/j.heares.2007.11.004. PMC 2237883 . PMID  18093766. 
  220. ^ Fu QJ, Galvin JJ (декабрь 2007 г.). «Распознавание вокальных эмоций нормально слышащими слушателями и пользователями кохлеарных имплантов». Trends in Amplification . 11 (4): 301–15. doi :10.1177/1084713807305301. PMC 4111530. PMID  18003871 . 
  221. ^ Chatterjee M, Zion DJ, Deroche ML, Burianek BA, Limb CJ, Goren AP, Kulkarni AM, Christensen JA (апрель 2015 г.). «Распознавание эмоций голоса детьми с кохлеарной имплантацией и их нормально слышащими сверстниками». Hearing Research . 322 : 151–62. doi :10.1016/j.heares.2014.10.003. PMC 4615700. PMID  25448167 . 
  222. ^ Чаттерджи М., Оба СИ. (декабрь 2004 г.). «Взаимодействие огибающей канала и канала у слушателей с кохлеарными имплантами». Журнал Ассоциации исследований в области отоларингологии . 5 (4): 360–75. doi :10.1007/s10162-004-4050-5. PMC 2504569. PMID  15675001 . 
  223. ^ Чаттерджи М., Кулкарни А.М. (февраль 2018 г.). «Помехи обнаружения модуляции у слушателей кохлеарных имплантов в условиях прямой маскировки». Журнал акустического общества Америки . 143 (2): 1117–1127. Bibcode : 2018ASAJ..143.1117C. doi : 10.1121/1.5025059. PMC 5821512. PMID  29495705 . 
  224. ^ Alcántara JL, Moore BC, Kühnel V, Launer S (январь 2003 г.). «Оценка системы шумоподавления в коммерческом цифровом слуховом аппарате». International Journal of Audiology . 42 (1): 34–42. doi :10.3109/14992020309056083. PMID  12564514. S2CID  8131281.
  225. ^ Мур BC (март 2003 г.). «Кодирование звуков в слуховой системе и его значение для обработки сигналов и кодирования в кохлеарных имплантатах». Отология и невротология . 24 (2): 243–54. doi :10.1097/00129492-200303000-00019. PMID  12621339. S2CID  16232602.
  226. ^ Rader T, Döge J, Adel Y, Weissgerber T, Baumann U (сентябрь 2016 г.). «Зависящие от места частоты стимуляции улучшают восприятие высоты тона у пациентов с кохлеарными имплантами и односторонней глухотой». Hearing Research . 339 : 94–103. doi :10.1016/j.heares.2016.06.013. PMID  27374479. S2CID  4853875.
  227. ^ Рой АТ, Карвер С, Джирадейвонг П, Лимб КДЖ (октябрь 2015 г.). «Качество музыкального звука у пользователей кохлеарных имплантов: сравнение восприятия низких частот между обработкой тонкой структуры и стратегиями непрерывной чередующейся выборки высокой четкости». Ухо и слух . 36 (5): 582–90. doi :10.1097/AUD.00000000000000170. PMID  25906173. S2CID  35712387.
  228. ^ Fitzgerald MB, Wright BA (февраль 2011 г.). «Перцептивное обучение и обобщение в результате обучения задаче обнаружения слуховой амплитудной модуляции». Журнал акустического общества Америки . 129 (2): 898–906. Bibcode : 2011ASAJ..129..898F. doi : 10.1121/1.3531841. PMC 3070992. PMID  21361447. 
  229. ^ Fitzgerald MB, Wright BA (декабрь 2005 г.). «Исследование перцептивного обучения высоте звука, вызванной амплитудно-модулированным шумом». Журнал акустического общества Америки . 118 (6): 3794–803. Bibcode : 2005ASAJ..118.3794F. doi : 10.1121/1.2074687. PMID  16419824.
  230. ^ ab Sabin AT, Eddins DA, Wright BA (май 2012). «Доказательства перцептивного обучения для настройки на спектрально-временную модуляцию в слуховой системе человека». Журнал нейронауки . 32 (19): 6542–9. doi :10.1523/JNEUROSCI.5732-11.2012. PMC 3519395. PMID  22573676 . 
  231. ^ Joosten ER, Shamma SA, Lorenzi C, Neri P (июль 2016 г.). «Динамическое повторное взвешивание фильтров слуховой модуляции». PLOS Computational Biology . 12 (7): e1005019. Bibcode : 2016PLSCB..12E5019J. doi : 10.1371/journal.pcbi.1005019 . PMC 4939963. PMID  27398600 . 
  232. ^ Aizawa N, Eggermont JJ ​​(март 2006 г.). «Влияние потери слуха, вызванной шумом, в молодом возрасте на время возникновения голоса и представления о разрывах в шуме в первичной слуховой коре у взрослых кошек». Журнал Ассоциации исследований в области отоларингологии . 7 (1): 71–81. doi : 10.1007/s10162-005-0026-3. PMC 2504589. PMID  16408166. 
  233. ^ Rosen MJ, Sarro EC, Kelly JB, Sanes DH (2012-07-26). «Сниженная поведенческая и нейронная чувствительность к звуковой модуляции связана с умеренной потерей слуха в процессе развития». PLOS ONE . ​​7 (7): e41514. Bibcode :2012PLoSO...741514R. doi : 10.1371/journal.pone.0041514 . PMC 3406049 . PMID  22848517. 
  234. ^ Caras ML, Sanes DH (июль 2015 г.). «Устойчивые дефициты восприятия из-за временной сенсорной депривации». Журнал нейронауки . 35 (30): 10831–42. doi :10.1523/JNEUROSCI.0837-15.2015. PMC 4518056. PMID  26224865 . 
  235. ^ Zhou X, Merzenich MM (май 2012). «Воздействие окружающего шума ухудшает нормальные процессы слушания». Nature Communications . 3 : 843. Bibcode : 2012NatCo...3..843Z. doi : 10.1038/ncomms1849 . PMID  22588305.
  236. ^ Bao S, Chang EF, Woods J, Merzenich MM (сентябрь 2004 г.). «Временная пластичность в первичной слуховой коре, вызванная оперантным перцептивным обучением». Nature Neuroscience . 7 (9): 974–81. doi :10.1038/nn1293. PMID  15286790. S2CID  8038109.
  237. ^ Kilgard MP, Merzenich MM (декабрь 1998 г.). «Пластичность временной обработки информации в первичной слуховой коре». Nature Neuroscience . 1 (8): 727–31. doi :10.1038/3729. PMC 2948964 . PMID  10196590. 
  238. ^ Андерсон С., Уайт-Швох Т., Чой Х.Дж. , Краус Н. (2013). «Обучение изменяет обработку речевых сигналов у пожилых людей с потерей слуха». Frontiers in Systems Neuroscience . 7 : 97. doi : 10.3389/fnsys.2013.00097 . PMC 3842592. PMID  24348347. 
  239. ^ Wong PC, Skoe E, Russo NM, Dees T, Kraus N (апрель 2007 г.). «Музыкальный опыт формирует кодирование стволом мозга человека языковых паттернов высоты тона». Nature Neuroscience . 10 (4): 420–2. doi :10.1038/nn1872. PMC 4508274 . PMID  17351633. 
  240. ^ Перес Э., МакКормак А., Эдмондс БА (2014). «Чувствительность к тонкой временной структуре и результаты использования слуховых аппаратов у пожилых людей». Frontiers in Neuroscience . 8 : 7. doi : 10.3389/fnins.2014.00007 . PMC 3914396. PMID  24550769 . 
  241. ^ Рённберг Дж, Луннер Т, Нг ЭХ, Лидестам Б, Зеквельд А.А., Сёрквист П, Ликселл Б, Трефф Ю, Юмба В, Классон Е, Хеллгрен М, Ларсби Б, Синьоре С, Пичора-Фуллер М.К., Руднер М, Даниэльссон Х , Стенфельт С. (ноябрь 2016 г.). «Нарушение слуха, когнитивные способности и понимание речи: исследовательский факторный анализ комплексного набора тестов для группы пользователей слуховых аппаратов, исследование n200». Международный журнал аудиологии . 55 (11): 623–42. дои : 10.1080/14992027.2016.1219775. ПМК 5044772 . ПМИД  27589015. 
  242. ^ Мур BC, Сек А (сентябрь 2016 г.). «Предпочтительная скорость сжатия для речи и музыки и ее связь с чувствительностью к тонкой временной структуре». Тенденции в слухе . 20 : 233121651664048. doi :10.1177/2331216516640486. PMC 5017572. PMID  27604778 . 
  243. ^ Бернстайн Дж. Г., Даниэльссон Х., Хеллгрен М., Стенфельт С., Рённберг Дж., Луннер Т. (ноябрь 2016 г.). «Спектрально-временная модуляционная чувствительность как предиктор эффективности восприятия речи в шуме с помощью слуховых аппаратов». Тенденции в слухе . 20 : 233121651667038. doi :10.1177/2331216516670387. PMC 5098798. PMID  27815546 . 
  244. ^ Sęk A, Moore BC (январь 2012 г.). «Внедрение двух тестов для измерения чувствительности к тонкой временной структуре». International Journal of Audiology . 51 (1): 58–63. doi :10.3109/14992027.2011.605808. PMID  22050366. S2CID  2954679.
  245. ^ Мур BC, Викерс DA, Мехта A (октябрь 2012 г.). «Влияние возраста на чувствительность тонкой временной структуры в моно- и бинауральных условиях». Международный журнал аудиологии . 51 (10): 715–21. doi :10.3109/14992027.2012.690079. PMID  22998412. S2CID  29277736.
  246. ^ Füllgrabe C (декабрь 2013 г.). «Возрастные изменения в обработке тонкой временной структуры при отсутствии периферической потери слуха». American Journal of Audiology . 22 (2): 313–5. doi :10.1044/1059-0889(2013/12-0070). PMID  23975124.
  247. ^ Santurette S, Dau T (апрель 2012 г.). «Связь бинаурального восприятия высоты тона с индивидуальным слуховым профилем слушателя» (PDF) . Журнал Акустического общества Америки . 131 (4): 2968–86. Bibcode : 2012ASAJ..131.2968S. doi : 10.1121/1.3689554. PMID  22501074. S2CID  206468031.
  248. ^ Хопкинс К, Мур BC (декабрь 2010 г.). «Разработка быстрого метода измерения чувствительности к временной тонкой структурной информации на низких частотах». Международный журнал аудиологии . 49 (12): 940–6. doi :10.3109/14992027.2010.512613. PMID  20874427. S2CID  46058919.
  249. ^ Füllgrabe C, Harland AJ, Sęk AP, Moore BC (декабрь 2017 г.). «Разработка метода определения бинауральной чувствительности к тонкой временной структуре» (PDF) . International Journal of Audiology . 56 (12): 926–935. doi : 10.1080/14992027.2017.1366078 . PMID  28859494.
  250. ^ Füllgrabe C, Moore BC (январь 2017 г.). «Оценка метода определения бинауральной чувствительности к тонкой временной структуре (тест TFS-AF) для пожилых слушателей с нормальным и нарушенным низкочастотным слухом». Trends in Hearing . 21 : 2331216517737230. doi : 10.1177/2331216517737230. PMC 5669320. PMID  29090641 . 
  251. ^ ab Кейтс Дж. М., Арехарт К. Х. (апрель 2005 г.). «Связность и индекс разборчивости речи». Журнал Акустического общества Америки . 117 (4 Pt 1): 2224–37. Bibcode : 2005ASAJ..117.2224K. doi : 10.1121/1.1862575. PMID  15898663.
  252. ^ Arehart KH, Kates JM, Anderson MC (июнь 2010 г.). «Влияние шума, нелинейной обработки и линейной фильтрации на воспринимаемое качество речи». Ear and Hearing . 31 (3): 420–36. doi :10.1097/AUD.0b013e3181d3d4f3. PMID  20440116. S2CID  34271886.
  253. ^ abc Taal CH, Hendriks RC, Heusdens R, Jensen J (сентябрь 2011 г.). «Алгоритм прогнозирования разборчивости зашумленной речи с весовым коэффициентом по времени и частоте». Труды IEEE по обработке звука, речи и языка . 19 (7): 2125–2136. doi :10.1109/tasl.2011.2114881. S2CID  13972181.
  254. ^ Croghan NB, Arehart KH, Kates JM (сентябрь 2014 г.). «Музыкальные предпочтения при использовании слуховых аппаратов: влияние свойств сигнала, настроек компрессии и характеристик слушателя». Ear and Hearing . 35 (5): e170–84. doi :10.1097/AUD.00000000000000056. PMID  25010635. S2CID  10459417.
  255. ^ ab Арехарт К, Соуза П, Кейтс Дж, Ланнер Т, Педерсен М.С. (2015). «Связь между точностью сигнала, потерей слуха и рабочей памятью для цифрового шумоподавления». Ухо и слух . 36 (5): 505–16. doi :10.1097/aud.00000000000000173. PMC 4549215. PMID  25985016 . 
  256. ^ Картер, Г.; Кнапп, К.; Наттолл, А. (август 1973 г.). «Оценка функции квадрата когерентности с помощью перекрывающейся быстрой обработки преобразования Фурье». Труды IEEE по аудио и электроакустике . 21 (4): 337–344. doi :10.1109/TAU.1973.1162496.
  257. ^ Arehart KH, Kates JM, Anderson MC, Harvey LO (август 2007 г.). «Влияние шума и искажений на суждения о качестве речи у нормально слышащих и слабослышащих слушателей». Журнал акустического общества Америки . 122 (2): 1150–64. Bibcode : 2007ASAJ..122.1150A. doi : 10.1121/1.2754061. PMID  17672661.
  258. ^ Tan CT, Moore BC (май 2008). «Восприятие нелинейных искажений людьми с нарушением слуха». Международный журнал аудиологии . 47 (5): 246–56. doi :10.1080/14992020801945493. PMID  18465409. S2CID  28018246.
  259. ^ Houtgast, T.; Steeneken, HJM (март 1985). «Обзор концепции MTF в акустике помещений и ее использование для оценки разборчивости речи в аудиториях». Журнал акустического общества Америки . 77 (3): 1069–1077. Bibcode : 1985ASAJ...77.1069H. doi : 10.1121/1.392224 .
  260. ^ Hohmann V, Kollmeier B (февраль 1995). «Влияние многоканальной динамической компрессии на разборчивость речи». Журнал акустического общества Америки . 97 (2): 1191–5. Bibcode : 1995ASAJ...97.1191H. doi : 10.1121/1.413092 . PMID  7876441.
  261. ^ Goldsworthy RL, Greenberg JE (декабрь 2004 г.). «Анализ методов индекса передачи речи на основе речи с учетом нелинейных операций». Журнал акустического общества Америки . 116 (6): 3679–89. Bibcode : 2004ASAJ..116.3679G. doi : 10.1121/1.1804628. PMID  15658718.
  262. ^ Ludvigsen C, Elberling C, Keidser G, Poulsen T (1990). «Прогнозирование разборчивости нелинейно обработанной речи». Acta Oto-Laryngologica. Supplementum . 469 : 190–5. doi :10.1080/00016489.1990.12088428. PMID  2356726.
  263. ^ abc Кейтс, Джеймс М.; Арехарт, Кэтрин Х. (ноябрь 2014 г.). «Индекс восприятия речи с помощью слухового аппарата (HASPI)». Речевая коммуникация . 65 : 75–93. doi :10.1016/j.specom.2014.06.002.
  264. ^ Chi T, Gao Y, Guyton MC, Ru P, Shamma S (ноябрь 1999 г.). «Функции передачи спектрально-временной модуляции и разборчивость речи». Журнал Акустического общества Америки . 106 (5): 2719–32. Bibcode : 1999ASAJ..106.2719C. doi : 10.1121/1.428100. hdl : 1903/6121 . PMID  10573888.
  265. ^ Хубер, Р.; Коллмейер, Б. (ноябрь 2006 г.). «PEMO-Q — новый метод объективной оценки качества звука с использованием модели слухового восприятия». Труды IEEE по обработке звука, речи и языка . 14 (6): 1902–1911. doi :10.1109/TASL.2006.883259. S2CID  7815134.
  266. ^ Huber R, Parsa V, Scollie S (2014-11-17). "Прогнозирование воспринимаемого качества звука частотно-сжатой речи". PLOS ONE . 9 (11): e110260. Bibcode : 2014PLoSO...9k0260H. doi : 10.1371/journal.pone.0110260 . PMC 4234248. PMID  25402456 . 
  267. ^ ab Кейтс Дж., Арехарт К. (2014-03-20). «Индекс качества речи слуховых аппаратов (HASQI) версии 2». Журнал Общества инженеров-аудиотехников . 62 (3): 99–117. doi :10.17743/jaes.2014.0006. ISSN  1549-4950.
  268. ^ Кейтс Дж., Арехарт К. (20 марта 2014 г.). «Индекс качества речи в слуховых аппаратах (HASQI) версии 2». Журнал Общества инженеров-аудиотехников . 62 (3): 99–117. doi :10.17743/jaes.2014.0006.
  269. ^ Кейтс Дж. М., Арехарт К. Х. (февраль 2016 г.). «Индекс качества звука слухового аппарата (HAAQI)». Труды IEEE/ACM по обработке звука, речи и языка . 24 (2): 354–365. doi :10.1109/taslp.2015.2507858. PMC 4849486. PMID  27135042 . 
  270. ^ Кейтс Дж. (2013). Аудиальная модель для прогнозирования разборчивости и качества . Труды совещаний по акустике. Т. 133. Акустическое общество Америки. стр. 050184. Bibcode : 2013ASAJ..133.3560K. doi : 10.1121/1.4799223 .