Энциклопедия по машиностроению XXL

Оборудование, материаловедение, механика и ...

Статьи Чертежи Таблицы О сайте Реклама

Звуки речи

Задачи классификации в такой постановке являются по сути дела задачами распознавания образов [78], точнее, распознавания звуковых образов (центральная задача в этой области науки — автоматическое распознавание звуков речи) [233, 237]. Обычный подход при их решении состоит в следующем. Совокупность признаков акустического сигнала А, 2, Ап) образует так называемое изображение (и-мерный вектор), в отличие от образа, которому отвечает состояние машины или механизма, В г-мерном пространстве изображений образам соответствуют компактные области. Задача состоит в том, чтобы на основе той или иной меры сходства изображений определить эти области. Часто каждому образу ставится в соответствие эталонное изображение. Тогда исследуемое изображение сравнивается со всеми эталонами и относится к образу, чей эталон оказался ближе других в смысле выбранной меры сходства.  [c.17]


Знание ряда тонких свойств слуха необходимо и для понимания того, какие составляющие звуков речи являются информативными, какие искажения сигнала, передаваемого электроакустическими трактами, заметны на слух и как это связывается с разборчивостью или с художественностью передачи. Наконец, слуховой аппарат человека в целом с его механизмом передачи акустических колебаний к нервным окончаниям слухового нерва, функциональной схемой слухового нерва и слуховых центров мозга пред-  [c.10]

Г. Ом впервые высказал мысль, что простое слуховое ощу щение возникает лишь при слушании чисто синусоидального колебания. Как только форма колебания усложняется, появляются гармоники — так возникают впечатления окраски звука или тембра, как говорят музыканты. Ому удалось установить, что ухо как бы анализирует периодический звук по отдельным гармоническим составляющим, и эти составляющие вызывают раздельные ощущения. При определенной тренировке и длительном вслушивании можно мысленно разделить сложное периодическое колебание и определить, какие гармоники в данном звуке присутствуют. Особенность слуха воспринимать сложную форму периодических звуков как окраску или тембр широко используется в музыке. Она послужила основой создания многообразных музыкальных инструментов. Способность различения тембра тесно связана также с нашей способностью различать звуки речи. Гельмгольц, основоположник резонансной теории слуха, исходил при ее создании из акустического закона Ома, гласящего, что ухо способно разложить сложный звук на составляющие его простые (синусоидальные) тоны.  [c.27]

Специальные измерения показывают, что различные музыкальные инструменты излучают звуки в широком диапазоне частот от 15 до 15 000 Гц. Некоторые звуки, например, звон ключей или шипящие звуки речи, содержат даже ультразвуковые частоты в области 20—25 кГц. Пиковые уровни звуковых давлений, т. е. уровни, которые измеряются приборами с постоянной времени около  [c.126]

Речь с физической точки зрения состоит из последовательности звуков речи с паузами между их группами. При нормальном темпе речи паузы появляются между отрывками фраз, так как при этом слова произносятся слитно (хотя слух, как правило, воспринимает слова по отдельности). При замедленном темпе речи, например при диктовке, паузы могут делаться между словами и даже их частями. Предлоги, союзы звучат всегда слитно с последующим словом.  [c.45]

Один и тот же звук речи разные люди произносят по-разному, каждому человеку свойственна своя манера произнесения звуков речи (своего рода устный почерк). Произношение звуков речи зависит от ударения, соседних звуков и т. п. Но при всем многообразии в их произношении они являются физическими реализациями (произнесением) ограниченного числа обобщенных звуков речи, называемых фонемами. Фонема — это то, что человек хочет произнести,. а звук речи — это то, что человек фактически произносит. Фонема по отношению к звуку речи играет ту же роль, что и образцовая буква (например, курсивная) по отношению к ее рукописной форме в конкретном написании.  [c.45]


Звуки речи неодинаково информативны. Так, гласные звуки содержат малую информацию о смысле речи, а глухие согласные наиболее информативны (например, в слове посылка последовательность о, ы, а ничего не говорит, а п, с, лк дает почти однозначный ответ о смысле. Поэтому разборчивость речи снижается при действии шумов, в первую очередь из-за маскировки глухих звуков.  [c.46]

Образование звуков речи происходит путем подачи команд к мускулам артикуляционных органов речи от речевого центра мозга. Общий поток сообщений от него составляет в среднем не более 100 бит/с. Вся остальная информация в речевом сигнале называется сопутствующей.  [c.46]

Речевой сигнал представляет собой своего рода модулированную несущую. Его спектр р ((о) = В (со) / (со), где В (со)—спектр генераторной функции, т. е. импульсов основного тона или шума Г (со) — фильтровая функция речевого тракта — модулирующая кривая. Эта модуляция особая — спектральная. При- ней несущая имеет широкополосный спектр, а в результате модуляции изменяется соотношение между частотными составляющими, т. е. изменяется форма огибающей спектра. Почти вся информация о звуках речи заключена в спектральной огибающей речи и ее временном изменении (частично информация о звуках речи заключена в переходах от тонального спектра к шумовому и обратно — по этим переходам узнают о смене звонких звуков на глухие и обратно). Все эти изменения происходят медленно (в темпе речи). Установлено, что  [c.46]

Рис. ЗЛО. Огибающие спектра для ряда звуков речи Рис. ЗЛО. Огибающие спектра для ряда звуков речи
По теории, предложенной проф. А. А. Пироговым, распознавание звуков речи определяется скоростью изменения спектральных уровней (фонетическими функциями).  [c.46]

Для передачи смысла речи достаточно передавать сведения о форме огибающей спектра речи и ее временном изменении в темпе смены звуков речи, а также изменение основного тона речи и переходов тон — шум.  [c.47]

Допустимые искажения определены из условий их заметности. Принято считать искажения заметными, если их замечают 75% слушателей. В распознавании искаженной речи большую роль играет фактор обучения человека. Если при слушании искаженной речи человек может контролировать правильность распознавания речи (например, по смыслу), то через некоторое время даже сильно искаженная речь будет распознаваться правильно (если при этом останется разница в звучании звуков речи). Особенно это имеет место при частотных искажениях. Ошибки распознавания получаются лишь в тех случаях, когда искажения приводят к таким изменениям звуков речи, которые изменяют смысл, или когда какое-либо слово нельзя распознать по смыслу (названия, фамилии и т.п.). Искаженную речь можно уподобить иностранной и переводить ее на свой родной язык, для чего требуется известная тренировка. Человек, знающий азбуку Морзе, при слушании воспринимает ее как речь.  [c.274]

Форманты звуков речи заполняют весь частотный диапазон 150. .. 7000 Гц. Этот частотный диапазон делят на 20 полос равной разборчивости. В табл. 10.4 приведены границы таких полос для русского языка. Там же приведены и средние значения частоты для этих полос. Вероятность появления формант в каждой полосе равной разборчивости равна 0,05. При слушании речи в условиях шумов и помех разборчивость получается меньшей, чем в их отсутствие, Коэ( ициент, определяющий это уменьшение, называют коэффициентом вос-  [c.276]

Постоянство коэффициента разборчивости в диапазоне свыше 250 Гц показывает хорошее качество звучания речи (лишь немного снижается разборчивость низких звуков речи с формантами ниже 250 Гц).  [c.283]

Рис. 10.11. Спектральные огибающие звуков речи до ограничения (сплошные кривые) Рис. 10.11. Спектральные огибающие звуков речи до ограничения (сплошные кривые)
Вокодер представляет собой устройство, в передающей части которого из -речевого сигнала выделяются параметры, определяющие информативность речи. К этим параметрам относятся спектральные огибающие звуков речи и параметры основного тона речи, т. е. признаки звуков речи, медленно изменяющиеся во времени. Параметр основного тона управляет частотой генератора основного тона, находящегося в приемной части вокодера. Напряжение от этого генератора, создающего импульсы, сходные с импульсами гортани, подается на сложный фильтр, имитирующий акустическую систему речевого тракта для звонких звуков. При синтезе глухих звуков речи генератор создает шумовое напряжение, подаваемое на фильтры, имитирующие систему для глухих звуков речи. Параметрами этих фильтров и уровнем звуков речи управляют параметры, выделенные на передающем конце, в результате чего восстанавливается спектральная огибающая речевого сигнала. Качество и разборчивость восстановленного сигнала получаются достаточно высокими.  [c.287]


В зависимости от типа выделяемых параметров речевого сигнала есть вокодеры полосные, гармонические, формантные и фонемные. В полосных выделяется комплекс ординат спектра в узких полосках, в гармонических— коэффициенты Фурье от разложения спектральной огибающей в сумму гармоник, в формантных — частоты и амплитуды формант, в фонемных — произнесенный звук. Так как эти параметры изменяются во времени со скоростью произнесения звуков речи (8—-10 звуков в секунду), то частотный диапазон каждого параметра не превышает 20. .. 25 Гц. Кроме того, в каждом из перечисленных типов вокодеров выделяется параметр (частота) основного тона голоса.  [c.287]

Вт/м. Измерители звукового давления имеют несколько постоянных времени для импульсных звуков, измерений средних значений уровня звуков речи, измерений среднего длительного значения и т. д.  [c.288]

Каждому человеку свойственна своя манера произносить звуки речи (своего рода устный почерк). Произношение звуков речи зависит, например, от ударения.  [c.46]

Звуки речи неодинаково информативны. Так, гласные звуки содержат меньшую информацию о смысле речи, чем глухие (например, в слове посылка последовательность а. ы. а —ничего не говорит, а —п. с. лк дает почти однозначный ответ о смысле). Поэтому раз-  [c.49]

Однако, как указывалось, в том же направлении экспериментировало много изобретателей, и неудивительно, что в этот же день и даже на один час ранее И. Грея представил в патентное бюро аналогичную заявку А. Г. Белл, также объявивший, что создал телеграф, при помощи которого можно передавать человеческую речь . Ранее А. Г. Беллу стало известно об огромной награде, обеш анной Вестерн Юнион за изобретение частотного телеграфирования, и он все свободное время стал отдавать музыкальному телеграфу . В июне 1875 г., экспериментируя, А. Г. Белл подобно И. Грею (но почти на год позднее) совершенно случайно из-за оплошности своего ассистента А. Ватсона обнаружил, что приемник воспроизводит звуки речи. Оказалось, что А. Ватсон исправлял приемный электромагнит, подключенный к другому приемному электромагниту, находившемуся в соседней комнате, в которой сидел А. Белл. Таким образом, в отличие от И. Грея, предложившего для телефонирования устройство, состоявшее из жидкостного микрофона (передатчик) и приемного электромагнита, А. Белл, обнаруживший, что электромагнит с легким якорем может служить и передатчиком, первоначально предложил систему, состоявшую из двух электромагнитов [20].  [c.301]

Частотные спектры многих практически важных звуков (речь, звуки голосов животных, шум машии и механизмов при изменении режима работы) изменяются во временн. Чтобы проследить эти измепенпя, применяют частотно-временной, или сонографический, анализ (рис. 3). Частотные спектры, полученные за последовательные интервалы времени, отображаются  [c.72]

Голосовой тракт. При выдыхании воздух из легких сначала поступает в гортань (хрящевую трубку), а затем выходит через нос и рот. Выходящий из легких воздух проходит через голосовые связки , которые расположены в верхней части гортани и состоят из переплетенных между собой мышечных волокон. При создании согласных звуков речи типа с , ф воздух проходит через голосо1вые связки беспрепятственно. При создании же гласных звуков и согласных типа л , н выходящий из легких воздух возбуждает голосовые связки, которые начинают колебаться. Энергия коле баний голосовых связок распределена по целому спектру частот. Порожденный колеблющимися голосовыми связ1ками звук проходит через резонансные полости горла, носа и рта, в которых происходит усиление формантных частот, и таким образом возникают понятные нам гласные звуки. Ча стота, на которой происходит усиление звука, определяется формой и размером резонансных областей, образующих голосовой тракт, что в свою очередь зависит от положения языКа, губ, мягкого неба и положения нижней челюсти. Каждый произнесенный нами звук невероятно сложен как по частотному и энергетическому спектру, так и по длительности звучания отдель-  [c.399]

Звуки речи делятся на звонкие и глухие. Звонкие звук1 образуются с участием голосовых связок, в этом случае находящихся в напряженном состоянии. Под напором воздуха, идущего из легких, они периодически раздвигаются, в результате чего создается прерывистый поток воздуха. Импульсы потока воздуха, создаваемые голосовыми связками, с достаточной точностью могут считаться периодическими. Соответствующий период повторения импульсов называют периодом основного тона голоса Го. Обратную величину Го, т. е. 1/Го, называют частотой основного тона. Если связки тонкие и сильно напряжены, то период получается коротким и частота основного тона высокой для толстых, слабо напряженных связок частота основного тона получается низкой. Частота основного тона для всех голосов лежит в пределах 70... 450 Гц. При произнесении речи частота основного тона непрерывно изменяется в соответствии с ударением и подчеркиванием звуков и слов, а также для проявления эмоций (вопрос, восклицание, удивление и т. д.). Изменение частоты основного тона называется интонацией. У каждого человека свой диапазон изменения основного тона (обычно он бывает немногим более октавы) и своя интонация. Последняя имеет большое значение для узнаваемости говорящего. (Основной тон, интонация, устный почерк и тембр голоса служат для опознавания человека, и степень достоверности опознавания выше, чем по отпечаткам пальцев. Это свойство используют для аппаратуры, срабатывающей только от определенных голосов.) Импульсы основного тона имеют пилообразную форму, и поэтому при их периодическом повторении получается дискретный спектр с большим числом гармоник (до 40), частоты которых кратны частоте основного тона. Огибающая спектра основного тона имеет спад в сторону высоких частот с крутизной около 6 дБ/окт, поэтому для мужского голоса уровень составляющих около 3000 Гц ниже их уровня около 100 Гц примерно 30 дБ.  [c.45]

При произнесении звуков речи язык, губы, зубы, нижняя челюсть, голосовые связки должны находиться для каждой фонемы в строго определенном положении или движении. Эти движения называют артикуляцией органов речи. При этом в речеобразующем тракте создаются резонансные полости, определенные для данной фонемы, а для слитного звучания фонем в речи — и определенные переходы от одной формы тракта к другой.  [c.46]

При произнесении звуков речи через речевой тракт проходит или тональный импульсный сигнал, или шумовой, или тот и другой вместе. Речевой тракт представляет собой сложный акустический фильтр с рядом резонансов, создаваемых полостями рта, носа и носоглотки, т. е. с помощью артикуляционных органов речи. Вследствие этого равномерный тональный или шумовой спектр превращается в спектр с рядом максимумов и минимумов. Максимумы спектра называют формантами, а нулевые провалы — антиформантами. Для каждой фонемы огибающая спектра имеет индивидуальную и вполне определенную форму (рис. 3.10, на котором приведены спектральные огибающие для звуков в, г, м). При произнесении речи спектр ее непрерывно изменяется и образуются формантные переходы. Частотный диапазон речи находится  [c.46]


Звонкие звуки речи, особенно гласные, имеют высокий уровень интенсивности, глу хие — самый низкий. При произнесении ре чи громкость ее непрерывно изменяется Особенно резко она Изменяется при произ несении взрывных звуков речи. Динамичес кий диапазон уровней речи находится в пре делах 35. .. 45 дБ. Гласные звуки речи име ют в среднем длительность около 0,15 с, согласные — около 0,08 звук п —около 30 мс.  [c.46]

Для получения шумозащищенного речевого сигнала используют гортань как источник речевых колебаний. Эти колебания создаются при произнесении звуков речи и являются чисто механическими колебаниями тканей, прилегающих к гортани. Наиболее интенсивные колебания получаются на низ-1 их частотах. Скорость колебаний этих тканей уменьшается к высоким частотам по квадратичному закону. При увеличении час-  [c.47]

При этом коэффициент разборчивости определяют с учетом следующих обстоятельств и если р-м Qм ог ог < Ва, то ш = О и 2) —коэффициент разборчив вости необходимо уменьшить из-за подавления слабых звуков речи на величину, соответствующую уменьшению уровня ощущения на = ЛАог/24.  [c.281]

Для получения одинаковой глубины модуляции для всех звуков речи (что обеспечивает наибольшую разборчивость речи, так как дает одинаковое превышение спектральных уровней речи над спектральными уровнями электрических помех) необходимо, чтобы низкочастотный тракт от входа микрофона до входа модулятора передатчика имел частотную характеристику с тенденцией подъема к высоким частотам около бдБ/окт, т.е. должно быть выполнено условие + Qnep  [c.286]

Амплитудное ограничение. Рассмотрим предельный случай компрессии речи — пре-де/1Ьное амплитудное ограничение, при котором речевой сигнал превращается в последовательность прямоугольных импульсов постоянной амплитуды, но с меняющимися интервалами между нулевыми переходами. При модуляции сигнала передатчика таким речевым сигналом получается телеграфный режим работы. А это означает, что все звуки речи будут иметь одинаковый и притом максимальный уровень на приеме. Если при передаче неограниченной речи слабые звуки маскировались помехами, то при таком способе передачи они окажутся выше уровней помех и разборчивость будет выше, чем при приеме неограниченной речи. Правда, качество звучания и разборчивость речи в отсутствие помех будут ниже, чем для неограниченной речи, но остается еще в допустимых пределах. Оказывается, что предельно ограниченный речевой сигнал Для слуха будет иметь распределение по частоте и по уровням, не очень сильно отличающееся от распределений неограниченной речи. На рис. 10.6 было приведено среднее распределение уровней для предельного ограничения  [c.286]

Звуки речи делят на звонкие и глухие. Звонкие звуки образуются с участием голосовых связок, в этом случае находящихся в напряжении. Под напором воздуха, идущего из легких, они периодически раздвигаются, в результате чего создается прерывистый поток воздуха. Импульсы потока воздуха, создаваемые голо совыми связками с достаточной точностью, могут считаться периодическими. Соответствующий период повторения импульсов называют периодом основного тона, голоса То. Обратную величину /о=1/7" называют частотой основного тона. Если связки тонкие и сильна напряжены, то период получается коротким и частота основного тона — высокой для толстых, слабонапряженных связок частота основного тона низкая. Эта частота для всех голосов лежит в пределах от 70 до 450 Гц. При произнесении речи она непрерывно изменяется в соответствии с ударением и подчеркиванием, звуков и слов, а также для проявления эмоций (вопрос, восклицание, удивление и т. д.). Изменение частоты основного тона называют интонацией. У каждого человека свой диапазон изменения частоты основного тона (обычно он бывает немногим более октавы) и своя интонация. Последняя имеет большое значение-для узнаваемости говорящего. Основной тон, интонация, устный почерк и тембр (окраска) голоса могут служить для опознавания человека. При этом степень достоверности опознавания выше, чем по отпечаткам  [c.47]

Звонкие звуки речи, Особенно гласные, имеют высокий уровень интенсивности, глухие— низкий. В процессе произнесения речи ее гррмкость непрерывно изменя-  [c.49]

Образование звуков речи происходит путем подачи команд к мускулам артикуляционных органов речи от речевого центра мозга. Этих сигналов не более десяти, при этом они изменяются медленно (в темле смены звуков речи, т. е. не более десяти раз в секунду). Поэтому общий поток сообщений для них составляет 100 бит/с.  [c.50]

В результате спектральной модуляции изменяется соотношение между частотными составляющими несу щей, т. е. изменяется форма огибающей ее спектра (появляются форманты и антиформанты). Почти вся информация о звуках речи заключается в этой спектральной огибающей и ее временном изменении ). Эти изменения происходят медленно ( в темпе произнесения зву-зов), поэтому передача сведений об огибающей и ее изменении не требует пропускной способности тракта более 100 бит/с. Но для передачи широкополосной несущей с ее широким динамическим диапазоном требуется очень большая пропускная способность 2). Кроме того, речевой сигнал при образовании в речевом тракте при-  [c.50]

Размеры микрофона невелики диаметр 23 мм, толщина 11 мм. Этот микрофон размещают только в ближней зоне источника звука на расстоянии 2—2,5 см от рта говорящего. Располагать микрофон необходимо сбоку от рабочей оси рта, так как иначе при произнесении взрывных звуков речи из-за завихрений, образующихся около микрофона, возникают значительные нелинейные искажения в виде хрипов. Характеристика акустической чувствительности этого микрофона, полученная с учетом реакции его на градиент давления и близости к источнику звука, имеет равномерный участок до частоты 1000 Гц и небольшой подъем выше этой частоты, т. е. мало отличается от характеристики электромагнитного микрофона приемника давления. Остальные характеристики у приемника градиента давления такие же, как у приемника давления. Резонанс механической системы у него выбирают также на частотах около 2500 Гц и также с помощью акустической коррекции получают равномерную частотную характеристику в диапазоне да 3500 Гц и даже до 5000 Гц. Нижняя граница передаваемого частотного диапазона находится около 250— 300 Гц. Неравномерность частотной характеристики (по отношению к тенденции 6 дБ/окт) не превышает 6 дБ (см. рис. 5.206). Уровень чувствительности находится около —60 дБ. Так как этот микрофон имеет высокую шумосгойкость (см. 5.2), то его используют для работы в шумах высокого уровня (до ПО—115 дБ) и называют дифференциальным электромагнитным шумостойким микрофоном (ДЭМШ). Микрофон — приемник градиента давления второго порядка — составлен из  [c.112]

Если учесть, что скорость колебаний стенок гортани при речи уменьшается обратно пропорционально квадрату частоты (i M. [5], 5.14), то необходимо, чтобы напряжение, развиваемое ларингофоном при постоянстве скорости колебаний, увеличивалось с повышением частоты по квадратичному закону. Этого можно добиться, если выбрать резонансную частоту механической системы выше передаваемого диапазона частот. В этом случае частотная характери стика чувствительности. ларингофона, приведенная к чувствительности эквивалентного микрофона, будет достаточно равномерна. Такой ларингофон должен хо1рошо передавать В се форманты звуков речи. На самом деле высокочастотные звуки передаются плохо, особенно шумовые, так как их уровень в колебаниях гортани сравним с уровнями шумов, возникающих в тканях тела из-за жизнедеятельности организма.  [c.115]


Смотреть страницы где упоминается термин Звуки речи : [c.194]    [c.259]    [c.352]    [c.71]    [c.388]    [c.400]    [c.33]    [c.286]    [c.287]    [c.47]    [c.49]    [c.50]   
Электроакустика (1978) -- [ c.47 ]



ПОИСК



Волны в трубе. Уравнение неразрывности. Сжимаемость газа. Волновое уравнение. Энергия плоской волны. Интенсивность звука Речь, музыка и слух. Шкала громкости. Мощность звука. Распределение энергии звука по частоте. Гласные Распространение звука в трубах

Звуки речи Звуковое поле

Звуки речи глухие

Звуки речи диффузное

Звуки речи звонкие

Звуки речи номинальное

Звуки речи свободное

Звуки речи среднее

Звуки речи стандартное

О чем речь



© 2025 Mash-xxl.info Реклама на сайте