Энциклопедия по машиностроению XXL

Оборудование, материаловедение, механика и ...

Статьи Чертежи Таблицы О сайте Реклама

Система распознавания речи

Еще одна область научных исследований в робототехнике связана с восприятием речи или с программированием роботов голосом. Программирование голосом можно определить как речевое общение с роботами (или с другой мащиной) путем подачи им речевых команд. (Программирование голосом используется также в СЧПУ-читатель может вновь обратиться к разд. 8.9, где описано это интересное приложение.) Устройство управления роботом оснащается системой распознавания речи, которая анализирует речевой сигнал на входе и сравнивает его с хранящимся в памяти набором образов определенных слов. При обнаружении совпадения между входным словом и каким-либо словом из заученного словаря робот вьшолняет команду, соответствующую этому слову.  [c.280]


Благодаря новому подходу к проблеме создания искусственного интеллекта появились и все шире используются комплексные программы, обеспечивающие выполнение сложных мыслительных задач экспертные системы обучающие системы системы распознавания речи системы анализа изображений автоматизированные системы программирования.  [c.72]

Системы распознавания речи, зависящие от диктора Системы распознавания речи, которые могут принимать входной сигнал от конкретного диктора.  [c.362]

Системы распознавания речи, не зависящие от диктора Системы распознавания, которые могут понимать речь любого диктора.  [c.362]

Акустооптические корреляторы оказываются наиболее предпочтительными в системах распознавания образов, если речь идет  [c.573]

С этой целью откажемся от учета взаимного расположения областей только пары классов, так как это приводит к максимальному числу решаемых дихотомических задач. Последнее, в свою очередь, приводит к значительным аппаратурным затратам и, если речь идет о реализации системы распознавания с использованием ЦВМ, увеличению времени решения всех Л4(Л4 — 1)/2 дихотомических задач (здесь М — число классов). При любом другом способе решения задачи распознавания с ростом числа распознаваемых классов также наблюдается увеличение числа разделяющих поверхностей.  [c.255]

Более совершенными в следующем десятилетии станут средства распознавания речи и системы технического зрения. Терминалы ЭВМ будут оснащены устройствами речевого ввода, что существенно ускорит процесс ввода данных. Мы уже касались вопросов речевого ввода, рассматривая программирование систем числового программного управления в гл. 9. В будущем устройства речевого ввода войдут в комплект оборудования САПР/АПП. Как отмечалось в гл. 19, системы технического зрения найдут широкое применение в системах автоматического контроля. Кроме того, техническое зрение будет широко использовать-  [c.517]

В предыдущем разделе изложены основополагающие принципы символьных вычислений, даны необходимые вводные сведения, рассмотрены способы представления данных и возможные стратегии поиска. В данном разделе обсуждение указанных проблем получает дальнейшее развитие и рассматриваются четыре главных вопроса, составляющие суть символьных вычислений распознавание речи, техническое зрение, распознавание естественного языка, экспертные системы. Эти прикладные задачи могут принимать различные формы, каждая из которых включает сбор знаний, проведение рассуждений и поиск данных. Общим аспектом является использование знаний о системе или рассматриваемой области для улучшения понимания машинной входной информации.  [c.293]


Чтобы сделать машины способными идентифицировать устную речь и реагировать на нее, можно применить усовершенствованную методику распознавания образов для обработки входного сигнала и идентификации слов. Этот аспект исследований речевых систем называется распознаванием речи. Речь обычно вводится в систему распознавания речи с помощью микрофона [4]. Распознавание может осуществляться несколькими путями, но в любом из них обычно применяется выполняемая в цифровом виде процедура сравнения входной фразы или предложения с элементами, хранящимися в памяти компьютера. С другой стороны, понимание речи основывается на обработке знаний, и его относят к речи высокого уровня. Цель всех этих исследований речи, очевидно, состоит в создании высокоточной системы распознавания, полностью не зависящей от говорящего и работающей с большим словарным запасом.  [c.294]

Был разработан ряд методик, основанных на использовании знаний в речевых системах, но двумя наиболее совершенными из них являются системы распознавания отдельных слов (IWR) и понимания непрерывной речи ( SU) [11]. Система распознавания отдельных слов основывается на идентификации слов при раздельном произнесении слов во входном речевом сигнале, как, например,  [c.298]

Эти типы знаний могли быть включены в ранее приведенный пример системы распознавания отдельных слов, но этого в данном случае не требовалось. Схема использования знаний в примере независимого распознавания отдельных слов носит исключительно общий характер, применима к большинству типов знаний и называется парадигмой восходящей иерархии. В данном случае восходящая схема подразумевает использование цифровых методик, осуществляемых в начале алгоритма для улучшения качества сигнала и выделения всех признаков, что в целом составляет обработку речи низкого уровня (рис. 10.11). Последующая обработка высокого уровня состоит в исиользовании знаний, которые в данном случае возникают после завершения обработки низкого уровня. Понятие иерархии характеризует переход от процедур управления низкого уровня через несколько промежуточных этапов к управлению, при котором осуществляется взаимодействие знаний.  [c.301]

Основная система распознавания естественной речи состоит из акустического процессора, выполняющего преобразование сигнал-символ, и лингвистического декодера, применяющего знание для понимания вводимой речи. Типичные системы распознавания естественной речи могут быть реализованы в двух вариантах во-первых, с распознаванием отдельных слов при случайном их следовании (как, например, для поиска в базе данных) и, во-вторых, понимание значения непрерывно произносимых предложений. В обоих случаях имеются не только общие свойства, аналогичные свойствам систем распознавания отдельных слов, но и различия. Однако главное различие заключается в разных подходах к разделению слов на фрагменты.  [c.302]

Читателю следует обратить внимание на то, что ббльшая часть недавних усовершенствований в системах распознавания отдельных слов и непрерывной речи обусловлена успехами в создании процессоров обработки сигналов специального назначения. Такие процессоры включают в себя ИС специального назначения и систолические структуры, служащие для обработки речи низкого уровня. Остающиеся при этом критические процедуры, а именно поиск знаний и их обработка, требуют дополнительных исследований символьных вычислений и структуры оптимальной программной среды высокого уровня. (Несколько таких структур описаны в разд. 10.4, где более подробно рассматривается соотношение между структурой обработки и выполняемой функцией.) Как будет показано в следующей части раздела, процессоры специального назначения используются также в системах технического зрения.  [c.304]

Аналогично тому как системы обработки речи низкого уровня включают в себя методики распознавания образов, системы технического зрения также развивались на основе ранних работ по распознаванию образов. Однако рассмотрение технического зрения только как процесса распознавания образов является неточным распознавание образов является по своей сути исключительно цифровой процедурой, выполняемой непосредственно с изображением. Техническое зрение, напротив, использует знание о сцене для того, чтобы оценить категорию изображения, и работает с символьным представлением изображения, а не с самим изображением. Это составляет наиболее существенное различие между ними, и в целом ситуация оказывается аналогичной случаю использования знаний синтаксиса для понимания языка (вопрос понимания естественного языка излагается в разд. 10.3.4).  [c.306]


Распознавание речи Распознавание устной речи людей компьютерной системой.  [c.362]

Символьно-цифровое распознавание речи и система синтаксического анализа  [c.393]

Символьно-цифровое устройство распознавания речи иллюстрирует преимущества одновременно цифровых и символьных вычислений. На рис. 11.11 изображена блок-схема устройства распознавания речи со встроенным анализатором синтаксиса. В данном случае весьма трудная задача распознавания речи для наглядности рассматривается крайне упрощенно. Например, возможности распознавания могут быть существенно расширены по сравнению с представленными здесь с помощью метода неявного моделирования по Маркову, основанного на известных данных о порядке следования похожих слов. Произносимые данные непрерывно вводятся в схему (см. рис. 11.11) с левой стороны. Каждое слово разделяется процессором на фреймы длительностью 20 миллисекунд, по 200 образцов в каждом. Предполагаемая здесь система оперирует с непрерывным потоком фреймов в отличие от большинства систем, которые работают с блоками фреймов в пакетном режиме. Это позволяет избежать ряда сложностей, связанных с границами блоков. Два блока слева на рис. 11.11 уменьшают объем данных фрейма с 200 образцов до 16 коэффициентов линейного прогнозирования исходов с помощью АР-моделирования (см. 11.6.3). Параллель-  [c.393]

Системы очувствления, основанные па принципах голографии, цифровой пространственной фильтрации, а также искусственные сетчатки на интегральных схемах и волоконной оптике, устройства распознавания речи, анализа тактильной информации с использованием искусственной кожи и другие аналоги органов чувств будут находить все большее применение.  [c.245]

В системах понимания естественной речи для ограничения процесса поиска знаний используются грамматические или лингвистические модели, что означает ограничение активного словаря до определенного числа возможных слов в любой момент времени. При ограничении размера пространства поиска экономится не только время обработки для каждого слова, но и снижается вероятность неудачи и достигается рост скорости распознавания.  [c.302]

ОТ другах, делая паузу до и после него. Пауза должна длиться всего липп. 0,1 с или несколько дольше. Это позволяет системе распознавания речи выделять границы произносимых команд, чтобы сравнить их частотные характеристики со словами из эталонного набора для данного программиста. Утверждается, что типичный темп речи при вводе команд с учетом таких ограничений составляет приблизительно 70 слов в шнуту. По мере произнесения слов на экране дисплейного терминала перед оператором подтверждается понимание введенных сообщений и даются подсказки оператору, какую следующую команду он должен ввести.  [c.210]

В-третьих, должен быть ограничен контингент операторов, пользующихся системой речевого ввода. Эффективность большинства систем распознавания речи зависит от особенностей речи оператора. Иначе говоря, процессор системы распознавания речи способен идентифицировать только фразы, произносимые индивидуумами из числа пользователей системы. В-четвертых, для ввода данных необходим разумно подобранный словарь. Обычно это означает, что число разрещенных слов не превыщает нескольких десятков. В-пятых, производственную информацию желательно собирать в месте ее возникновения.  [c.407]

Сегодня информащюнные системы распознавания речи еще не могут распознавать слитную непрерывную речь, но они уже в состоянии с высокой скоростью понимать отдельные слова либо команды. Число слов, понимаемых системой, быстро растет, поэтому системы распознавания речи начинают использоваться щ)и решении различных задач, связанных с обработкой информации. В первую очередь они применяются там, где нужна быстрая передача команд машине, а руки пользователя заняты другой работой. Например, системы распознавания речи дают большой эффект при работе с диспетчерами аэропортов. Появились также информационные банки, в которых поиск и выдача сведений осуществляются по речевым командам пользователей. Созданы пишущие машинки, управляемые голосом. Они уже распознают до 5000 изолированных слов. Естественно, что каждая из мапщнок должна иметь мозг . Его функции чаще всего выполняются персональным компьютером. Пользователь, работающий с такой пишущей машинкой, произносит текст, делая паузы между словами.  [c.74]

Проблема формирования понятий и представления знаки рает важную роль не только при организации интеллектуаль интерфейса, но и при разработке адаптивных систем распознав для РТК- Острая необходимость в эффективных методах реш этой проблемы возникает, например, при распознавании реч команд, при анализе видеосцен и при моделировании окружаь среды в памяти управляющей системы РТК-  [c.242]

В разд 8.9 мы уже обсуждали речевой метод программирования станков с числовым программным управлением. Другим примером речевого общения человека с вычислительной машиной является ввод данньхх в производственных информационных системах. Эту технологию иногда называют автоматическим распознаванием речи она символизирует попытку упрощения человеко-машинного интерфейса. При некоторых обстоятельствах речевой ввод данных в ЭВМ оказывается наиболее простым и быстрым. Среди примеров применений метода на производстве можно назвать контроль качества, управление запасами и идентификацию деталей. В перспективе применение речевого ввода данных возможно и в системе сбора информации о выполнении заказов.  [c.406]

В работе Хубера [10] описываются характеристики процессов, обеспечивающие возможность успешного применения систем автоматического распознавания речи в промышленности. Во-первых, на заводе должна иметься автоматизированная информахщонная система. Во-вторых, процедуры ввода данных должны многократно повторяться.  [c.406]

Из анализа современных тенденций следует, что вычисления в реальном времени будут включать в себя символьную обработку и характеризоваться высокой степенью параллелизма. В этом контексте оптика может обнаружить преимущества над традиционными полупроводниковыми технологиями в целом ряде применений, потому что она способна обеспечить очень высокую степень параллелизма, большую ширину полосы частот междупроцессорных связей, а также высокие коэффициенты объединения по входу и разветвления по выходу. Очень часто обработка данных в реальном времени требует быстрого принятия логических решений, использующих накопленные знания и/или обработку больших объемов данных с высокими скоростями. Таким образом, тесная связь между символьными и цифровыми вычислениями достаточно часто является полезной и желательной. Об этом свидетельствуют многочисленные примеры нз таких областей, как понимание речи и изображений, робототехника, военная техника, управление промышленным производством. В статье описаны символьные и цифровые процессоры обработки сигналов с оптической перекрестной схемой межэлементных соединений. В качестве примера описаны такие системы, основанные на правилах, как коррелятор и умножитель матрицы на вектор (реализуемые на основе ЭВМ). Авторегрессивное моделирование показывает возможность выполнения более сложных алгоритмов. Описаны устройства распознавания речи и синтаксического анализа, демонстрирующие то, как с помощью предложенного оптического процессора могут быть успешно совмещены символьные и цифровые вычисления.  [c.365]


Системы роботов и шагающих машин могут управляться человеком-оператором, копировать движение его рук, действовать на основе жестко заданной программы или управляться ЭВМ. По-видимому, в самом ближайшем будущем роботы, манипуляторы и шагающие машины будут очувствляться . Их рабочие органы уже сейчас оснащены тактильными датчиками, обеспечивающими чувство осязания, специальными телевизионными установками, осуществляющими зрение роботов, устройствами для распознавания образов, реакции на человеческую речь и другую информацию. Проводятся опыты по использованию аналогов нейронных сетей животных и человека для управления сложными роботами. Создаются роботы со свойствами адаптации, самостоятельным  [c.156]

В последние годы созданы и начинают применяться в промышленности интеллектуальные системы автоматизированного проектирования (САПР), СИИ для распознавания зрительной информации и речи, интеллектуальные системы автоматизации программирования (САП), интеллектуальные автоматизированные системы подготовки производства (АСПП), встроенные СИИ для диагностики оборудования, а также ЛИСП — машины для оперативной обработки символьной информации и ПРОЛОГ — машины для автоматического поиска логических выводов на основе факторов и правил, хранимых в базе знаний. Это позволяет переложить на СИИ некоторую часть умственного труда, которую в условиях обычного производства приходилось возлагать на человека. В результате повышается производительность и степень автоматизации производства. Таким образом, сегодня СИИ фактически вышли на промышленный рынок. Они находят все более широкое применение в адаптивных РТК и ГАП.  [c.229]

Техническое зрение, более широко известное в компьютерной технике как понимание зрительных образов, относится к способности машины или компьютера понимать сцены, поступающие по визуальному входному каналу. Назначение таких систем [5] состоит в понимании образов и изображений с такой же степенью точности, как и в системах человеческого зрения. Распознавание может осуществляться большим числом способов, но в большинстве случаев используется сравнение наблюдаемой сцены с объектами, представленными в базе знаний системы. Ситуация близка к задаче создания систем понимания речи, за тем исключением, что информация заключена во входных образах, а не в форме волновых сигналов, и, кроме того, сами объекты являются трехмерными. Так как большинство входных визуализирующих устройств, например полупроводниковые телевизионные камеры, создают двумерные матрицы изображений, то для достижения определенного уровня восприятия чисто трехмерной информации, содержащейся во входной сцене, требуется прикладывать большие усилия. По аналогии со случаем обработки речи, функции обработки изображений, такие как предобработка, восстановление изображений или градиентные вычисления, называются зрением низкого уровня. Любые виды обработки, требующие взаимодействия с базой знаний, относят к зрению высокого уровня.  [c.294]

В связи с этим необходимо подчеркнуть, что если маскировка акустических сигналов обусловлена прежде всего процессами на периферии слуховой системы, то освобождение от маскировки, определяющее помехоустойчивость восприятия, преимущественно связано с центральными процессами. Именна в центральных отделах слуховой системы и различных структурах мозга реализуется бинауральное взаимодействие и латеральное торможение, производится выбор оптимальной стратегии обработки, осуществляется параллельная обработка сигналов различными способами, происходит обучение, формируется программа поведения организма в целом, направленная на выделение и последующее распознавание биологически важных сигналов. Эволюция системы акустической коммуникации, включающей системы звуковосприятия и звуковоспроизведения, в том числе и речь человека, в значительной степени определялась задачей обеспечения помехоустойчивости и происходила по трем путям усложнения структуры коммуникационных сигналов, развития процедур их обработки и оптимизации выбора программы реакции.  [c.595]


Смотреть страницы где упоминается термин Система распознавания речи : [c.301]    [c.382]    [c.72]    [c.287]    [c.293]    [c.58]    [c.34]   
Смотреть главы в:

Информатика, электроника сети  -> Система распознавания речи



ПОИСК



О чем речь



© 2025 Mash-xxl.info Реклама на сайте