Дороги, дураки и компьютеры. Есть ли будущее у России - страница 45

Шрифт

Интервал

Если вы решили послушать УКВ-радиоприемник, то знайте, что практически все радиостанции буквально нашпигованы цифровой звуковоспроизводящей техникой и компьютерами. Особенно заметно преимущество цифровой технологии при копировании звука. Копирование цифровых данных осуществляется байт в байт. Если в процессе копирования произойдет ошибка, то операционная система известит вас и предоставит возможность повторить операцию. Копия полностью совпадает с оригиналом. Для аналоговой техники это невозможно! При любом копировании аналогового сигнала качество звука ухудшается.

Компьютер и телефон – близнецы-братья

– Вот говорят: Карузо, Карузо… Ни слуха, ни голоса, да еще и картавит.
– А вы слышали?
– Сам не слышал, но мне Рабинович по телефону напел.
Старый анекдот

Обучить компьютер понимать человеческую речь и «озвучивать» текстовые сообщения – заманчивая задача. Именно ее решает компьютерная телефония – технология, основанная на интеграции телефона и компьютера в единую среду. С одной стороны, компьютер используется для коммутации телефонных вызовов, а с другой, телефон превращается в средство удаленного доступа к компьютерным ресурсам. Сюда же относятся и другие компьютерные системы, связанные с поддержкой передачи информации по телефонным линиям, такие как голосовая почта, факсимильная почта, факс-серверы и т. д.

Распознавание речи

Упрощенно процесс машинного распознавания речи можно описать в нескольких фразах. Аналоговый сигнал, генерируемый микрофоном, оцифровывается, далее в речи выделяются так называемые фонемы, то есть элементарные фрагменты, из которых состоят произносимые слова и определяется, какое слово какому сочетанию фонем соответствует. Из всего этого строится словарь. Распознать слово – значит, найти его в этом словаре по произнесенному сочетанию фонем.

Но, во-первых, человек обычно не делает паузы между словами, а при слитном произнесении к задаче распознавания прибавляется еще и задача выделения слов из потока речи. Особенно «неприятной» кажется необходимость выделять односложные слова – именно с ними и связано максимальное число ошибок реально существующих систем. Можно, конечно, потребовать, чтобы человек произносил слова по одному, делая достаточно продолжительные паузы. Не очень удобно, но для подачи простых команд сгодится.

Следующая страница