Дороги, дураки и компьютеры. Есть ли будущее у России - страница 45

Шрифт
Интервал


Если вы решили послушать УКВ-радиоприемник, то знайте, что практически все радиостанции буквально нашпигованы цифровой звуковоспроизводящей техникой и компьютерами. Особенно заметно преимущество цифровой технологии при копировании звука. Копирование цифровых данных осуществляется байт в байт. Если в процессе копирования произойдет ошибка, то операционная система известит вас и предоставит возможность повторить операцию. Копия полностью совпадает с оригиналом. Для аналоговой техники это невозможно! При любом копировании аналогового сигнала качество звука ухудшается.

Компьютер и телефон – близнецы-братья

– Вот говорят: Карузо, Карузо… Ни слуха, ни голоса, да еще и картавит.

– А вы слышали?

– Сам не слышал, но мне Рабинович по телефону напел.

Старый анекдот

Обучить компьютер понимать человеческую речь и «озвучивать» текстовые сообщения – заманчивая задача. Именно ее решает компьютерная телефония – технология, основанная на интеграции телефона и компьютера в единую среду. С одной стороны, компьютер используется для коммутации телефонных вызовов, а с другой, телефон превращается в средство удаленного доступа к компьютерным ресурсам. Сюда же относятся и другие компьютерные системы, связанные с поддержкой передачи информации по телефонным линиям, такие как голосовая почта, факсимильная почта, факс-серверы и т. д.

Распознавание речи

Упрощенно процесс машинного распознавания речи можно описать в нескольких фразах. Аналоговый сигнал, генерируемый микрофоном, оцифровывается, далее в речи выделяются так называемые фонемы, то есть элементарные фрагменты, из которых состоят произносимые слова и определяется, какое слово какому сочетанию фонем соответствует. Из всего этого строится словарь. Распознать слово – значит, найти его в этом словаре по произнесенному сочетанию фонем.

Но, во-первых, человек обычно не делает паузы между словами, а при слитном произнесении к задаче распознавания прибавляется еще и задача выделения слов из потока речи. Особенно «неприятной» кажется необходимость выделять односложные слова – именно с ними и связано максимальное число ошибок реально существующих систем. Можно, конечно, потребовать, чтобы человек произносил слова по одному, делая достаточно продолжительные паузы. Не очень удобно, но для подачи простых команд сгодится.