Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

о речевых технологиях студентам ИТМО

оформление доклада
by

ЦРТ проекты prezi

on 1 August 2014

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of о речевых технологиях студентам ИТМО

от МНОГОГОЛОСИЯ мира,
к уникальности ГОЛОСА
Михаил Хитров
ВИЦЕ-ПРЕЗИДЕНТ КОНСОРЦИУМА
К.Т.Н., ЗАВ. КАФЕДРОЙ
"Речевые информационные системы",
председатель Совета Директоров
РРТ
РОССИЙСКИЕ
РЕЧЕВЫЕ
ТЕХНОЛОГИИ
"Российские речевые технологии"
Какую мы можем
получить
из речи человека?
- понять смысл сказанного
- определить пол, возраст,
- понять эмоции человека,
- определить окружающую обстановку
ЧТО СКАЗАЛ
КТО СКАЗАЛ
КАК СКАЗАЛ
ГДЕ СКАЗАЛ
Задача речевых технологий -
получать информацию из речи,
КОМПЬЮТЕР
ЧЕЛОВЕК
как это умеет делать
Что такое речевые технологии?
компании
и кафедры
СЕГОДНЯ
Мы создаем БУДУЩЕЕ
национальность, личность человека
его психофизическое состояние
ИНФОРМАЦИЮ
ЧТО ТАКОЕ РЕЧЬ?
ЭТО КОМПЕТЕНЦИИ
"ЦРТ"
"РИС"
это перспективное направление
РЕЧЕВЫЕ ТЕХНОЛОГИИ -
БУДУЩЕЕ
на ближайшее
5in5
которые будут создавать будущее вместе
с нами...
Речевые технологии – обеспеченное будущее специалистов


Бюджеты проектов от миллионов рублей до миллионов долларов
Рынок речевых технологий составляет $38,4 млрд
и растет на 8,8% ежегодно
Интерес бизнеса постоянно растет
Э В О Л Ю Ц И Я С И Н Т Е З А Р Е Ч И:
Синтез ЦРТ считается лучшим в мире синтезом русского языка
Проблематика:
- Достичь максимального сходства с живым человеческим голосом
Не существует экспертных оценок (MOS)
Все оценивается на слух, мнения субъективны
- Обеспечить качество на произвольном тексте
создан за 9 лет
силами 15 специалистов
бюджетом в 150 млн рублей
Правильное чтение сокращений, числительных, ударений в словах, знаков препинания, интонаций
- Требуется штат узкоспециализированных специалистов
ОНИ БУДУТ РАЗВИВАТЬ ТЕХНОЛОГИИ
производства ЦРТ
готовим специалистов
Сейчас мы
СИНТЕЗ РЕЧИ
ТЕХНОЛОГИИ:
СИНТЕЗ РЕЧИ
производства ЦРТ
СИНТЕЗ РЕЧИ
Скачать в iTunes http://itunes.apple.com/ru/app/radio-rss/id466387401
QR-code
приложение для IPad
производства ЦРТ
СИНТЕЗ РЕЧИ
приложение "Читатель"
Чтение субтитров с ресурса TED
РАСПОЗНАВАНИЕ РЕЧИ
Для того, чтобы компьютер мог понять человека
Понимание речи (семантика)
Распознавание слов конкретного диктора
Дикторонезависимое
распознавание речи
Распознавание ключевых слов в слитной речи
Слитное распознавание речи
РАСПОЗНАВАНИЕ РЕЧИ
Проблематика
Кто знает,
какой уровень распознавания речи у человека?
Если не знает тему – 75%
Повысить качество и надежность распознавания может искусственный интеллект
Как происходит процесс распознавания?
Смежные задачи

Определение языка диктора

Шумоочистка

Анализ каналов связи, детектирование голоса
СИНТЕЗ И РАСПОЗНАВАНИЕ
Одно из основных применений: автоматизированные системы голосового самообслуживания в контактных центрах
Диалог машины с человеком
Как строятся такие системы?
IVR КОНСТРУКТОР
РАБОТЫ МНОГО, РАБОТА ИНТЕРЕСНАЯ…
"МТС", "Мегафон", "Билайн", "Сбербанк", "РЖД", "ТКБ", "Ростелеком" и многих других...
Подобные системы разрабатываются сейчас для:
Виртуальный голосовой помощник
Достаточно ли этого для полноценного
общения компьютера и человека?
Русский язык один из самых сложных языков в мире

Одно слово может выражать несколько значений в зависимости от интонационной окраски
- спасибо!
- спасибо?
- ну, спасибо... :(
АНАЛИЗ РЕЧИ
ГОЛОСОВАЯ БИОМЕТРИЯ
ТЕКСТО-ЗАВИСИМАЯ
ТЕКСТО-НЕЗАВИСИМАЯ
СТАТИЧЕСКАЯ
ДИНАМИЧЕСКАЯ
ИДЕНТИФИКАЦИЯ
ВЕРИФИКАЦИЯ
Сравнение «неизвестного» образца против базы «известных» (1:N)
Подтверждение личности (1:1)



– диапазон изменения основного тона диктора


– средняя оценка мощности речевого сигнала диктора


– средняя длительность фраз диктора


– доля голосовых (вокализованных) фрагментов в речи диктора


– темп речи, количество произносимых звуков в единицу времени


– дрожание частоты основного тона
Параметры и инструментарий
АНАЛИЗ РЕЧИ
ИНТОНИРОВАННОСТЬ
ГРОМКОСТЬ
РИТМИЧНОСТЬ
МЕЛОДИЧНОСТЬ
СКОРОСТЬ
ДЖИТТЕР
ГОЛОСОВАЯ БИОМЕТРИЯ
Голосовая биометрия – единственная компьютерная технология,
которая работает лучше человека!
Голос любого человека уникален

Примерно 70 органов тела задействованы в создании речи

Важно не ЧТО мы говорим,
а КТО говорит
ГОЛОСОВАЯ БИОМЕТРИЯ


- записать на диктофон и проиграть запись
- спародировать/имитировать голос и т.д.
Вопрос, который нам задают все:
Можно ли обмануть систему распознавания голоса?
НЕТ
НАЗНАЧЕНИЕ– анализ и обработка речи
ПРИМЕНЕНИЕ– криминалисты, силовые структуры,
спецслужбы, судебные эксперты
ЭКСПЕРТНЫЕ СИСТЕМЫ
Однажды в Америке...
ЦРТ – занимает лидирующие позиции на мировом рынке по речевым технологиям
Самые крупные в мире внедрения
по голосовой биометрии - ЭТО МЫ, "ЦРТ"

ОПЕРЕЖАЯ БУДУЩЕЕ...
2025 год: Бэтмэн слушает
весь город,
чтобы найти одного человека...
2010 год: система ЦРТ
слушает ВСЮ СТРАНУ,
чтобы найти двух террористов...

Нам потребовалось 20 лет, что бы стать №1
в России и значимым игроком на мировом рынке

МЫ СТОЯЛИ У ИСТОКОВ РЕЧЕВЫХ ТЕХНОЛОГИЙ В РОССИИ
чтобы готовить
высококлассных специалистов
мирового уровня,
которые востребованы
на рынке уже сейчас

Мы открыли
Учитесь на "РИС"
Занимайтесь наукой
Проявите себя
Работайте с нами!
ЧТО МОЖНО УЗНАТЬ ИЗ РЕЧИ:
НАУЧИТЬ
НАША ИСТОРИЯ НАЧАЛАСЬ
С ГОЛОСОВОЙ КЛАВИАТУРЫ
ДЛЯ СЛЕПЫХ
для неё мы создали
СИНТЕЗ РЕЧИ
Речевые
Технологии
ООО "ЦРТ"
- Аналитика: персонализированная реклама на основании
ваших интересов
какие инновации изменят мир в ближайшие 5 лет
- Энергия: возобновляемые источники энергии,
включая энергию от людей
- Безопасность: вам больше не придется вводить пароли
- Чтение мыслей: недалекое будущее
- Мобильные устройства: доступ в сеть будет всегда и везде
СИНТЕЗ РЕЧИ:
Дифонный подход
Аллофонный подход
Unit Selection
Гибридный синтез от ЦРТ - VitalVoice
Если знает тему – 98%
С ЧЕМ РАБОТАЕТ КОМПЬЮТЕР?
А в’ и ть п а ш х ы ф c’ и г д а т а к н’ и м а т’ и л’ н
р а с п р а ш в л а з д а р о в’ и т’ с’ е н’ и ф’ о д р а в н ы
дж с и д а в л т’ л’ и ф о н ы в р а ч е и в а п щ е п р ы в л’ а л
с а ч у с т в’ е и в’ й и в о с а г л а с’ и д м’ и т р’ и ф б ы л
п а ч и м у т о с ы в’ р ш а н у в’ е р’ е н
А ведь Паша всегда так внимательно расспрашивал о здоровье Ксении
Федоровны, давал телефоны врачей, вообще проявлял сочувствие, и в его согласии Дмитриев был почему-то совершенно уверен
АНАЛИЗ РЕЧИ
ОФИСЫ В 6 СТРАНАХ МИРА
ПРОДАЖИ И ПРОЕКТЫ В 75 СТРАНАХ
Сейчас у нас:
Анализ речевых сигналов
Понимание природы речи невозможно без детального анализа речевого сигнала
Конфликт между Мелом Гибсоном и Оксаной Григорьевой :
Криминалистические фоноэксперты провели анализ телефонных переговоров с помощью оборудования ЦРТ. Подтверждена достоверность телефонных записей с оскорблениями.
Конфликт Бритни Спирс с ее бывшем мужем
Разоблачение поддельной телефонной записи,
на основании которой строились обвинения.
С чего все начиналось?
Начало истории речевых технологий...
Запись речи
Распознавание
речи
Анализ речи
РЕЧЕВЫЕ ТЕХНОЛОГИИ
Синтез речи
Шумоочистка
Голосовая биометрия
Основное средство коммуникации между людьми
Речь отличает нас от остального живого мира
Средство самоидентификации нации
Дар свыше
В колл-центре «МегаФона» новый «сотрудник»
Субтитры
Full transcript