Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Rozpoznávání řeči a umělá inteligence

Barcamp Jižní Čechy
by

Jan Švec

on 12 June 2015

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Rozpoznávání řeči a umělá inteligence

Rozpoznávání řeči
a umělá inteligence

Stavíme rozpoznávač
Akustická data
Rozpoznávání řeči
1952 - Single-speaker digit recognition
Porozumění řeči
Speech-to-text
?
Take-away pro geeky
word2vec modelování blízkosti slov
Česko je velmoc rozpoznávání řeči
Frederick Jelinek
1932 - 2010
IBM T.J.Watson Research Center
Praha
Plzeň
Brno
Liberec
Komerční společnosti a startupy
Google
Nuance
Apple
Facebook
IBM
Microsoft
Baidu
1980 - Statistické HMM modely
DTW
2010 - Neuronové sítě DNN
word2vec
LSTM
Jazyková data
WAVy
text přepis
dostatek řečníků
texty
slova
výslovnosti
1k hodin
1G tokenů
1M slov
Machine learning
Model
Dekodér
LSTM modelování
posloupnosti znaků
Podobnost slov z textu
plzeň+praha=budějovice+brno
LSTM neuronová síť
Wikipedia markup
LaTeX markup
C language (Linux kernel)
Významové tagy
Témata
Entity
Přesnost
30% IARPA BABEL
60% spontánní čeština
80% callcentra
95% diktát
Machine learning
Trénovací označená data
Sentiment
Dekodér
Model
Google Now
Apple Siri
Microsoft Cortana
Wit.ai
Jan Švec
honza.svec@gmail.com
@honza_svec
NTIS - Nové technologie pro informační společnost
FAV ZČU v Plzni

Porozumění řeči
proč to není trivka?
brýendypatojededobudějc
25% hlásek chybí!
ne
ne ne
asi ne
nebudu
nechci
nepotřebuju
vůbec nic
bych řek že ne
NESOUHLAS
nechcipetra
"ne, chci Petra"
"nechci Petra!"
Řečové technologie
Syntéza řeči
Speaker ID
Audiovisuální archívy
Ověření majitele hlasu
Biometrika
Off-line rozpoznání a indexace
Rychlé vyhledání
od cloudu po Androidu a další
SpeechTech TTS
Automatické titulkování živých televizních pořadů
Inteligentní technologie pro zvýšení bezpečnosti letového provozu
Multimediální archív MALACH
Full transcript