Archív

Přes tuto rubriku se dostanete na starší čísla CS-magazínu.

2026 (0)

2025
- 2025 (0)
- 2025 (0)
- 2025 (0)
- 2025 (0)
- 2025 (0)
- 2025 (0)
- 2025 (0)
- 2025 (0)
- 2025 (0)
- 2025 (0)
- 2025 (0)
- 2025 (0)
2024
- 2024 (0)
- 2024 (0)
- 2024 (0)
- 2024 (0)
- 2024 (0)
- 2024 (0)
- 2024 (0)
- 2024 (0)
- 2024 (0)
- 2024 (0)
- 2024 (0)
- 2024 (0)
2023
- 2023 (0)
- 2023 (0)
- 2023 (0)
- 2023 (0)
- 2023 (0)
- 2023 (0)
- 2023 (0)
- 2023 (0)
- 2023 (0)
- 2023 (0)
- 2023 (0)
- 2023 (0)
2022
- 2022 (0)
- 2022 (0)
- 2022 (0)
- 2022 (0)
- 2022 (0)
- 2022 (0)
- 2022 (0)
- 2022 (0)
- 2022 (0)
- 2022 (0)
- 2022 (0)
- 2022 (0)
2021
- 2021 (0)
- 2021 (0)
- 2021 (0)
- 2021 (0)
- 2021 (0)
- 2021 (0)
- 2021 (0)
- 2021 (0)
- 2021 (0)
- 2021 (0)
- 2021 (0)
- 2021 (0)
2020
- 2020 (0)
- 2020 (0)
- 2020 (0)
- 2020 (0)
- 2020 (0)
- 2020 (0)
- 2020 (0)
- 2020 (0)
- 2020 (0)
- 2020 (0)
- 2020 (0)
- 2020 (0)
2019
- Prosinec 2019 (0)
- Listopad 2019 (0)
- Říjen 2019 (0)
- Zaří 2019 (0)
- Srpen 2019 (0)
- Červenec 2019 (0)
- Červen 2019 (0)
- Květen 2019 (0)
- Duben 2019 (0)
- Březen 2019 (0)
- Únor 2019 (0)
- Leden 2019 (0)
2018
- Prosinec 2018 (0)
- Listopad 2018 (0)
- Říjen 2018 (0)
- Zaří 2018 (0)
- Srpen 2018 (0)
- Červenec 2018 (0)
- Červen 2018 (0)
- Květen 2018 (0)
- Duben 2018 (0)
- Březen 2018 (0)
- Únor 2018 (0)
- Leden 2018 (0)
2017
- Prosinec 2017 (0)
- Listopad 2017 (0)
- Říjen 2017 (0)
- Zaří 2017 (0)
- Srpen 2017 (0)
- Červenec 2017 (0)
- Červen 2017 (0)
- Květen 2017 (0)
- Duben 2017 (0)
- Březen 2017 (0)
- Únor 2017 (0)
- Leden 2017 (0)
2016
- Prosinec 2016 (0)
- Listopad 2016 (0)
- Říjen 2016 (0)
- Zaří 2016 (0)
- Srpen 2016 (0)
- Červenec 2016 (0)
- Červen 2016 (0)
- Květen 2016 (0)
- Duben 2016 (0)
- Březen 2016 (0)
- Únor 2016 (0)
- Leden 2016 (0)
2015
- Prosinec 2015 (0)
- Listopad 2015 (0)
- Říjen 2015 (0)
- Zaří 2015 (0)
- Srpen 2015 (0)
- Červenec 2015 (0)
- Červen 2015 (0)
- Květen 2015 (0)
- Duben 2015 (0)
- Březen 2015 (0)
- Únor 2015 (0)
- Leden 2015 (0)
2014
- Prosinec 2014 (0)
- Listopad 2014 (0)
- Říjen 2014 (0)
- Zaří 2014 (0)
- Srpen 2014 (0)
- Červenec 2014 (0)
- Červen 2014 (0)
- Květen 2014 (0)
- Duben 2014 (0)
- Březen 2014 (0)
- Únor 2014 (0)
- Leden 2014 (0)
2013
- Prosinec 2013 (83)
- Listopad 2013 (83)
- Říjen 2013 (83)
- Zaří 2013 (33)
- Srpen 2013 (83)
- Červenec 2013 (33)
- Červen 2013 (33)
- Květen 2013 (6)
- Duben 2013 (31)
- Březen 2013 (31)
- Únor 2013 (31)
- Leden 2013 (31)
2012
- Prosinec 2012 (0)
- Listopad 2012 (0)
- Říjen 2012 (0)
- Zaří 2012 (25)
- Srpen 2012 (0)
- Červenec 2012 (0)
- Červen 2012 (0)
- Květen 2012 (18)
- Duben 2012 (21)
- Březen 2012 (18)
- Únor 2012 (19)
- Leden 2012 (10)
2011
- Prosinec 2011 (8)
- Listopad 2011 (3)
- Říjen 2011 (9)
- Zaří 2011 (30)
- Srpen 2011 (81)
- Červenec 2011 (63)
- Červen 2011 (81)
- Květen 2011 (73)
- Duben 2011 (66)
- Březen 2011 (54)
- Únor 2011 (83)
- Leden 2011 (62)
2010
- Prosinec 2010 (52)
- Listopad 2010 (82)
- Říjen 2010 (90)
- Zaří 2010 (118)
- Srpen 2010 (57)
- Červenec 2010 (98)
- Červen 2010 (48)
- Květen 2010 (54)
- Duben 2010 (47)
- Březen 2010 (69)
- Únor 2010 (66)
- Leden 2010 (68)
2009
- Prosinec 2009 (61)
- Listopad 2009 (75)
- Říjen 2009 (78)
- Zaří 2009 (75)
- Srpen 2009 (69)
- Červenec 2009 (66)
- Červen 2009 (53)
- Květen 2009 (88)
- Duben 2009 (67)
- Březen 2009 (79)
- Únor 2009 (88)
- Leden 2009 (68)
2008
- Prosinec 2008 (76)
- Listopad 2008 (53)
- Říjen 2008 (71)
- Zaří 2008 (108)
- Srpen 2008 (57)
- Červenec 2008 (77)
- Červen 2008 (74)
- Květen 2008 (66)
- Duben 2008 (47)
- Březen 2008 (92)
- Únor 2008 (103)
- Leden 2008 (79)
2007
- Prosinec 2007 (81)
- Listopad 2007 (92)
- Říjen 2007 (75)
- Zaří 2007 (116)
- Srpen 2007 (119)
- Červenec 2007 (55)
- Červen 2007 (85)
- Květen 2007 (83)
- Duben 2007 (115)
- Březen 2007 (132)
- Únor 2007 (127)
- Leden 2007 (144)
2006
- Prosinec 2006 (150)
- Listopad 2006 (102)
- Říjen 2006 (109)
- Zaří 2006 (95)
- Srpen 2006 (122)
- Červenec 2006 (96)
- Červen 2006 (133)
- Květen 2006 (163)
- Duben 2006 (118)
- Březen 2006 (81)
- Únor 2006 (113)
- Leden 2006 (154)
2005
- Prosinec 2005 (126)
- Listopad 2005 (94)
- Říjen 2005 (156)
- Zaří 2005 (109)
- Srpen 2005 (128)
- Červenec 2005 (115)
- Červen 2005 (157)
- Květen 2005 (132)
- Duben 2005 (142)
- Březen 2005 (101)
- Únor 2005 (140)
- Leden 2005 (94)
2004
- Prosinec 2004 (162)
- Listopad 2004 (167)
- Říjen 2004 (170)
- Zaří 2004 (177)
- Srpen 2004 (108)
- Červenec 2004 (140)
- Červen 2004 (119)
- Květen 2004 (190)
- Duben 2004 (180)
- Březen 2004 (133)
- Únor 2004 (106)
- Leden 2004 (146)
2003
- Prosinec 2003 (139)
- Listopad 2003 (126)
- Říjen 2003 (118)
- Zaří 2003 (86)
- Srpen 2003 (116)
- Červenec 2003 (124)
- Červen 2003 (80)
- Květen 2003 (66)
- Duben 2003 (83)
- Březen 2003 (58)

Krédo

Nepodporujeme totalitární filozofie a systémy, národovectví, rasismus, xenofobii, národnostní a etnickou nesnášenlivost, vynasnažíme se přispět k odstranění nacionalismu, resentimentů, národních pudů a bludných představ o vlastním skvělém národě.

Časopis

Vychází měsíčně, každého 21. dne se objeví nové číslo na další kalendářní měsíc. V mezidobí se CS-magazín novými články nedoplňuje.

Archivace

Obsah jednotlivých čísel CS-magazínu archivuje Národní knihovna ČR pro potřeby dnešních čtenářů i budoucích generací.

Přetisk

Přetisk jakéhokoliv článku se povoluje s podmínkou, že se u článku uvede jako zdroj CS-magazín.

Spojení s redakcí

Komentáře a příspěvky můžete posílat e-mailem naší redakci stisknutím tlačítka v této rubrice Redakce

Květen 2007

Hej, počítači, pusť mi blues

Luděk Zadražil

Učí autorádia rozumět příkazům. Pracuje na takzvaných překladačích, které převádějí mluvenou angličtinu na mluvenou arabštinu a zpět. Podle Jana Šedivého budeme dříve nebo později všichni ovládat počítač hlasem.

K čemu je strojové rozpoznávání řeči dobré?

Řeč je jedním ze způsobů, jak lze ovládat počítač. Klávesnici a myš doplňují nebo úplně nahrazují mluvené povely.

A proč dobře sloužící klávesnici a myš nahrazovat?

Existují situace, kdy jsou ruce i oči zaměstnány, a proto nemůžete zařízení řídit jinak než hlasem. Třeba v automobilech, které jsou dnes rozhodně největším odvětvím, kde se rozpoznávání hlasu prosazuje. Dalším využitím je analýza přirozeného jazyka. Používá se pro monitorování všeho, co lidé řeknou, třeba v rádiu nebo televizi. Vezměte si třeba vyhledávač Google. Používá rozpoznávání řeči pro videa. Akustickou část vysílání konvertuje systém na text a tím umožňuje lidem vyhledávat v pořadech pomocí slov. Takže si třeba najdete, kdy se na CNN mluvilo o České republice.

Jde tedy o to, že počítač pozná nejen povely, ale i plynulou řeč?

Nejenže počítač rozpozná řeč, ale dovede rozpoznat i smysl a obsah řeči, převést informace obsažené ve větě do strukturované podoby a zapsat je do databáze. Pro toho, kdo tohle bude umět pořádně, to bude z tržního pohledu terno. Jde o to, dostat z prosté mluvy všechny informace. Když si například pan Koníček bude jen tak v telefonu s někým povídat o tom, jak se jmenuje, kde bydlí a co dělá, počítač to dokáže „pochopit“ a do databáze vyplnit do kolonek příslušné údaje.

To zní jako na zákaznické lince.

Vždyť ty jsou jedním z největších oborů, kde se dnes rozpoznávání řeči používá. Na začátek hovoru přidáme „rozpoznávač“ řeči. I když jen zjistí, co člověk potřebuje, a přepojí ho na konkrétního operátora, společnosti tím ušetří mnoho operátorů a tím sníží náklady.

A něco více pro běžný život?

Možná se brzy objeví zajímavé aplikace pro hlasové procházení internetu. Také by bylo užitečné ovládat internet řečí, ale možná také ne. To zatím nikdo neví, dokud nevytvoří konkrétní program a ten neotestuje na lidech. Nejdůležitější je, aby bylo hlasové ovládání užitečné. Když musím luxovat, chci to dělat tak, abych měl co nejdřív hotovo. Stejné je to s řečí: musí mi pomoci zvládnout úkoly co nejrychleji. Vezměme si třeba e-mail - je přece nesrovnatelně pohodlnější, když jen řeknete: „Ukaž mi maily od pana Kratochvíla za poslední měsíc“, než ta spousta úkonů, které musíte udělat pomocí klávesnice a myši. A samozřejmě musíte vědět, jak se to dělá. Říci to je přirozené a jednoduché. A porozumět takovému příkazu už pro dnešní programy není složité.

Zatím ale není hlasové ovládání osobních počítačů příliš běžné.

Klávesnice a myš jsou standardním vybavením, ale mikrofon už každý nemá. Ovšem začíná se to měnit a s rostoucí oblibou internetového telefonování už si mikrofon pořizuje spousta lidí. I skoro všechny notebooky mají mikrofon. Navíc přibývá kamer a kombinací videa a zvuku už můžeme získat o člověku před počítačem spoustu informací.

Jde vždy o hledání významu? Nebo je i jiný důvod, proč může počítač člověka poslouchat?

Ano, třeba systém „reading companion“ pomáhá americkým přistěhovalcům s výukou angličtiny. Kontroluje studentům, dětem imigrantů, správnou výslovnost. Vyberou si elektronickou knihu a čtou podle toho, jak jim to panáček u textu ukazuje. Počítač přitom poslouchá a kontroluje jejich výkon.

Nejběžnější využití, s nímž se může člověk setkat, je tedy v autě. Jde o striktní příkazy, nebo už si lze s autorádiem či navigací povídat?

Dlouho platilo, že rozhovor s člověkem vede přístroj: ptal se ho a člověk z nabídnutých odpovědí vybíral. Iniciativa ale přechází od stroje k člověku. Systém se prostě zeptá: „Jak vám dnes mohu pomoci?“ a tím vám dává šanci, abyste vedli dialog. Ono to tak tedy nikdy nedopadne, protože program potřebuje zkompletovat dotaz, a tak se vás stejně ptá na upřesňující informace. Třeba nákup letenek: řeknete, že chcete do New Yorku, ale systém se vás hned zeptá, na které letiště, pak chce vědět, kdy to bude, jakou chcete třídu a tak dále. Nicméně máte možnost s konverzací začít.

A co obyčejné spotřebiče v domácnosti, budou nám už brzy rozumět? Co třeba poručit televizi, ať přepne na jiný kanál?

O tom se hodně mluví a všichni by to chtěli, ale má to háček: když chodíte po obývacím pokoji, tak u sebe nemáte mikrofon. A zabudovat do televize mikrofon, který by vám rozuměl na dálku, je dost složité. Jde to, nicméně cena je příliš vysoká.

A jak je to s diktováním počítačové sekretářce? V angličtině to docela funguje, ale co čeština? Je o tolik těžší?

Angličtina má jen jednu nevýhodu: slovo se často čte úplně jinak, než se píše. V češtině je to až na pár výjimek jednoduché, většinou čtete to, co vidíte. Ovšem hrozné je skloňování a časování. Když si vezmete Wall Street Journal, tak vám na pokrytí 95 procent textu stačí v angličtině slovník o dvaceti tisících slov. V češtině jde o miliony, protože potřebujete mít ve slovníku všechny tvary. Některá přídavná jména potřebují až sto šedesát tvarů.

Takže ve slovníku musejí být opravdu všechny varianty?

Ano, protože jde o seznam všech slov včetně jejich výslovnosti. To, co řeknete do mikrofonu, se promění na nějaké napětí a proud, což se pak převádí na čísla. Slovník obsahuje u všech slov jejich popis právě v těchto číslech.

A co jiné jazyky? Jsou některé mimořádně jednoduché a jiné naopak velmi těžké?

S italštinou nebo španělštinou se pracuje výborně. Každý foném je jasný, separovaný, snadno ho oddělíte a poznáte. Akustika je tam úžasná. Specifická je také čínština. Každá hláska má různé významy podle tónu, kterým ji řeknete. Speciálně pro tento jazyk tak musíme jako součást rozpoznávání hlasu používat také systém, který určí tón. Proto je také tak těžké naučit se čínsky. Naopak japonština je lehká. Když zopakujete něco, co jste slyšeli od Japonce, je velká pravděpodobnost, že vám bude rozumět. Takže i pro počítač je to snadné. Komplikace přináší jen velké množství slov, která mají různé významy podle kontextu. Systém snadno rozumí, ale je pro něj těžké přesně pochopit. Naštěstí obsahuje japonština spoustu zdvořilostních frází, které můžete prostě vypustit, protože nenesou žádnou informaci.

Vaše oddělení pracuje také na překladači MASTOR používaném americkou armádou v Iráku. Jaká je jeho přesnost?

Systém se naštěstí zaměřuje na určité tematické okruhy. Takže třeba pro nemocnici počítáte s tím, že pacient mluví o tom, co ho bolí. Na takové použití je automatický překladatel ideální. Podobné je to se zařízením, které překládá mezi angličtinou a japonštinou. Je určené pro turisty, takže předpokládáte určitá témata, jako „kde je nejbližší pumpa“. Když mu ale řeknete, že zítra půjdeme s Maruškou na hřbitov, protože jsou Dušičky, tak určitě fungovat nebude.

Jan Šedivý v roce 1977 absolvoval ČVUT, o pět let později získal doktorát. Od roku 1992 pracoval v newyorském Výzkumném centru T. J. Watsona společnosti IBM. Od roku 2000 je vedoucím skupiny hlasových technologií a systémů české pobočky společnosti IBM. Je jedním z hlavních tvůrců programu pro rozpoznávání hlasu Embedded ViaVoice. Jeho skupina se dnes věnuje vývoji nových uživatelských rozhraní, která využívají hlas, gesta a další netradiční vstupy. Současně pracuje také na několika evropských grantových projektech.

(Týden)

Zpátky