The goals of the project is to study and improve statistical methods for learning of statistical models used in complex dialogue systems. The project will focus on development of robust learning techniques which will not be sensitive to the data sparsity problem. The data sparsity problem is especially typical in languages with rich morphology and syntax such as Czech. In addition, the project will target development of the advanced learning methods for statistical dialogue systems, including off-policy reinforcement learning methods.
Hlasové dialogové systémy mají široké možnosti uplatnění, kterými jsou například automatizace hlasových kontaktních center nebo pomoc hendikepovaným. Přestože se tyto systémy začínají čím dál víc uplatňovat v praxi, tak tyto systémy stále neumožňují plynulou konverzaci, zejména proto, že metody řízení dialogu využívají deterministických algoritmů, které jsou pouze manuálně optimalizovány.
Zkušenosti z vývoje statistických metod pro zpracování přirozeného jazyka naznačují, že učení z dat a optimální rozhodování významně zlepšuje kvalitu a usnadňuje nasazení takových technologií. Proto budou v rámci tohoto projektu hlasové dialogové systémy modelovány jako tzv. částečně pozorovatelný Markovův proces (POMDP) a trénování takových systémů bude založeno na statistických metodách.
Cílem tohoto projektu je vývoj statistických metod, které umožní návrh komplexních dialogových systémů včetně optimalizace jednotlivých statistických modelů z dat. Projekt bude usilovat o vývoj robustních technik umožňujících trénovat spolehlivé statistické modely, které nebudou citlivé na problém s „řídkostí“ dat, který je typický pro jazyky s bohatou morfologií a syntaxí jako je čeština. Navíc se projekt zaměří na samotný způsob trénování těchto modelů. Budou vyvíjeny metody, které umožňují optimalizaci strategie řízení z již dříve pořízených dat (korpusu) nebo přímo z interakce s reálnými uživateli.
Ačkoliv se projekt bude zabývat především vývojem statistických metod pro popis a poznání zákonitostí dialogu v přirozeném jazyce, a tedy bude převážně výzkumem základním, hmatatelným výsledkem projektu bude prototyp dialogového systému a metody pro jeho trénování z dat. Vývoj a popis těchto technologií následně povede ke zvýšení robustnosti a přirozenosti dialogových systémů za současného snížení nákladů na jejich uvedení do provozu.