Friday, 22 September, 2017 - 19:00 to Tuesday, 26 September, 2017 - 10:00

SloNLP 2017

English version

Aktuálně: SloNLP 2018

SloNLP je slovenskočeský workshop speciálně zaměřený na zpracování přirozeného jazyka a počítačovou lingvistiku. Jeho hlavním cílem je podpořit spolupráci mezi výzkumníky v oblasti NLP v Česku a na Slovensku; k účasti proto vyzýváme i magisterské studenty a doktorandy věnující se počítačové lingvistice.

Mezi témata workshopu patří automatické rozpoznávání mluvené řeči (ASR), automatická analýza a generování přirozeného jazyka (morfologie, syntax, sémantika...), dialogové systémy (DS), strojový překlad (MT), vyhledávání informací (IR), praktické aplikace NLP technologií, a další témata počítačové lingvistiky.

Uvítáme také články o probíhajícím výzkumu s předběžnými výsledky (work in progress), články popisující negativní výsledky (negative results), a články představující návrhy na budoucí výzkum.

Workshop je součástí konference ITAT, která se koná 22.9. - 26.9.2017 v hotelu Martinské hole, Malá Fatra, Slovensko. Workshop plánujeme jako jednodenní a jeho datum bude upřesněno.

Proceedings

proceedings coverČlánky SloNLP jsou součástí hlavního sborníku ITATu, který je publikovaný online v CEURu, a zároveň v tištěné podobě na Amazonu. Navrhovaný způsob citování článků pomocí BibTeXu je následující (pro lidsky čitelnou podobu viz záznam v Bibliu):

@inproceedings{slonlp2017:XXXauthornameXXX,
 booktitle = {Proceedings of the 17th conference {ITAT} 2017:
   Slovensko{\v{c}}esk{\'{y}} {NLP} workshop (Slo{NLP} 2017)},
 title = {XXX paper title XXX},
 editor = {Jaroslava Hlav{\'{a}}{\v{c}}ov{\'{a}}},
 author = {XXX paper authors XXX},
 year = {2017},
 publisher = {CreateSpace Independent Publishing Platform},
 organization = {{\'{U}}{FAL} {MFF} {UK}},
 address = {Praha, Czechia},
 venue = {Martinsk{\'{e}} hole***},
 series = {{CEUR} Workshop Proceedings},
 volume = {1885},
 pages = {XXXpagefrom-pagetoXXX},
 isbn = {978-1974274741},
 issn = {1613-0073},
}

Program workshopu

Tento rok konference ITAT probíhá jednovláknově, bez paralelních sekcí, program hlavní konference i všech workshopů je proto bez problémů přístupný všem účastníkům konference či workshopů. Program workshopu SloNLP naleznete níže, program hlavní konference a dalších workshopů najdete na webu ITATu. Z programu hlavní konference doporučujeme pro účastníky SloNLP zejména lingvistické přednášky v pátek večer (19:10-20:10).

Sobota 23.9.2017

 • 10:30-10:35 Úvodní slovo (Rudolf Rosa)
 • 10:35-10:50 Boaster session (chair: Petra Barančíková)
 • 10:50-12:00 Poster session (společná s main trackem ITATu)
  • [SloNLP] Tomas Hercig, Peter Krejzl, Barbora Hourová, Josef Steinberger and Ladislav Lenc: Detecting Stance in Czech News Commentaries
  • [SloNLP] Tomáš Jelínek: A manually annotated treebank of literary Czech
  • [SloNLP] Ladislav Lenc and Pavel Král: Ensemble of Neural Networks for Multi-label Document Classification
  • [SloNLP] Michal Novák: Coreference Resolution System Not Only for Czech
  • [SloNLP] Rudolf Rosa: MonoTrans: Statistical Machine Translation from Monolingual Data
  • [ITAT] Michaela Linková and Peter Gurský. Attributes extraction from product descriptions on e-shops
  • [ITAT] Rudolf Pavel and Peter Gurský. Focused Web crawling of relevant pages on e-shops
 • 19:00-20:00 Jiří Hana: Generování textů v přirozeném jazyce (zvaná přednáška SloNLP)

Neděle 24.9.2017

 • 19:00-??? Banket

Zvaná přednáška: Generování textů v přirozeném jazyce

Přednese Jirka Hana, GeneeaJirka Hana

Přednáška představí problematiku generování textu na příkladu sportovních zpráv. Jde o společný projekt nakladatelství Economia a firmy Geneea. Vyvíjený systém vytváří novinové články popisující jednotlivá sportovní utkání. Články jsou generovány na základě strukturovaných dat o událostech na hřišti a dat v databázích, jakou je například znalostní báze Wikidata. V této fázi projektu jde pouze o fotbalové zápasy, ale v blízké budoucnosti bude systém rozšířen na další sporty a výhledově také na zprávy o počasí a zprávy z burzy.

Jiří Hana má zkušenosti jak z firemního, tak z univerzitního prostředí. Vystudoval informatiku na Matematicko-fyzikální fakultě UK a lingvistiku na Ohio State University. V USA strávil téměř 10 let. Mezi jeho zájmy patří morfologie, příklonky a jazyk cizinců. Je výzkumným pracovníkem na Ústavu formální a aplikované lingvistiky MFF UK a spoluzakladatelem společnosti Geneea Analytics, startupu vyvíjejícího systémy pro analýzu a generování textů.

Pokyny pro autory

 • článek v angličtině
 • každý článek bude recenzován 2-3 recenzenty
 • recenzování bude prováděno dvojitě slepým způsobem (double-blind), článek k recenzi proto zasílejte anonymizovaný
  • v článku k recenzi neuvádějte žádné informace o autorech ani o grantech; ty uveďte až ve finální verzi (camera-ready)
  • na svou předchozí práci se snažte odkazovat jakoby byla cizí, a pokuste se vyhnout nadměrnému citování vlastních prací
  • v případě žádosti o studentský grant (vyplňuje se při zasílání článku v EasyChairu) vyplňte jméno autora, který bude článek prezentovat, až při zasílání finální verze článku; případně vyplňte anonymiziovaně (napište např. pouze "první autor")
 • pokud je článek současně ve více recenzních řízeních, je nutné v případě publikace článku jinde (jiná konference/časopis) článek stáhnout nejpozději před odesláním finální verze
 • prezentace na workshopu formou posteru (plus 1-2 slajdy na 1-2 minuty poster boaster prezentace)
  • pokud preferujete klasickou ústní prezentaci se slajdy, vyberte tuto možnost při zasílání článku v EasyChair
  • článek či články nominované na ITAT Best Paper budou pravděpodobně prezentovány večer v rámci společného programu hlavní konference ústní formou (tuto informaci příšlušným autorům sdělíme společně s informací o přijetí jejich článku)
 • workshop bude probíhat ve slovenštině/češtině, případně angličtině (zejména v případě účasti zahraničních účastníků)
  • poster (resp. slajdy) vypracujte pokud možno v angličtině
 • články budou publikovány ve sborníku konference ITAT (s ISBN)

Důležité termíny

 • do   15.5. 22.5. zaslání abstraktu (50 - 200 slov) -- dedlajn prodloužen
 • do   22.5. 29.5. zaslání článku k recenzi -- dedlajn prodloužen
 • do   26.6. oznámení o přijetí/zamítnutí/pomíněném přijetí článku
 • do   14.7. finální verze článku (do 12.7. pro podmíněně přijaté články)
 • 22.-26.9. konference

Dalši termíny budou upřesněny (registrace, prezentace).

Všechny deadlines jsou 23:59 AoE.

Programový výbor

Minulé ročníky