Friday, September 22, 2017 - 19:00 to Tuesday, September 26, 2017 - 10:00

SloNLP 2017

English version

SloNLP je slovenskočeský workshop speciálně zaměřený na zpracování přirozeného jazyka a počítačovou lingvistiku. Jeho hlavním cílem je podpořit spolupráci mezi výzkumníky v oblasti NLP v Česku a na Slovensku; k účasti proto vyzýváme i magisterské studenty a doktorandy věnující se počítačové lingvistice.

Mezi témata workshopu patří automatické rozpoznávání mluvené řeči (ASR), automatická analýza a generování přirozeného jazyka (morfologie, syntax, sémantika...), dialogové systémy (DS), strojový překlad (MT), vyhledávání informací (IR), praktické aplikace NLP technologií, a další témata počítačové lingvistiky.

Uvítáme také články o probíhajícím výzkumu s předběžnými výsledky (work in progress), články popisující negativní výsledky (negative results), a články představující návrhy na budoucí výzkum.

Workshop je součástí konference ITAT, která se koná 22.9. - 26.9.2017 v hotelu Martinské hole, Malá Fatra, Slovensko. Workshop plánujeme jako jednodenní a jeho datum bude upřesněno.

Proceedings

proceedings coverČlánky SloNLP jsou součástí hlavního sborníku ITATu, který je publikovaný online v CEURu, a zároveň v tištěné podobě na Amazonu. Navrhovaný způsob citování článků pomocí BibTeXu je následující (pro lidsky čitelnou podobu viz záznam v Bibliu):

@inproceedings{slonlp2017:XXXauthornameXXX,
  booktitle = {Proceedings of the 17th conference {ITAT} 2017:
    Slovensko{\v{c}}esk{\'{y}} {NLP} workshop (Slo{NLP} 2017)},
  title = {XXX paper title XXX},
  editor = {Jaroslava Hlav{\'{a}}{\v{c}}ov{\'{a}}},
  author = {XXX paper authors XXX},
  year = {2017},
  publisher = {CreateSpace Independent Publishing Platform},
  organization = {{\'{U}}{FAL} {MFF} {UK}},
  address = {Praha, Czechia},
  venue = {Martinsk{\'{e}} hole***},
  series = {{CEUR} Workshop Proceedings},
  volume = {1885},
  pages = {XXXpagefrom-pagetoXXX},
  isbn = {978-1974274741},
  issn = {1613-0073},
}

Program workshopu

Tento rok konference ITAT probíhá jednovláknově, bez paralelních sekcí, program hlavní konference i všech workshopů je proto bez problémů přístupný všem účastníkům konference či workshopů. Program workshopu SloNLP naleznete níže, program hlavní konference a dalších workshopů najdete na webu ITATu. Z programu hlavní konference doporučujeme pro účastníky SloNLP zejména lingvistické přednášky v pátek večer (19:10-20:10).

Sobota 23.9.2017

  • 10:30-10:35 Úvodní slovo (Rudolf Rosa)
  • 10:35-10:50 Boaster session (chair: Petra Barančíková)
  • 10:50-12:00 Poster session (společná s main trackem ITATu)
    • [SloNLP] Tomas Hercig, Peter Krejzl, Barbora Hourová, Josef Steinberger and Ladislav Lenc: Detecting Stance in Czech News Commentaries
    • [SloNLP] Tomáš Jelínek: A manually annotated treebank of literary Czech
    • [SloNLP] Ladislav Lenc and Pavel Král: Ensemble of Neural Networks for Multi-label Document Classification
    • [SloNLP] Michal Novák: Coreference Resolution System Not Only for Czech
    • [SloNLP] Rudolf Rosa: MonoTrans: Statistical Machine Translation from Monolingual Data
    • [ITAT] Michaela Linková and Peter Gurský. Attributes extraction from product descriptions on e-shops
    • [ITAT] Rudolf Pavel and Peter Gurský. Focused Web crawling of relevant pages on e-shops
  • 19:00-20:00 Jiří Hana: Generování textů v přirozeném jazyce (zvaná přednáška SloNLP)

Neděle 24.9.2017

  • 19:00-??? Banket

Zvaná přednáška: Generování textů v přirozeném jazyce

Přednese Jirka Hana, GeneeaJirka Hana

Přednáška představí problematiku generování textu na příkladu sportovních zpráv. Jde o společný projekt nakladatelství Economia a firmy Geneea. Vyvíjený systém vytváří novinové články popisující jednotlivá sportovní utkání. Články jsou generovány na základě strukturovaných dat o událostech na hřišti a dat v databázích, jakou je například znalostní báze Wikidata. V této fázi projektu jde pouze o fotbalové zápasy, ale v blízké budoucnosti bude systém rozšířen na další sporty a výhledově také na zprávy o počasí a zprávy z burzy.

Jiří Hana má zkušenosti jak z firemního, tak z univerzitního prostředí. Vystudoval informatiku na Matematicko-fyzikální fakultě UK a lingvistiku na Ohio State University. V USA strávil téměř 10 let. Mezi jeho zájmy patří morfologie, příklonky a jazyk cizinců. Je výzkumným pracovníkem na Ústavu formální a aplikované lingvistiky MFF UK a spoluzakladatelem společnosti Geneea Analytics, startupu vyvíjejícího systémy pro analýzu a generování textů.

Pokyny pro autory

  • článek v angličtině
  • každý článek bude recenzován 2-3 recenzenty
  • recenzování bude prováděno dvojitě slepým způsobem (double-blind), článek k recenzi proto zasílejte anonymizovaný
    • v článku k recenzi neuvádějte žádné informace o autorech ani o grantech; ty uveďte až ve finální verzi (camera-ready)
    • na svou předchozí práci se snažte odkazovat jakoby byla cizí, a pokuste se vyhnout nadměrnému citování vlastních prací
    • v případě žádosti o studentský grant (vyplňuje se při zasílání článku v EasyChairu) vyplňte jméno autora, který bude článek prezentovat, až při zasílání finální verze článku; případně vyplňte anonymiziovaně (napište např. pouze "první autor")
  • pokud je článek současně ve více recenzních řízeních, je nutné v případě publikace článku jinde (jiná konference/časopis) článek stáhnout nejpozději před odesláním finální verze
  • prezentace na workshopu formou posteru (plus 1-2 slajdy na 1-2 minuty poster boaster prezentace)
    • pokud preferujete klasickou ústní prezentaci se slajdy, vyberte tuto možnost při zasílání článku v EasyChair
    • článek či články nominované na ITAT Best Paper budou pravděpodobně prezentovány večer v rámci společného programu hlavní konference ústní formou (tuto informaci příšlušným autorům sdělíme společně s informací o přijetí jejich článku)
  • workshop bude probíhat ve slovenštině/češtině, případně angličtině (zejména v případě účasti zahraničních účastníků)
    • poster (resp. slajdy) vypracujte pokud možno v angličtině
  • články budou publikovány ve sborníku konference ITAT (s ISBN)

Důležité termíny

  • do   15.5. 22.5. zaslání abstraktu (50 - 200 slov) -- dedlajn prodloužen
  • do   22.5. 29.5. zaslání článku k recenzi -- dedlajn prodloužen
  • do   26.6. oznámení o přijetí/zamítnutí/pomíněném přijetí článku
  • do   14.7. finální verze článku (do 12.7. pro podmíněně přijaté články)
  • 22.-26.9. konference

Dalši termíny budou upřesněny (registrace, prezentace).

Všechny deadlines jsou 23:59 AoE.

Programový výbor

Minulé ročníky