[ Skip to the content ]

Institute of Formal and Applied Linguistics

at Faculty of Mathematics and Physics, Charles University, Prague, Czech Republic


[ Back to the navigation ]

Publication


Year 2016
Type oral presentation *
Status published
Language English
Author(s) Kríž, Vincent
Title Statistical Recognition of References in Czech Court Decisions
Czech title Statistiké rozpoznávaní referencí v českých soudních rozhodnutích
Publisher's city and country Prague, Czech Republic
Venue Institute of Formal and Applied Linguistics, Faculty of Mathematics and Physics, Charles University in Prague
Month May
URL http://ufal.mff.cuni.cz/~kriz/talks/jtagger_presented_2016-05-10.pdf
Supported by 2016 SVV 260 333 (Teoretické základy informatiky a výpočetní lingvistiky) 2012-2015 TA02010182 (Inteligentní knihovna - INTLIB)
Czech abstract RExtractor je systém pro extrakci informací. Vstupní dokumenty jsou zpracovány NLP nástroji. Extrakce následně probíhá pomocí dotazů nad závislostními stromy. Výsledkem je znalostní báze dokumentu, definována jako množina entit a vztahů mezi nima. Dotazy nad stromy jsou definovány manuálně. Architektura systému je navržena doménově a jazykově nezávisle. Systém demonstrujeme na českých a anglických právních dokumentech.
English abstract The RExtractor system is an information extractor that processes input documents by natural language processing tools and consequently queries the parsed sentences to extract a knowledge base of entities and their relations. The extraction queries are designed manually using a tool that enables natural graphical representation of queries over dependency trees. A workflow of the system is designed to be language and domain independent. We demonstrate RExtractor on Czech and English legal documents.
Specialization linguistics ("jazykověda")
Confidentiality default – not confidential
Event NLP Applications
Presentation type in-house seminar/lecture
Open access no
Creator: Common Account
Created: 10/10/16 1:04 PM
Modifier: Common Account
Modified: 10/10/16 1:04 PM
***

Content, Design & Functionality: ÚFAL, 2006–2016. Page generated: Wed Jul 18 04:31:10 CEST 2018

[ Back to the navigation ] [ Back to the content ]

100% OpenAIRE compliant