EVALD 4.0 for Foreigners

(Evaluator of Discourse for Foreigners)

(popis v češtině najdete níže)

1 Introduction

EVALD 4.0 for Foreigners (© 2019) is software that serves for automatic evaluation of surface coherence (cohesion) in Czech texts written by non-native speakers of Czech. The software monitors about 200 language features in mutual interaction from various language fields: spelling, morphology, lexicology, syntax, text syntax (sentence information structure) and text structure (semantic discourse relations, anaphora and coreference).

EVALD 4.0 for Foreigners is an update of the previous versions of EVALD for Foreigners – EVALD 1.0 for Foreigners, EVALD 2.0 for Foreigners and EVALD 3.0 for Foreigners.

The input document submitted to EVALD 4.0 for Foreigners is a written text created by a learner of Czech who wants to know the level of his or her writing skills in Czech in terms of surface coherence. EVALD software processes the text by internal procedures and then informs the user about the supposed level of surface coherence in the submitted text. In the assessment, six possible levels of text coherence are identified: A1, A2, B1, B2, C1, C2. These categories were established by the Council of Europe and described in the Common European Framework of Reference for Languages (CEFR). The level of A (A1 and A2) is for basic users of language, B (B1 and B2) for independent users of language and C (C1 and C2) for proficient users of language.1 EVALD 4.0 for Foreigners was trained on authentic texts written by non-native speakers (learners) of Czech (the texts are taken from the corpus MERLIN2 and CzeSL-SGT3 containing writing samples created especially during the Czech Language Certificate Exams).4

Firstly, the texts were divided into categories A1 to C2 by teachers (assessors) on the basis of their surface coherence level. Afterwards, the machine learning experiments on the evaluated texts were carried out.

EVALD 4.0 for Foreigners was learning how a human assessor evaluates the texts in order to be able to evaluate new texts itself (to divide them into categories A1 to C2). The software classifies the new texts according to schemes that it has previously learned on the so-called training data, using the Random Forest algorithm, available within the Weka software with open access.  

EVALD 4.0 for Foreigners was created in order to evaluate the submitted text by one of the mentioned marks/categories (i.e. A1–C2) from the perspective of surface coherence and in this respect to approach human evaluation.5

 

2 Installation and instruction manual

Please see the documentation tab for instructions how to get and run Evald 4.0 for Foreigners.

On-line demo version: https://lindat.mff.cuni.cz/services/evald-foreign/

 

3 Targeted users

EVALD 4.0 for Foreigners can be used e.g. by teachers of Czech as a foreign language for the evaluation of student essays6 in terms of surface text coherence or by learners of Czech who can easily verify their level of coherence in Czech thanks to this software. At the same time, it may be used by students with special educational needs, especially by the deaf students whose writing skills in Czech tend to have similar characteristics as the writing skills by the foreigners.

Software is available publicly and free of charge, without obtaining a license.7

 

4 Bibliographic reference

Michal Novák, Jiří Mírovský, Kateřina Rysová, Magdaléna Rysová, Eva Hajičová: EVALD 4.0 for Foreigners – Evaluator of Discourse. Data/software, LINDAT/CLARIN digital library, Prague, Czech Republic,  http://hdl.handle.net/11234/1-3066, Oct 2019. On-line demo version: https://lindat.mff.cuni.cz/services/evald-foreign/

 
1 For example, the required level for granting permanent residence in the Czech Republic is B1 (or higher), see the web of Ministry of the interior of the Czech Republic (http://www.mvcr.cz/clanek/udeleni-statniho-obcanstvi-ceske-republiky.aspx).
2 MERLIN (http://www.merlin-platform.eu/). See also Boyd, Adriane; Hana, Jirka; Nicolas, Lionel; Meurers, Detmar; Wisniewski, Katrin; Abel, Andrea; Schöne, Karin; Štindlová, Barbora; Vettori, Chiara: The MERLIN corpus: Learner language and the CEFR. In: Proceedings of the 9th International Conference on Language Resources and Evaluation (LREC 2014). European Language Resources Association, Reykjavík, Iceland, ISBN 978-2-9517408-8-4, pp. 1281–1288, 2014.
3 Šebesta, Karel; Bedřichová, Zuzanna; Šormová, Kateřina et al., 2014, AKCES 5 (CzeSL-SGT), LINDAT/CLARIN digital library at the Institute of Formal and Applied Linguistics, Charles University in Prague, http://hdl.handle.net/11858/00-097C-0000-0023-95B1-E.
4 We gratefully thank to the authors of these corpora for their kind providing of the texts on which  EVALD 4.0 for Foreigners could be trained.
5 At the same time, it is necessary to emphasize that the software serves only as an assistant assessment tool and its assessment cannot fully substitute the human evaluation (although the software is able to determine the level of surface coherence in the submitted text with a relatively high probability).
6 The software is created for assessing the coherence of authentic writing samples (essays) written by non-native speakers of Czech. In other words, it is trained to evaluate (prosaic) texts whose content and form (e.g. length) correspond to the common essays created as a comprehensive piece of writing on a given topic, e.g. during the Czech language exam. When evaluating a different type of text (e.g. too short texts, poems etc.), the software may not work reliably. The maximum length of the text entered is 8,192 characters.
7 Other information on the software may be found in the paper Rysová, Kateřina; Rysová, Magdaléna; Mírovský, Jiří: Automatic evaluation of surface coherence in L2 texts in Czech. In: Proceedings of the 28th Conference on Computational Linguistics and Speech Processing ROCLING XXVIII (2016). The Association for Computational Linguistics and Chinese Language Processing (ACLCLP), Taipei, Taiwan, ISBN 978-957-30792-9-3, pp. 214–228, 2016. WWW: http://aclweb.org/anthology/O/O16/O16-1021.pdf
 


 

EVALD 4.0 pro cizince

(Evaluátor diskurzu pro cizince)

 

1 Úvod

Počítačový nástroj EVALD 4.0 pro cizince (© 2019) slouží k automatickému hodnocení povrchové koherence (koheze) textů v češtině psaných nerodilými mluvčími češtiny. Software hodnotí úroveň předloženého textu z hlediska jeho povrchové výstavby – zohledňuje cca 200 jazykových rysů ve vzájemné interakci, a to z oblasti pravopisu, morfologie, slovní zásoby, syntaxe, textové syntaxe (aktuálního členění větného) a výstavby textu (významových diskurzních vztahů a vztahů anafory a koreference).

EVALD 4.0 pro cizince je aktualizací předchozích verzí softwaru EVALD pro cizince – EVALD 1.0 pro cizince, EVALD 2.0 pro cizince a EVALD 3.0 pro cizince.

Vstupním dokumentem, který se předkládá softwaru EVALD 4.0 pro cizince, je psaný text vytvořený člověkem, který se učí česky a chce znát úroveň svého písemného vyjadřování z hlediska povrchové koherence. Software text vyhodnotí vnitřní procedurou a sdělí uživateli předpokládanou úroveň povrchové koherence předloženého textu.

Při hodnocení se rozlišuje šest možných úrovní koherence textu: A1, A2, B1, B2, C1, C2. Tyto kategorie byly stanoveny podle stupnice jazykových úrovní sestavené Radou Evropy a popsané ve Společném evropském referenčním rámci pro jazyky (SERR). Úrovně A (A1, A2) odpovídají uživatelům základů jazyka, úrovně B (B1, B2) samostatným uživatelům a úrovně C (C1, C2) zkušeným uživatelům.1

Software EVALD 4.0 pro cizince byl trénován na autentických textech nerodilých mluvčích češtiny – texty pocházejí z korpusů MERLIN2 a CzeSL-SGT3. Jedná se o písemné práce vytvořené zejména v rámci certifikovaných zkoušek z češtiny pro cizince.4

Tyto texty nejprve roztřídili učitelé (hodnotitelé) do kategorií A1–C2 na základě toho, jaké úrovně v nich dosahovala povrchová koherence. Poté byly na takto ohodnocených textech provedeny experimenty strojového učení. Software EVALD 4.0 pro cizince se učil, jak texty hodnotí člověk, aby díky tomu byl posléze sám schopen třídit nové texty do kategorií A1–C2 (třídí je podle schémat, která se předtím naučil na tzv. trénovacích datech), s využitím algoritmu Random Forest dostupného v rámci volně přístupného softwaru Weka.

Software EVALD 4.0 pro cizince byl tedy vytvořen tak, aby předloženému textu přiřadil jednu z uvedených známek/kategorií (tj. A1–C2) z hlediska povrchové koherence a přiblížil se přitom lidskému hodnocení.5

 

2 Instalace a návod k použití

Informace o získání a spuštění softwaru najdete v záložce dokumentace.

Demo verze přístupná on-line: https://lindat.mff.cuni.cz/services/evald-foreign/?lang=cs

 

3 Využití

Software EVALD 4.0 pro cizince mohou využívat např. učitelé češtiny jako cizího jazyka při hodnocení písemných prací6 či studenti češtiny jako cizího jazyka, kteří si díky softwaru mohou snadným a rychlým způsobem ověřit svoji úroveň češtiny z hlediska koherence textu. Zároveň jej mohou využívat i studenti se speciálními vzdělávacími potřebami, zejména neslyšící, jejichž vyjadřování v češtině mívá podobná specifika jako vyjadřování cizinců. Software je dostupný veřejně a zdarma, bez nutnosti získání licence.7
 

4 Bibliografický údaj

Michal Novák, Jiří Mírovský, Kateřina Rysová, Magdaléna Rysová, Eva Hajičová: EVALD 4.0 for Foreigners – Evaluator of Discourse. Data/software, LINDAT/CLARIN digital library, Prague, Czech Republic,  http://hdl.handle.net/11234/1-3066, Oct 2019. On-line demo version: https://lindat.mff.cuni.cz/services/evald-foreign/

 

 
1 Například žadatelé o udělení státního občanství ČR skládají zkoušku z češtiny jako cizího jazyka na celkové úrovni B1 (či vyšší), viz informace na webu Ministerstva vnitra ČR (http://www.mvcr.cz/clanek/udeleni-statniho-obcanstvi-ceske-republiky.aspx).
2 MERLIN (http://www.merlin-platform.eu/). Srov. Boyd, Adriane; Hana, Jirka; Nicolas, Lionel; Meurers, Detmar; Wisniewski, Katrin; Abel, Andrea; Schöne, Karin; Štindlová, Barbora; Vettori, Chiara: The MERLIN corpus: Learner language and the CEFR. In: Proceedings of the 9th International Conference on Language Resources and Evaluation (LREC 2014). European Language Resources Association, Reykjavík, Iceland, ISBN 978-2-9517408-8-4, pp. 1281–1288, 2014.
3 Šebesta, Karel; Bedřichová, Zuzanna; Šormová, Kateřina et al., 2014, AKCES 5 (CzeSL-SGT), LINDAT/CLARIN digital library at the Institute of Formal and Applied Linguistics, Charles University in Prague, http://hdl.handle.net/11858/00-097C-0000-0023-95B1-E.
4 Děkujeme tvůrcům obou korpusů za laskavé poskytnutí textů, na kterých mohl být software EVALD trénován.
5 Zároveň je nutné zdůraznit, že software slouží pouze jako pomocný hodnoticí nástroj a jeho hodnocení nemůže plně nahrazovat hodnocení člověka, jakkoli je software schopen určit úroveň povrchové koherence textu s relativně vysokou pravděpodobností.
6 Software je určen pro hodnocení koherence autentických písemných (slohových) prací vytvořených nerodilými mluvčími češtiny. Tj. je trénován na hodnocení prozaických textů obsahem a rozsahem (formou) odpovídajících běžné slohové práci vytvořené např. při zkoušce z češtiny jako cizího jazyka jako samostatný, ucelený písemný projev na zadané téma. Při hodnocení jiného typu textů (např. příliš krátkých textů, básní apod.) software nemusí pracovat spolehlivě. Maximální možná délka zadaného textu je 8 192 znaků.
7 Další informace o softwaru lze nalézt ve článku Rysová, Kateřina; Rysová, Magdaléna; Mírovský, Jiří: Automatic evaluation of surface coherence in L2 texts in Czech. In: Proceedings of the 28th Conference on Computational Linguistics and Speech Processing ROCLING XXVIII (2016). The Association for Computational Linguistics and Chinese Language Processing (ACLCLP), Taipei, Taiwan, ISBN 978-957-30792-9-3, s. 214–228, 2016. WWW: http://aclweb.org/anthology/O/O16/O16-1021.pdf