English Česky
Header Image n.1Header Image n.2Header Image n.3Header Image n.4Header Image n.5

p-rovina

Obrázek 1

Původní anotace Penn Treebanku je zobrazena jako dodatečná anotační rovina. Tuto rovinu jsme nazvali p-rovina (phrase-structure layer). Tato rovina není zarovnána s žádnou rovinou české části korpusu.

Obrázek 2

Původní závorkování bylo převedeno do PML, takže je možné je prohlížet a zpracovávat anotačním nástrojem TrEd. Každému uzlu bylo přiřazeno unikátní ID. Byly zachovány všechny původní atributy a jejich hodnoty. Obrázek 1 ukazuje příklad věty z Penn Treebanku zobrazené v TrEdu.

Terminální uzly, které reprezentují jednotlivé tokeny, jsou žluté, zatímco stopy jsou šedé. Nálepky neterminálních uzlů jsou zobrazeny také. Morfologické tagy jsou přiřazeny k terminálním uzlům, místo toho aby byly znázorněny jako zvláštní preterminály. V každém uzlu se uchovává jeho ID (defaultně se nezobrazuje). Tokeny jsou navíc lemmatizovány. Umístěním kurzoru myši na uzel se zobrazí ID a lemma uzlu v kompletním seznamu hodnot atributů, jenž se objeví ve zvláštním okně (viz Obrázek 2).