1. Typografické konvence

Příklady. V příručce je řada příkladů, které ilustrují popisovaný jev. Příklady mají ustálenou formu. Nezobrazují strukturu, ale pouze hodnoty atributů u uzlů reprezentujících jednotlivá slova vyjádřená i nevyjádřená v povrchové podobě věty.

Příkladové věty jsou vymyšlené a většinou jsou uvedeny bez kontextu. Naznačená anotace pak odpovídá anotaci této příkladové věty v nejobvyklejším kontextu.

Pozor! V příkladové větě je vždy zachycen jen ten úsek anotace, který má příklad ilustrovat (to například znamená, že pokud ilustrujeme zachycení nějakého vyjádřeného výrazu, nemusí být do příkladové věty doplněny všechny elidované výrazy).

Slova reprezentovaná jedním uzlem jsou v příkladové větě podtržena. Hodnota vybraného atributu náležející tomuto uzlu je uvedena v hranatých závorkách [ ] ve formě: název atributu=hodnota (je-li vybraných hodnot více, jsou zápisy uvnitř hranatých závorek odděleny středníkem). Je-li potřeba uvést v příkladové větě hodnoty náležející jen jednomu uzlu, je výčet hodnot v hranatých závorkách uveden za příkladovou větou. Je-li potřeba uvést hodnoty náležející více uzlům, následují výčty hodnot v hranatých závorkách hned za posledním podtrženým slovem, které je reprezentováno daným uzlem.

Výjimku představují hodnoty atributu functor. Je-li potřeba uvést funktory jednotlivých uzlů, uvádíme jejich hodnoty vždy hned za slovem (které je reprezentováno daným uzlem). Funktor není uváděn v hranatých závorkách, od slova je oddělen jen tečkou.

Příklady:

Upadl do nesnází.DIR3 na dlouhou dobu. [is_state=1]

Špičková cena.DENOM [is_member=1] a.CONJ špičkový výkon.DENOM [is_member=1]

V povrchové podobě věty nevyjádřená slova (reprezentovaná nově vytvořenými uzly) jsou v příkladech uváděny ve složených závorkách { }. Ve složených závorkách je vždy uvedeno t-lema nově vytvořeného uzlu, za kterým může, ale nemusí následovat zápis hodnot vybraných atributů.

Příklady:

{#PersPron.ACT} Přijde.

{#PersPron.ACT [tfa=t]} Přijde.

Je-li v příkladu třeba zdůraznit, že některá slova naopak nejsou v tektogramatickém stromě reprezentována samostatným uzlem, jsou tato slova uvedena ve špičatých závorkách < >.

Příklad:

Přijde jen.RHEM <tehdy>, <když> mu ustoupíš.TWHEN

Příkladové tektogramatické stromy. Pro řadu příkladových vět uvádíme v manuálu i příkladové tektogramatické stromy. V každém příkladovém tektogramatickém stromě je zachycena úplná anotace dané věty.

Pro tektogramatické stromy v PDT 2.0 byly zavedeny dvě šablony stylu zobrazení (viz Prague Dependency Treebank 2.0, CDROM, doc/tools/tred/PML_mak.html). Příkladové stromy jsou v manuálu zobrazeny šablonou PML_T_Full s následujícím nastavením.

Uzly. Na řádcích pod uzlem stromu se hodnoty atributů (pokud jsou u daného uzlu vyplněné) zobrazují v tomto pořadí:

Hodnoty atributů jsou většinou uváděny přímo, bez názvu atributu. Názvy atributů jsou uváděny u některých gramatémů, je-li jejich hodnota víceznačná. Hodnota atributu quot/type je vždy uvedena ve formě název atributu:hodnota.

U komplexních uzlů (nodetype=complex) se neuvádí hodnota atributu nodetype, rovnou je uvedena hodnota atributu gram/sempos.

Zápis state je uveden, pokud v atributu is_state je vyplněna hodnota 1.

Zápis _M je uveden, pokud v atributu is_member je vyplněna hodnota 1.

Zápis _P je uveden, pokud v atributu is_parenthesis je vyplněna hodnota 1.

Zápis person_name je uveden, pokud v atributu is_person_name je vyplněna hodnota 1.

Zápis dsp_root je uveden, pokud v atributu is_dsp_root je vyplněna hodnota 1.

Uzel reprezentující slovo vyjádřené v povrchové podobě věty se zobrazuje jako kolečko, nově vytvořený uzel pro výraz nevyjádřený v povrchové podobě věty (is_generated=1) se zobrazuje jako čtvereček.

(I barevná výplň uzlu má význam: žluté uzly jsou uzly s hodnotou f v atributu tfa, zelené uzly mají v atributu tfa hodnotu c, nevybarvené (bílé) uzly mají v atributu tfa hodnotu t. Uzly, u kterých není hodnota atributu tfa vyplněna, jsou šedivé.)

Hrany. Hrany jsou zobrazeny jako rovné spojnice mezi uzly.

Hrana mezi technickým kořenem tektogramatického stromu a kořenem reprezentované věty a hrany mezi uzly s funktorem PAR, PARTL, VOCAT, RHEM, CM, FPHR a PREC a jejich rodiči (jedná se o hrany nereprezentující závislost; viz 5.1.2 - "Nezávislostní hrany") jsou zobrazeny jako tenká přerušovaná čára.

Horní polovina hrany mezi kořenem souřadné struktury a terminálním členem souřadné struktury je zobrazena jako tenká šedivá čára, dolní polovina této hrany je zobrazena jako silná šedivá čára. Horní polovina hrany mezi kořenem souřadné struktury (který není přímým členem jiné souřadné struktury) a jeho rodičem je zobrazena jako silná šedivá čára, dolní polovina této hrany je zobrazena jako tenká šedivá čára. Hrana mezi kořenem souřadné struktury a kořenem společného rozvití je zobrazena jako tenká (modrá) čára. Hrana mezi kořenem souřadné struktury a přímým členem této struktury, kterým je opět kořen souřadné struktury (při vnořených souřadných strukturách) je zobrazena jako tenká šedivá čára. (K souřadným strukturám viz 5.6.1 - "Zachycení souřadnosti v tektogramatickém stromě").

Odkazy. Atributy typu odkaz reprezentující zejména koreferenční vztahy se zobrazují jako šipky směřující od jednoho uzlu k druhému. Gramatický koreferenční vztah je zobrazen jako (oranžová) přerušovaná (čárkovaná) šipka směřující od koreferujícího uzlu k uzlu koreferovanému. Textový koreferenční vztah je zobrazen jako (modrá) tečkovaná šipka směřující od koreferujícího uzlu k uzlu koreferovanému. Nenachází-li se koreferovaný uzel v tomtéž tektogramatickém stromě jako uzel koreferující, je šipka krátká a ukazuje nalevo nebo napravo od uzlu, podle toho, zda koreferovaný uzel je v předcházejícím nebo následujícím tektogramatickém stromě, a vedle t-lematu uzlu je na stejném řádku uvedeno t-lema koreferovaného uzlu.

Pozor! Textové koreferenční vztahy přesahující hranice jednoho tektogramatického stromu nejsou v příkladových tektogramatických stromech vyznačeny.

Odkazování k segmentu (coref_special=segm) je zobrazeno jako krátká (červená) šipka směřující nalevo od uzlu. Exoforické odkazování (coref_special=exoph) je zobrazeno jako krátká (modrá) šipka směřující vzhůru od uzlu.

Druhá závislost u doplňku je reprezentována (zelenou) přerušovanou (čárka - tečka) šipkou směřující od uzlu s funktorem COMPL k uzlu reprezentujícímu řídící jméno.

Pozor! V příkladových tektogramatických stromech není (stejně jako v anotovaných stromech v PDT 2.0; k tomu viz 5.2.4 - "Zachycení valence v tektogramatických stromech") zachycena valence všech substantiv, důsledně je zachycena pouze valence u substantiv verbálních!

Obrázek 1. Příkladový tektogramatický strom

Příkladový tektogramatický strom

Stroj funguje, ale ne optimálně, a proto ho musíme buď opravit, nebo koupit nový.

Obrázek 2. Příkladový tektogramatický strom

Příkladový tektogramatický strom

Přišel tam Petr (a Pavel).

Obrázek 3. Příkladový tektogramatický strom

Příkladový tektogramatický strom

Ozvalo se: "Nechoď tam!"

Další typografické konvence. V textu jsou tučným písmem na začátku odstavců zvýrazněny dílčí nadpisy. Kurzívou jsou zvýrazněny termíny, které se na daném místě vymezují a kurzívou jsou též psány příklady.

Tři vykřičníky !!! na začátku odstavce označují odstavec, ve kterém jsou uvedeny poznámky týkající se odlišnosti anotovaných dat od popisovaných pravidel. Není-li tato poznámka v sekci uvedena, předpokládá se, že data odpovídají popsaným pravidlům.