Kapitola 1. Základní principy reprezentace věty na tektogramatické rovině

Přirozený jazyk tvoří mimořádně složitý systém, proto je vhodné rozložit jeho popis do několika rovin. Nejvyšší rovina jazykového popisu ve funkčně generativním popisu (FGP), který slouží jako teoretické východisko PDT, se nazývá tektogramatická rovina a slouží k zachycení významové struktury věty. Tektogramatická rovina v PDT přebírá základní myšlenky z FGP, v řadě jednotlivostí je však doplněna nebo upravena.

Tektogramatická rovina PDT se řídí následujícími principy:

Tektogramatický strom (jakožto datová struktura) má tyto základní vlastnosti:

Při popisu tektogramatických stromů používáme také následující pojmy (zde je vysvětlujeme pouze neformálně):

Technický kořen tektogramatického stromu. Kořenem stromu je uzel, který nemá žádnou lingvistickou interpretaci a slouží pouze k technickým účelům (například nese identifikátor věty). Má vždy jediného přímého potomka. Kořen stromu označujeme termínem technický kořen tektogramatického stromu. Hovoříme-li dále v textu o uzlech tektogramatického stromu, technický kořen tektogramatického stromu (pokud to není výslovně uvedeno) nebereme v úvahu.

obr. 1.1: Technickým kořenem tektogramatického stromu je nejvýše umístěný uzel, jediný přímý potomek je s tímto uzlem spojen tenkou tečkovanou hranou (u technického kořene tektogramatického stromu je zobrazena hodnota atributu nodetype (typ uzlu) root, v PDT je u tohoto uzlu též zobrazena hodnota atributu id, tj. identifikátor věty v korpusu).

Rodič uzlu. Uzel X je rodičem uzlu Y, pokud v tektogramatickém stromu vede stromová hrana od uzlu X k uzlu Y a uzel X je blíže technickému kořeni tektogramatického stromu (v zobrazení stromu je rodič umístěn výše).

obr. 1.1: Rodičem uzlu reprezentujícího výraz (starý) sultán je uzel reprezentující spojku a.

Přímý potomek uzlu. Uzel X je přímým potomkem uzlu Y, pokud je uzel Y rodičem uzlu X.

Protože tektogramatický strom je lineárně uspořádaný, hovoříme také o pravém nebo levém přímém potomku. Pravý (levý) přímý potomek uzlu M je takový přímý potomek uzlu M, který je v lineárním uspořádání tektogramatického stromu umístěn napravo (nalevo) od uzlu M.

obr. 1.1: Přímými potomky uzlu reprezentujícího sloveso vystřídat se jsou tři uzly: uzel reprezentující spojku a, nově vytvořený uzel pro patiens, a uzel reprezentující předložkovou skupinu na trůnu. Všechny přímé potomky uzlu reprezentujícího sloveso vystřídat se jsou levé.

Řídící/závislý uzel uzlu. Jsou-li uzly X a Y (respektive výrazy jimi reprezentované) ve vztahu závislosti, říkáme, že uzel X je řídící uzel (resp. uzel závislý na) uzlu Y. Řídící uzel nemusí být totožný s rodičem závislého uzlu (řídících uzlů jediného uzlu může být dokonce víc) a závislý uzel nemusí patřit mezi přímé potomky řídícího uzlu (viz i 5.1 - "Závislost"). (V technické dokumentaci k PDT se pro tento typ uzlu používá i označení "efektivní rodič" a "efektivní potomek/syn").

obr. 1.1: Řídícím uzlem uzlu reprezentujícího výraz starý je uzel reprezentující výraz sultán (který je zároveň jeho rodičem). Řídícím uzlem uzlu reprezentujícího výraz sultán je uzel reprezentující sloveso vystřídat se (který však není jeho rodičem).

Sestra uzlu. Uzel X je sestrou uzlu Y (jiného než X), pokud mají společného rodiče.

Protože tektogramatický strom je lineárně uspořádaný, hovoříme také o pravé nebo levé sestře. Pravá (levá) sestra uzlu M je taková sestra uzlu M, která je v lineárním uspořádání tektogramatického stromu umístěna napravo (nalevo) od uzlu M.

obr. 1.1: Sestrou uzlu reprezentujícího spojku a je nově vytvořený uzel reprezentující patiens slovesa vystřídat se a uzel reprezentující předložkovou skupinu na trůnu. Všechny sestry uzlu reprezentujícího spojku a jsou pravé sestry.

Cesta od uzlu M. Pro pravidla anotace aktuálního členění definujeme také pojem pravé (levé) cesty od uzlu M a pojem nejpravější (nejlevější) cesty od uzlu M.

Pravá (levá) cesta od uzlu M je taková cesta v tektogramatickém stromě, která vede od uzlu M směrem k listu a končí v uzlu, který nemá pravého (levého) přímého potomka. Uzel M není uzlem této cesty.

Nejpravější (nejlevější) cesta od uzlu M je taková pravá (levá) cesta v tektogramatickém stromě, kde pro všechny uzly na této cestě platí, že nemají žádnou pravou (levou) sestru.

obr. 1.1: Od uzlu reprezentujícího řídící predikát vystřídat se nevede žádná pravá cesta. Na nejlevější cestě od uzlu reprezentujícího řídící predikát vystřídat se leží uzly reprezentující výrazy a, sultán a starý.

Podstrom tektogramatického stromu. Podstrom tektogramatického stromu je spojitý podgraf tektogramatického stromu (podmnožina jeho uzlů a hran s vyznačeným kořenem).

Kořen podstromu. Kořenem podstromu je uzel podstromu, jehož rodič (pokud existuje) není součástí tohoto podstromu.

Výraz. Lingvisticky relevantní část věty označujeme termínem výraz. (Za výraz považujeme i celou větu.)

Kořen výrazu. Kořen výrazu je zkrácené označení pro kořen podstromu reprezentujícího daný výraz.

Kořenem věty je kořen podstromu odpovídajícího celé větě, tzn. (jediný) přímý potomek technického kořene tektogramatického stromu.

Efektivní kořen výrazu. Efektivním kořenem výrazu rozumíme uzel, který v daném tektogramatickém stromě buď nemá řídící uzel, nebo jehož řídící uzel není součástí podstromu reprezentujícího daný výraz. Efektivní kořen výrazu může být s kořenem výrazu totožný; zejména v případě souřadných struktur se však kořen výrazu, který je pro každý výraz jeden, od efektivních kořenů, kterých může být pro jeden výraz více, odlišuje.

obr. 1.1: Kořenem reprezentované příkladové věty uzel reprezentující sloveso vystřídat se. Tento uzel je zároveň též efektivním kořenem této věty. Koordinační spojení starý sultán a nový sultán je reprezentováno podstromem tektogramatického stromu, kořenem tohoto podstromu (kořenem tohoto koordinačního spojení) je uzel reprezentující spojku a, efektivními kořeny jsou oba uzly reprezentující substantivum sultán.

Obrázek 1.1. Tektogramatický strom

Tektogramatický strom

Starý sultán a nový sultán se vystřídali na trůnu.