8.1. Zachycení koreference v tektogramatických stromech

Současné řešení anotace koreference na tektogramatické rovině využívá skutečnosti, že každý uzel každého tektogramatického stromu má identifikátor (hodnota atributu id), který je jedinečný v celém PDT. Jestliže chápeme koreferenci jako odkaz z jednoho uzlu na jiný uzel, pak stačí do vybraného atributu (typu odkaz) u koreferujícího uzlu uložit identifikátor koreferovaného uzlu. Specifické podtypy koreference jsou zachyceny hodnotou dalšího atributu (výčtového typu).

K zachycení koreference jsou u každého uzlu tektogramatického stromu zavedeny tři atributy:

Uzel, který reprezentuje koreferující člen, má vyplněný vždy pouze jeden z těchto atributů.

Podle možností odkazovat k různým částem tektogramatického stromu se setkáváme s následujícími případy odkazování:

Koreferenční vztah může být (a často tomu tak je) i mezi uzly, které nejsou lexikálně vyjádřeny v povrchové podobě věty, tedy mezi nově vytvořenými uzly se zástupnými t-lematy (viz i 8.4 - "Přehled typů koreference se zřetelem k t-lematům koreferujících uzlů"). Jednotlivé koreferenční vztahy mezi koreferujícími uzly vytvářejí často dlouhé koreferenční řetězce, na jejichž konci stojí uzel pro plnovýznamové slovo, které již dále neodkazuje (viz 8.5.1 - "Udržování koreferenčních řetězců").