Textová koreference je běžně chápána jako užití různých jazykových prostředků (zájmen, synonym, zobecňujících substantiv aj.), které anaforicky (zřídka kataforicky) odkazují. Toto odkazování není realizováno pouze gramatickými prostředky, ale i na základě kontextu. Prostředky textové koreference jsou svou povahou vágní a určení koreferovaného členu pouze na základě kontextu je problematické, proto se v našem pojetí soustředíme prozatím pouze na nejčastější prostředky textové koreference, tedy na zájmena. Textovou koreferenci vyznačujeme:
u osobních a přivlastňovacích zájmen pro 3. osobu; zájmena 1. a 2. osoby ponecháváme stranou. (Osobní a přivlastňovací zájmena mají v tektogramatickém stromě jednotné t-lema #PersPron
.)
u ukazovacích zájmen ten, ta, to.
při aktuální elipse, kdy je do tektogramatického stromu doplněn nový uzel se zástupným t-lematem #PersPron
(textová koreference tu není vyznačena v případech, kdy doplněný uzel zastupuje zájmeno 1. a 2. osoby).
!!! Koreference u nově vytvořených uzlů je úzce spjata s výběrem zástupného t-lematu, které se volí právě podle druhu koreference (gramatická koreference - textová koreference - uzel nekoreferuje; viz 5.12.2 - "Elipsa závislého členu"). Při doplňování závislých valenčních doplnění k substantivům, adjektivům a adverbiím bylo z důvodu zjednodušení a zrychlení anotace voleno pracovně t-lema #Gen
, a případná koreference proto není u těchto uzlů prozatím zachycena (viz 5.2.4.1 - "Všeobecný aktant a blíže nespecifikovaný aktor").
Koreferenci nezachycujeme prozatím u zájmenných příslovcí (tam, sem, tady, tak apod.) a u jiných zájmenných výrazů.
Případy, kdy zájmena, u kterých koreferenci zpracováváme (u on, jeho, ten), nekoreferují (koreference u nich tedy není zaznačena), jsou popsány v 8.3.2 - "Nezaznačení textové koreference".
Přechodný typ textové koreference (#Unsp
). Přechodovou fázi mezi nekoreferujícím výrazem a textovou koreferencí představují případy blíže nespecifikovaného aktora sloves, zachycované nově vytvořeným uzlem s t-lematem #Unsp
. Koreferovaný člen v povrchové podobě věty nevyjádřeného aktoru nelze přesně určit: odkazuje spíše ke kontextu předchozího textu než ke konkrétní jednotce, proto nedoplňujeme uzel s t-lematem #PersPron
, který má jasný anaforický charakter. Referent doplněného uzlu je sice nejasný, ale z kontextu můžeme aspoň částečně vymezit skupinu lidí (objektů), ke které uzel odkazuje. Srov.:
U Nováků {#Unsp
.ACT
} dobře vaří.
Explicitní koreferovaný člen aktora slovesa vařit se v textu nevyskytuje, nicméně na základě kontextu je možné vyvodit, že jím jsou pravděpodobně kuchaři v restauraci U Nováků. Nevolíme proto uzel s t-lematem #PersPron
(které slouží pro explicitní koreferovaný člen), ani uzel s t-lematem #Gen
(aktor není všeobecný, je možné jej blíže specifikovat), ale uzel s t-lematem #Unsp
, žádný koreferenční vztah však u tohoto uzlu již není vyznačen.
K tomuto typu viz 5.2.4.1 - "Všeobecný aktant a blíže nespecifikovaný aktor".
Textová koreference je zachycena pomocí atributu coref_text.rf
a coref_special
(viz 8.1 - "Zachycení koreference v tektogramatických stromech").