ZPĚT
DÁLE
[Obsah] [Úvod]
[Pred 1] [Pred 2] [Subjekt]
[Atribut] [Objekt] [Adv
1] [Adv 2] [Adv 3] [Adv
4] [Adv 5] [Doplněk] [Pomocné]
[Exd] [Coord-Apos] [Parentese]
[Komplexní 1] [Komplexní
2] [Zbytek] [a-č] [d-ch]
[i-k] [l-m] [n]
[ň-o] [p] [q-ř]
[s] [š-u] [v]
[w-ž] [Znaky1] [Znaky2]
*4.2.8.1
AuxS. <<auxsposi>>*
*4.2.8.2
AuxK. <<auxkbezn>>
<<auxknadp>>*
*4.2.8.3
AuxX. <<auxxzach>>*
*4.2.8.4
AuxG. <<auxgnepr>>
<<auxgtypy>
[auxgpzav] [auxguvoz]
[auxgzkra]
[auxgrado]
[auxgnadb]
[auxglisp]
[auxgsloz]>*
4.2.8 Grafické
symboly (interpunkce); kořen stromu AuxS,
AuxK,
AuxX,
AuxG.
Interpunkcí se rozumí všechny grafické
symboly, které nejsou součástí slov ani čísel psaných číslicemi. Především
jde o čárku, která se zpracovává zvláštními pravidly a má obecně i jinou
funkci (nejběžněji dostává afun
AuxX - viz kap. 4.2.8.3
AuxX), dále pak o tečku, otazník, vykřičník,
středník, dvojtečku, závorky a uvozovky všech druhů, hvězdičky, lomítka
apod. Funkce se těmto dalším interpunkčním symbolům přiděluje podle jejich
postavení ve větě: buď jde o interpunkci stojící na konci věty a oddělující
danou větu od další věty (viz kap. 4.2.8.2
AuxK), nebo jde o interpunkci uvnitř věty
(ta nejběžněji dostává afun
AuxG
- viz kap. 4.2.8.4
AuxG). Zvláštní případ tvoří přidaný symbol
#, který tvoří kořen stromu (viz kap. 4.2.8.1
AuxS).
Pro veškerou interpunkci (kromě kořene
AuxS, u kterého se to stát nemůže)
platí pravidla o ExD. Visí-li tedy
interpunkce v důsledku elipsy ve stromě jinde, než by normálně měla, nahrazují
se afuny AuxK,
AuxX, AuxG
(stejně jako afuny běžných větných
členů) afunem ExD.
4.2.8.1 Kořen
stromu AuxS.
auxsposi
Posice kořene stromu.
Ke každému
segmentu, který je předmětem naší analýsy, je automaticky navíc přidán
symbol #.
Tento symbol vždy tvoří vrchol svého stromu a je již předem automaticky
označen afun AuxS.
Za běžných
okolností na něm visí predikát hlavní věty (s afun
Pred)
a koncová interpunkce (viz kap. 4.2.1
Pred a 4.2.8.2 AuxK).
V případě neúplných vět neobsahujících predikát visí na symbolu # jeden
či více uzlů s afun
ExD,
které mohou být případně zavěšeny přes pomocné AuxP
nebo AuxC
(viz kap. 4.3.1 ExD).
Ve specifických
případech může být mezi symbolem #
a predikátem (Pred)
podřadicí spojka s afun AuxC
(viz část exdnevet
(Elipsa celé řídící věty) v kap. 4.3.1
ExD).
Všechny
zmíněné členy mohou navíc být koordinované (na kořeni bude viset uzel s
afun
Coord
,viz 4.4.1
Coord), nebo může jít o parentesi (člen
dostane příponu _Pa,
viz 4.5 Parentese).
4.2.8.2 Koncový
symbol věty AuxK.
INFO
AUXK.
Tato kapitola má jen dvě části. V části
auxkbezn jsou popsána všechna
běžná ukončení vět a to, jak se k nim chováme. V části auxknadp
je pak ukázán příklad novinového nadpisu a jeho dohodnuté zavěšení.
Odkaz
na Šmilauerovu NS:
OČ I. A. (částečně).
auxkbezn
Běžné věty.
Koncová interpunkce
věty je označena speciální analytickou funkcí AuxK.
Je-li na konci věty několik interpunkčních symbolů, jsou takto označeny
všechny. Tato funkce je (jako jedna z mála) přiřazena koncové interpunkci
již při přípravě dat pro ruční anotování. Je však třeba vždy zkontrolovat,
zda interpunkce nemá jinou funkci (mohlo by jít např. o tečku za zkratkou
apod., kdy by bylo třeba použít funkci AuxG,
nebo o případ kdy se v jednom stromě vyskytuje více AuxK,
potom je třeba je doplnit manuálně podle následujících konvencí). Normální
ukončení věty tečkou ukazuje příklad:
Je-li (obvykle
z technických důvodů, především díky nedokonalosti programu pro rozpoznávání
hranic vět) v jednom stromě třeba zachytit věty dvě, použije se funkce
AuxK
i pro interpunkci ukončující ostatní věty. Ve výsledném korpusu by se taková
"věta" již neměla vyskytnout (bude se opravovat ručně). Závorky vyskytující
se v příkladě visí dle pravidel o obecné interpunkci na řídícím členu uvozené
části věty.
Je-li na
konci věty pouze jediný interpunkční symbol, zastupující symbolů více (např.
když oznamovací věta končí zkratkou následovanou tečkou, ale v textu je
tečka jen jedna, jak je podle pravopisných pravidel obvyklé), má koncová
interpunkce věty nejnižší prioritu, tedy příslušný
uzel se považuje za součást věty a nikoli koncovou interpunkci:
Typografické
konvence nutí některé interpunkční symboly změnit přirozené pořadí. I v
takových případech postupujeme tak, že interpunkci věšíme na uzel, kam
přirozeně patří. Vznikne tím neprojektivní strom. To ilustruje následující
příklad. Uvozovky jsou zde zavěšeny podle pravidel o obecné interpunkci
na řídícím slově toho podstromu, který je jimi uvozen. Koncová tečka visí
na kořeni stromu, i když "slovosledně" předchází uzavírající uvozovky.
Ve většině
případů se koncová interpunkce zavěšuje na kořen stromu (kde je ostatně
často zavěšena již programem pro přípravu dat). Zvláštním způsobem se ale
přistupuje ke "koncové" interpunkci, která evidentně náleží nějaké samostatné
větné klausi (například přímé řeči nebo parentesi - oba tyto případy zachycuje
příklad), a to i v případě, že leží na konci věty (i tehdy vlastně plní
dvě funkce, z nichž my dáme přednost funkci ukončení parentese či přímé
řeči). V tomto případě se tato "koncová" interpunkce zavěsí na predikát
nebo jiný technicky řídící uzel
klause, ke které náleží (obdrží také afun
AuxK).
Chybí-li tento řídící uzel, zavěsí se zmiňovaná "koncová" interpunkce na
nejbližší vyšší uzel a obdrží afun
ExD.
auxknadp
Nadpisy a šifry.
Články v
některých novinách standardně začínají stylem, který popisuje tento příklad.
Způsob zavěšení byl stanoven dohodou.
4.2.8.3 Čárka
AuxX.
auxxzach
Zachycení interpunkčních čárek.
Čárka
se používá k oddělení klausí a k oddělení členů koordinace nebo aposice.
S výjimkou případu, kdy čárka zastupuje hlavní uzel koordinace či aposice,
je její funkce vždy AuxX (nebo ExD).
Pokud zastupuje hlavní uzel koordinace, dostává afun
Coord (viz
též kap. 4.4.1
Coord). Zastupuje-li hlavní uzel aposice, dostává afun
Apos (viz též kap. 4.4.2
Apos). Závislost čárky (směrem k jejímu
řídícímu uzlu) je podobně jako u ostatní interpunkce technická, nikoli
gramatická.
1.
Čárka oddělující vedlejší větu se věší na (technicky) řídící uzel vedlejší
věty, což je buď spojka s funkcí AuxC
v případě vedlejších vět spojkových nebo jiný řídící uzel vedlejší věty
(obvykle přísudek u vedl. vět vztažných) s příslušnou funkcí; je-li přísudek
elidován nebo chybí spojka, věší se na nejblíže nadřízený uzel a dostane
funkci ExD (viz kap. 4.3.1
ExD). Pokud je vedlejší věta vložená a
obě její oddělující čárky jsou ve větě přítomny, věší se obě na tentýž
uzel.
2.
Odděluje-li čárka parentesi, věší se na (technicky) řídící uzel parentese.
Je-li (gramaticky) řídícím členem parentese uzel s hodnotou funkce ExD_Pa,
pak se čárka (nebo obě čárky, pokud je parentese vložena uprostřed věty)
věší na nejbližší vyšší uzel a dostane funkci ExD
(pozor, nikoliv ExD_Pa).
To se týká i jakékoli jiné interpunkce oddělující parentesi (z jedné
strany nebo z obou stran).
3.
Čárky oddělující věty či členy spojené souřadně (tedy jde o koordinaci)
se věší na příslušnou koordinační spojku či jinak vybraný koordinační uzel
s afun
Coord
(ale, a, neboť, proto
apod.). Někdy se ale může stát, že i pro zavedení tohoto koordinačního
uzlu jsme nuceni využít čárku. Bude to čárka, která bude poslední v řadě
a bude tedy označena Coord.
Ostatní oddělovací čárky s funkcí AuxX
se zavěsí na ni . Podrobně se o koordinaci praví v kap. 4.4.1
Coord.
4.
Dojde-li ke kombinaci více jevů, stává se, že některá čárka ve větě
chybí. Přesněji řečeno jedna čárka plní více funkcí najednou a přitom se
vyskytuje pouze jako jediný uzel. Při rozhodování, kterou z jejích funkcí
ve stromě zachytíme, věšíme takovou čárku "co nejvýše". Vyskytne-li se
souběh čárky hlavní koordinační s funkcí Coord
a jiné čárky (s funkcí AuxX nebo
ExD) přirozeně
tak má přednost funkce koordinační. Při souběhu koordinační čárky s funkcí
AuxX
a jiné čárky ji zavěsíme na ve stromě nejvýše položený uzel, na kterém
by mohla viset. Dochází-li k souběhu čárek na téže úrovni stromu (např.
při souběhu čárky uzavírající vedl. větu s čárkou otevírající nebo koordinační)
provede se zavěšení podle těchto priorit:
1) koordinační čárka s funkcí Coord,
2) čárka otevírající vedl. větu,
3) koordinační čárka s funkcí AuxX,
4) čárka uzavírající vedl.větu.
4.2.8.4 Interpunkce,
ostatní grafické symboly AuxG.
INFO
AUXG.
Nejprve si v části auxgnepr
řekneme, kdy označujeme interpunkci funkcí AuxG a jaké jsou výjimky. Druhá
část auxgtypy je rozdělena
na několik podčástí, které jsou věnovány jednotlivým typům interpunkce
z hlediska její funkce (významu) a zachycení těchto typů. Jde o interpunkci
závorkovací, uzavírající vyčleněněnou část textu (auxgpzav),
interpunkci uvozovací, oddělující část textu (auxguvoz),
interpunkci ukončující zkratku (auxgzkra),
interpunkci za řadovou číslovkou (auxgrado),
interpunkci nadbytečnou (auxgnadb),
interpunkci u spojky "li" (auxglisp)
a interpunkci ve složených jménech (auxgsloz).
auxgnepr
Vymezení interpunkce AuxG.
Interpunkce se obecně
označuje jako AuxG.
Tato funkce je (jako jedna z mála) přiřazena veškeré interpunkci (s výjimkou
čárky a interpunkce stojící na konci věty) již při přípravě dat pro ruční
anotování. Je však třeba vždy zkontrolovat, zda interpunkce nemá jinou
funkci.
Je-li
koncovým symbolem věty, může obdržet afun
AuxK
(4.2.8.2 AuxK),
čárky zase většinou dostávají afun
AuxX
(4.2.8.3 AuxX),
i když se k nim často chováme stejně, jako k běžné interpunkci popsané
dále.
Kromě
funkcí AuxG,
AuxK,
AuxX
(příp. ExD)
může (obecná) interpunkce dostat ještě afun
Apos
a Coord.
Prvním
případem je uvozovací interpunkce druhé části aposice, a to tehdy, když
nelze pro aposiční uzel použít obvyklého výrazu (tj.,
např. apod.). Závorka, dvojtečka nebo
jiná uvozující interpunkce se zde stane aposičním uzlem (Apos);
v případě, že jde o tzv. závorkovací interpunkci, visí pak její druhá část
na tomto uzlu s funkcí AuxG .
K zachycení aposice blíže v kapitole 4.4.2
Apos.
Případem
druhým je interpunkce koordinační. Jednak může koordinovat dvě věty , jednak
části celků, které se běžně oddělují dvojtečkou, jako jsou sportovní výsledky
či zápisy času tvaru hh:mm. Případně pohlédni do kapitoly 4.4.1
Coord.
auxgtypy
Typy interpunkce.
auxgpzav
Závorkovací interpunkce.
Interpunkce
tzv. "závorkovací" (závorky a uvozovky všeho druhu, příp. i čárky, mají-li
pouze "závorkovací" funkci) se věší na řídící uzel uvozené části věty:
Pokud řídící
člen uzávorkované části, na kterém má interpunkce viset, chybí, použije
se mechanismus 'ExD' pro větné členy z uzávorkované části i pro interpunkci.
Interpunkce se tedy pověsí na nejbližší vyšší uzel a její funkce bude ExD.
Je-li však
řídící slovo uzávorkované části přítomno, zůstává interpunkční funkce nezměněna,
a to i tehdy, má-li řídící slovo samo funkci ExD
(jde o případ, kdy je sice elidován nějaký gramaticky nadřazený člen, avšak
interpunkce by na tomto členu stejně nevisela).
Je-li vedlejší
věta (nejčastěji přímá řeč) přerušena uvozující hlavní větou, pověsí se
(často neprojektivně) všechny uvozovky na řídící člen přímé řeči, kterou
uvozují.
Stává se, že závorkovací interpunkce odděluje
více členů a nejde přitom o elipsu. "Závorky" se potom zavěsí na
řídící uzly krajních členů vydělené části věty:
Závorkovací interpunkce se vyskytuje mimo
jiné u přímé řeči. Té je věnována samostatná kapitola 4.6.1
Přímá řeč.
auxguvoz
Uvozovací interpunkce (dvojtečka).
Přímá řeč nebo některé koordinační výčty
bývají odděleny od části, která je uvozuje. Nejčastěji se pro tento účel
používá dvojtečka. Této interpunkci budeme zde říkat uvozovací.
Uvozovací interpunkci zavěšujeme na
řídící uzel uvozované části (přímé řeči, výčtu). I tady může být uplatněno
pravidlo ExD. V případě, že tento
hlavní uzel chybí, zavěsíme uvozovací interpunkci na nejbližší vyšší uzel
a přidělíme ji afun ExD.
auxgzkra
Interpunkce za zkratkou (tečka).
Zkratka bývá většinou ukončena tečkou.
Tuto tečku zavěšujeme přímo na uzel obsahující zkratku.
auxgrado
Interpunkce za řadovou číslovkou (tečka).
Také tečka za řadovou číslovkou se zavěšuje
přímo na tuto číslovku.
auxgnadb
Nadbytečná interpunkce (tři tečky).
Nadbytečné znaky, které se ve větě vyskytují,
zavěšujeme na nejbližší vhodný uzel. Nepřipadá-li nám vhodný žádný význačný
uzel, zavěsíme je co nejvýše, ale tak, aby nebyla porušena projektivita
stromu.
Nadbytečnými bývají často znaky na
místě vynechaných slov (tři tečky). Pro ty je vhodným uzlem ten, kde by
visela vynechaná slova. Tři tečky však také často bývají součástí koordinace
nebo dokonce jejím řídícím uzlem.
auxglisp
Interpunkce u spojky "li" (pomlčka).
Pomlčka před
"li" se zavěsí
přímo na tuto spojku, které je věnována část auxczali
v kap. 4.2.7.1
AuxC.
auxgsloz
Interpunkce ve složených jménech.
Interpunkci
(nejčastěji pomlčky) ve složených jménech (i cizích) se zavěšují na rozvíjející
uzly uzlu hlavního, a to z vnitřní strany. Jak se přesně zachycují tato
jména je popsáno v kapitole 4.6.12
Složená česká jména a případně 4.6.10
Cizojazyčné složky rozebíraného textu.
*4.2.8.1
AuxS. <<auxsposi>>*
*4.2.8.2
AuxK. <<auxkbezn>>
<<auxknadp>>*
*4.2.8.3
AuxX. <<auxxzach>>*
*4.2.8.4
AuxG. <<auxgnepr>>
<<auxgtypy>
[auxgpzav] [auxguvoz]
[auxgzkra]
[auxgrado]
[auxgnadb]
[auxglisp]
[auxgsloz]>*
ZPĚT
DÁLE
[Obsah] [Úvod]
[Pred 1] [Pred 2] [Subjekt]
[Atribut] [Objekt] [Adv
1] [Adv 2] [Adv 3] [Adv
4] [Adv 5] [Doplněk] [Pomocné]
[Exd] [Coord-Apos] [Parentese]
[Komplexní 1] [Komplexní
2] [Zbytek] [a-č] [d-ch]
[i-k] [l-m] [n]
[ň-o] [p] [q-ř]
[s] [š-u] [v]
[w-ž] [Znaky1] [Znaky2]