Resources and Tools for Information Systems (REST)
- interní dokumentace projektu

Závěrečný povzdech

Jaké to celé bylo

V projektu jsme řešili to, na co je ÚFAL machr, tj. věnovali jsme se anotaci korpusu. Do úkolu jsme se vrhli se zkušenostmi z anotací Pražského závislostního korpusu (PDT).

Co jsme naplánovali, to jsme splnili: převést ČAK do podoby kompatibilní s PZK (jsme si vědomi toho, co je třeba dodělat) a vytvořit ucelený balíček nástrojů pro morfologcké a syntaktické zpracování českých textů. Největší přínos projektu vidíme v tom, že jsme se v prezentaci výsledků formou CD-ROM, které obsahuje jazyková data a nástroje, přiblížili k většímu uživatelskému pohodlí.

Při prezentaci výsledků jsme dbali na kompaktnost, a to i vizuální. Proto jsme si dali záležet na grafickém designu webových stránek, plakátů (CAC 1.0, CAC 2.0), obalů CD (CAC 2.0), trička (které se nakonec nerealizovalo, viz náhled). Velmi dobře se v této části spolupracovalo s Michalem Šotkovským.

Opravdu velkým problémem bylo sehnat studenty na syntaktické anotace. Studentům FF, které učí Šárka Zikánová, byl rozeslán e-mail s nabídkou brigády. Šárka nejdříve provedla filtr v tom smyslu, že oslovila ty schopnější. Studenti se sice ozývali, ale když zjistili, o co se jedná, tak couvli. Možná jsem (BVH) ze začátku zvolila nevhodný způsob "lanaření", a sice vše elektronicky bez osobního kontaktu (nebylo to mou (BVH) asociálností, ale velmi omezenými časovými možnostmi). Dvě studentky se pustily do zaučování a vedly si báječně - neuvěřitelně samostatně. Zahřívacím kolem prošly skvěle, ale po osobní schůzce couvly s tím, že se obávají velkého časového presu. Následně Šárka poslala nabídku všem. Pro zájemce jsme nachystali snídani, na které jim byl představen kompletní kontext pražského syntaktického anotování. Pouze jedna studentka se "chytla" (již s námi spolupracovala při textových korekturách ČAK 1.0). Syntaktické anotace tedy prováděli kolegové ze Slovenska a jedna česká studentka bohemistiky.

Řešitelský kolektiv se částečně proměňoval podle celkové personální a grantové situace na ÚFAL. Na řešení s různou výší úvazku pracovali kolegové, kteří jsou ve VIP seznamech průvodců ČAK 1.0 a ČAK 2.0. Administrativní zázemí, které nám poskytovala Marie Křížková, bylo spolehlivé.

Jaká byla administrativa

Administrativa rozhodně nezatěžovala. Zprávy podával jak hlavní řešitel, tak spoluřešitel - požadavky na rozsah a podrobnost zprávy byly rozumné. Ze strany poskytovatele (GAAV) byla důležitá svoboda, kterou jsme při řešení měli. I když my (ÚFAL) jsme si nic nemuseli dovymýšlet, protože jsme jeli pěkně podle plánu. Spíše jde o ÚJČ, které řešilo úlohy, které v návrhu projektu nezazněly - nikdo se nad tím nepozastavil.

Až v průběhu řešení se objevil jeden zádrhel: ve finančním návrhu projektu jsme na roky 2006 a 2007 měli naplánované nenulové ´ostatní veřejné zdroje´. Nebylo to úplně blbě, protože někdy se může stát, že na sekci jsou peníze, které by se hodilo někam ´ulejt´ - to se ale bohužel nikdy neví dopředu. V daných letech sekce neměla ulejvat co, tak jsme kolizi řešili oficiální žádostí (podepsanou Janem Hajičem a Karlem Olivou - šéfové řešitelských pracovišť) o úpravu, tj. vynulování patřičných údajů. V pohodě prošla.

Jak se komunikovalo s poskytovatelem

V případě čehokoli se komunikovalo s ing. Ivou Čechovou, která byla vždy vstřícná a příjemná.

S kým se komunikovalo blbě

Naštěstí se nenašel nikdo, s kým by se komunikovalo vyloženě blbě. Spíš některé věci šly pomaleji, než by se nám líbilo.

  • Vydání ČAK 1.0 v Karolinu - i když byla komunikace s Mgr. Valem klidná a následně spolupráce s technickou editorkou Mgr. Veselou plodná, uplynulo osm měsíců od okamžiku, kdy jsme předali rukopis, do okamžiku vydání. A to jsme prosím rukopis nachystali technicky téměř tak, že s ním následně nemohlo být moc práce. Tato dlouhá doba se promítla do částky, kterou jsme Karolinu nakonec zaplatili, tj. podstatně levnější, než byla původní kalkulace.

  • Vydání ČAK 2.0 v LDC - tam šlo vše podle časového plánu, ale ... na jejich stránky o produktech vyvěšují vlastní anotaci produktu, kterou si sami vytahují z oficiální dokumentace produktu. Vlastní anotaci nedávají ke korekturám - v našem případě tam byla jedna zasadní chyba, a sice že ČAK 2.0 vytvořil ÚJČ. Po naší reklamaci tento údaj rychle opravili. On-line dokumentaci směřovali na pdf Guide. Požádali jsme je, aby vyvěsili i odkaz na html. Po třech iteracích fungoval odkaz bez problémů. Na samotném CD, které distribuují, v názvu nefiguruje verze ČAK, je tam pouze Czech Academic Corpus.

  • Pro distribuci spřáteleným pracovištím v ČR jsme nechali vypálit 100 ks CD u http://a.digi.cz/ s vlastním barevným potiskem. Majitel firmy i přes nátlak odmítal zakázku s nedokonalými podklady pro tisk (potiskový obrázek byl bez přesahů), kdy by výsledek nebyl perfektní a firmě dělal špatné jméno. Křičel na mě do telefonu (JM). Nakonec ale sami a včas podklady upravili a CD vypálili a dobře potiskli. Nebyli drazí.