Co zbývá dokončit
ČAK by měl být začleněn do PZK. To znamená
- Nejbolestivější nekonzistence mezi ČAK a PZK je v jednotkách, které byly do ČAK vkládány ručně. Dále pak v chybějících slovech, nebo naopak ve slovech přebývajících. Pro analýzu těchto problémů je nutné projít obsah atributu guessed_form. Do něj totiž anotátoři syntaxe poznamenávali svoji interpretaci příslušné nedokonalosti (podivnosti).
- Zvláštní postavení mají v ČAK mluvené texty. Jsou anotovány morfologicky a nejsou anotovány syntakticky. Pokus o syntaktickou anotaci pěti mluvených textů byl učiněn (viz projektový adresář /net/projects/REST/data/CAC/work_CAC20/data/08_finished - soubory se poznají podle toho, že na čtvrté pozici v názvu mají s a jsou to analytické soubory). Proč se nepokračovalo dál je podrobně popsáno v poznámkách (Bémová, Urešová, 2008). Otázka je, jsou-li tyto texty zajímavé z pohledu projektů rekonstrukce mluvené řeči. To by měli posoudit ti, co na těcho projektech pracují.