10.1. Formát dat PDT 2.0

Základním datovým formátem pro PDT 2.0 je formát označovaný jako PML ("Prague Markup Language"), který je založený na XML. Již dříve byly pro zpracovávání a ukládání dat PDT vyvinuty a používány dva jiné formáty. Formát označovaný jako FS ("Feature Structure") byl vyvinut pro program Netgraph (přesněji řečeno pro jeho předchůdce, program Graph). Základním formátem pro PDT 1.0 byl formát CSTS ("Czech Sentence Tree Structure"), založený na SGML. Nyní se tento formát užívá pouze jako pracovní formát ve starších NLP nástrojích (jako jsou parsery a tagery).

Více k jednotlivým formátům viz Prague Dependency Treebank 2.0, CDROM, doc/pdt-guide/ a doc/data-formats/.

Více k programu Netgraph viz Prague Dependency Treebank 2.0, CDROM, doc/tools/netgraph/.