Hlavním cílem projektu je vytvořit interdisciplinární vzdělávací nástroj, který bude zprostředkovávat moderní interaktivní seznámení s českou poezií a automatickým generováním textu a poskytne nové možnosti digitálního vzdělávání v současném mediálním prostředí.
Ve spolupráci literárních vědců, počítačových lingvistů a umělců vzniknou umělé neuronové modely české poezie. Tento software bude umožňovat generování básní, reprezentujících obvyklou podobu tvorby např. určitého období či směru.
Software se stane základem pro didaktický exponát, který bude instalován ve vzdělávacím centru Didaktikon. Interakcí s exponátem návštěvníci získají užší spojení s poezií a zároveň poznají možnosti i omezení generování textu.
The objective of the project is to create an interdisciplinary educational tool to provide a modern interactive introduction to Czech poetry and automatic text generation, as well as new possibilities for digital education in the current media environment.
Artificial neural models of Czech poetry will be created in cooperation between literary scientists, computer linguists and artists. This software will allow the generation of poems, representing the typical style of e.g. a certain period or direction.
The software will become the basis for a didactic exhibit, which will be installed in the Didaktikon educational centre. By interacting with the exhibit, visitors will simultaneously gain a closer connection with poetry and learn the possibilities and limitations of text generation.
Hlavním výzkumným záměrem je adekvátně počítačově modelovat různé existující styly české poezie a výsledky modelování prezentovat edukačním exponátem.
Jádrem je literárněvědná metoda tzv. neurálního čtení (Orekhov, Fischer), kdy modelování textu neuronovou sítí lze vnímat jako jisté „zprůměrování“ podkladových textů, texty generované takovým modelem jsou tedy charakteristickými zástupci stylů dominujících v trénovacím korpusu.
Základem tedy je vytvoření korpusu poezie včetně relevantních lingvistických a versologických anotací.
Dále využijeme aktuální metody jazykového modelování, založené na architektuře transformer. Adaptujeme metodu postupného vylaďování (gradual fine-tuning), kdy natrénujeme nejprve obecný model češtiny, ten vyladíme na poezii, a tento model dále vyladíme na různých subkorpusech, tak aby jednotlivé modely reprezentovaly vybrané distinktní styly. Otestujeme též metody jako zero-shot learning.
Další vývoj modelů budou směřovat jejich průběžné analýzy, zejména z pohledu jejich poetické a versologické adekvátnosti a umělecké hodnoty a využitelnosti.
Zvážíme úpravy reflektující specifika poezie, např. využití fonetické reprezentace textu namísto ortografické, segmentaci textu na slabiky namísto nelingvistických podslov, či explicitní práci s prozodickými rysy (zejména přízvukem).
Ve spolupráci s didaktiky a scénografy navrhneme a sestavíme interaktivní interdisciplinární edukační nástroj (exponát centra Didaktikon), který bude zahrnovat lidské básně i vyvinuté generátory poezie, na nichž bude demonstrovat jak typické rysy vybraných stylů, tak principy automatického generování textu. Cílem exponátu je maximalizovat přístupnost a srozumitelnost sdělovaného se zachováním odborné správnosti.
Vyvinutý software i exponát bude využit v rámci tvůrčích a vzdělávacích workshopů, vytvoříme také metodiku jeho využití ve výuce. Nabídneme tak žákům ZŠ a SŠ i dalším skupinám snadno dostupné možnosti moderního multimodálního interaktivního vzdělávání.
Členové týmu ÚFAL MFF UK představí beta verzi software na půdě Vysoké školy výtvarných umění v Bratislavě prostřednictvím několikadenního workshopu. Na workshopu seznámí studenty, studentky a pedagogy s digitálním nástrojem, pozadím jeho vzniku a způsoby jeho ovládání pro dosažení tvorby poezie. Představí také možnosti, které práce s tímto digitálním nástrojem nabízí s ohledem na specifikaci a konkretizaci textových výsledků.
Na workshopu studenti a studentky vytvoří experimentální prototypy děl, které využívají vyvíjený software. Díla budou využívat různorodé technologie a média (video, audio, obraz, virtuální realita, 3D scény a 3D animace, projekce) tak, aby vyvíjený software prošel kontaktem s různými přístupy a metodami. Vybrané prototypy budou dodatečně dopracovány pro výstavu v centru Didaktikon. Způsob práce na workshopu bude zahrnovat: prezentace projektu a vyvíjeného software včetně souvisejícího vědeckého pozadí, skupinový brainstorming nad možnostmi využití nástroje, asistence členů týmu ÚFAL MFF UK při práci s nástrojem, tvorba prototypů v malých týmech či individuálně. Workshop povede k formulaci koncepce možného využití vyvíjeného software v umělecké praxi.
Abychom dosáhli mediálně komplexní a divácky atraktivní prezentace možností využití generované poezie, věnujeme v grantu prostor také tvorbě intermediálních uměleckých děl založených na generované poezii. Pod pedagogickým vedením Zuzany Husárové, Andráse Cséfalvaye a Matěje Novotného budou studenti VŠVU během letního semestru 2025 vytvářet (post)digitální díla, která budou vycházet z generované poezie nebo s ní budou přímo souviset. Intermediální díla budou vytvářena v různých formátech.
Práce ve studiu bude přímo navazovat na tvůrčí workshop, který studentům na začátku semestru představí vyvíjený software. Studenti a studentky budou při své práci využívat prostředky uměleckého výzkumu a prostřednictvím přednášek se seznámí s vývojem a příklady z historie generované poezie a jejích současných podob. Workshop tak ověří možnosti využití software v umělecké praxi. V dnešní technologické společnosti je multimediální prezentace obsahu nástrojem, jak zaujmout zejména mladší generace. Na konci semestru budou práce představeny veřejnosti prostřednictvím tzv. Průzkumu, který se koná každý semestr v prostorách školy. Tam může s projekty interagovat široká veřejnost a autorům a autorkám se dostané také zpětné vazby. Na podzim budou díla vystavena v Didaktikonu (viz výsledek Výstava).
Umělecké projekty studentů a studentek VŠVU s generovanou poezií se stanou základem postdigitální výstavy, která bude instalována v prostorách Didaktikonu v Praze na podzim 2025. Půjde o osm až deset (post)digitálních děl, která prostřednictvím této výstavy nabídnou návštěvníkům všech věkových kategorií seznámení s digitální estetikou založenou na podstatě generování a následného zpracování výstupního textu.
Výstava představí díla v různých mediálních zpracováních, s využitím různých technologií a přístupů, aby podnítila diskusi o míře společenského zapojení technologií, které svou všudypřítomností výrazně ovlivňuje i digitální vzdělávání, byť v dnešní době jen okrajově. Prostřednictvím bohaté škály interakcí s díly chce v příjemcích vyvolat multisenzorické zážitky, které budou zároveň prostředkem sebereflexe, sebepoznání a následné vzájemné debaty. Výstava potrvá tři měsíce, během nichž se uskuteční workshopy s různými školami. Na začátku výstavy proběhne sympozium s pedagogy, studentkami a studenty, kteří vysvětlí svůj vlastní umělecký výzkum a představí projekty prostřednictvím uměleckých přednášek a diskusí. Nová metodika bude dále implementována do edukace a tvořivé činnosti na akademii.
Výstava bude veřejně přístupná v centru Didaktikon.
Doplněním stávajícího Korpusu české verše a Korpusu současné poezie vznikne datová základna pro výzkum jazyka české poezie od konce 18. století do současnosti. Doplňování se bude týkat zejména básnických sbírek publikovaných od roku 1950 (cca 500 sbírek). Korpus básnických textů pokrývající takto široké historické období bude ve světovém měřítku unikátní. Korpusy budou doplněny jak ve smyslu rozsahu, tak ve smyslu anotace: anotace epoch a směrů, metrická anotace, segmentace textu na slabiky ad.
Korpus otevře odborné i širší veřejnosti nové možnosti, jak se seznamovat s dějinami a přítomností české poezie. V rámci projektu budou data obsažená v korpusu využita pro vývoj hlavního výsledku, softwarového systému pro neuronové modelování a generování české poezie. Díky svému rozsahu a způsobu anotování korpus umožní natrénovat jazykový model tak, aby byl schopen generovat texty v jednotlivých historických stylech. Pro vývoj tohoto softwaru bude korpus využíván po celou dobu projektu. Jako samostatná webová aplikace bude veřejnosti předán s koncem doby řešení projektu. Díky uživatelsky přívětivým nástrojům pro práci s korpusem předpokládáme využití korpusu nejen odborníky v rámci výzkumu, ale i širším okruhem zájemců o českou poezii včetně studentů a učitelů.
Z důvodu autorskoprávní ochrany básnických textů nebude možné veškerá data zveřejnit; zveřejněny budou pouze části korpusu obsahující volná díla.
Zorganizujeme několik vzdělávacích workshopů v centru Didaktikon, určených zejména žákům a pedagogům ZŠ a SŠ.
Ve frontální části workshopu představíme projekt včetně jeho vědeckého pozadí a dosud dosažených poznatků a výsledků.
V interaktivní části workshopu se budou účastníci vzdělávat vedenou i samostatnou interakcí s v tu chvíli existujícími výsledky (výstava, zkušební verze software a exponátu).
Předpokládáme uspořádání alespoň 1 workshopu v roce 2025 a 3 workshopů v roce 2026.
Předpokládáme pořádání workshopů i po skončení projektu s využitím již finální verze exponátu. Tyto workshopy budou stěžejním způsobem využití exponátu a budou sloužit ke vzdělávání žáků a pedagogů v oblastech české poezie a automatického generování textu.
Workshopy budeme nabízet českým školám v rámci již existující aktivity centra Didaktikon. Online verze exponátu nám umožní po skončení projektu nabídnout i výjezdní workshopy přímo na školách.
Vytvoříme neuronové jazykové modely české poezie, které budou literárně-historicky, počítačově-lingvisticky a umělecky informované a budou schopné vhodným způsobem modelovat a generovat českou poezii. Cílem je co možná nejkvalitnější a nejvěrohodnější modelování, umožňující například rozlišení jednotlivých básnických stylů, období a škol - do té míry, do jaké nám toto současný stav poznání a výzkum provedený v rámci projektu umožní.
Mimo vlastní projekt předpokládáme využití nástroje pro další literárně-historický výzkum, neboť umožní nové empirické metody zkoumání české poezie, počítačové testování přínáležitosti jednotlivých autorů a básní ke konkrétnímu stylu, či zkoumání hranic mezi poezií a prózou. Možným vedlejším využitím software může být i pravděpodobnostní automatické rozlišování automaticky vygenerovaných textů od textů napsaných člověkem. Očekáváme také využití nástroje v umělecké praxi, které experimentálně ověří tým VŠVU.
Výsledný software bude zveřejněn pod svobodnou licencí včetně zdrojových kódů a dokumentace, což umožní jeho další využití a rozšiřování.
Vytvoříme fyzickou interaktivní multimediální interdisciplinární edukační instalaci ve vzdělávacím centru Didaktikon, která bude zahrnovat zejména interaktivní generátor poezie a doprovodné texty a materiály. Exponát bude vzdělávat návštěvníky jak v oblasti české poezie, tak automatického generování textu. Instalace bude určená jak žákům ZŠ a SŠ, tak i samotným pedagogům. Připravíme a zveřejníme i online verzi exponátu.
Instalace bude návštěvníky seznamovat zároveň s českou poezií i s neuronovým modelováním textu, součástí instalace bude i možnost interaktivního generování poezie založené na existující české poezii s využitím vlastního zadaného vstupu. Součástí bude i online verze instalace, zahrnující generátor poezie a některé další prvky fyzické instalace ve virtuální podobě.
U online verze předpokládáme zejména využití ve výuce na školách dle vytvořené metodiky, podpořené kurzy a workshopy pro pedagogy pořádanými v Didaktikonu.
Fyzický exponát nabídneme formou zápůjčky či replikace a adaptace i dalším zájemcům pro přiblížení jeho obsahu dalším skupinám: předpokládáme například možnost instalace v science centrech či regionálních knihovnách.
Exponát bude volně přístupný.
Metodika bude popisovat možná využití vyvinutých výsledků (zejména fyzické i online verze exponátu) v rámci výuky žáků ZŠ a SŠ. Metodika se bude vhodně doplňovat se vzdělávacími workshopy v Didaktikonu pod naším vedením a bude umožňovat pedagogům využití vyvinutých nástrojů i bez našeho vedení.
Metodika popíše vědecké pozadí projektu, navrhne způsoby využití vyvinutých nástrojů ve výuce, bude obsahovat i další rozšiřující informace a doplňkové vzdělávací materiály a pracovní listy.
Metodiku předložíme k certifikaci Pedagogické fakultě UK, ta ji po schválení zveřejní.
Metodiku poskytneme základním a středním školám. Dle předběžného dotazování očekáváme u škol velký zájem, neboť školy pociťují v dostupných vzdělávacích materiálech značnou nedostatečnost ohledně moderních technologií, mezi které patří i umělé neuronové sítě a automatické generování textu.
Předpokládáme, že jednotlivé školy budou dle metodiky využívat výsledky projektu i bez naší součinnosti, za použití online verze exponátu a doplňkových materiálů.
Metodika bude zveřejněna schvalujícím orgánem, k metodice bude zajištěn otevřený přístup.
Výsledky výzkumu a vývoje v rámci projektu budeme průběžně prezentovat formou příspěvků v oborových časopisech a na vědeckých konferencích a workshopech.
K publikačním výsledkům zajistíme otevřený přístup.
Celý projekt a tým UK vede Rudolf Rosa. Tým se dělí na podtým ÚFAL (MFF UK) a podtým Didaktikon (CPPT UK).
Podtým ÚFAL je zodpovědný za počítačově lingvistický rozměr projektu. Vyvíjí software, podílí se na exponátu (softwarová část), workshopech a metodice, a to zejména přípravou odborných podkladů a přednášením.
Podtým Didaktikon vede Tereza Martínková Bártlová, podtým je zodpovědný za didaktický rozměr projektu a je aplikačním garantem projektu. Připravuje exponát, workshopy v Didaktikonu, výstavu a metodiku. Provádí testování zkušebních verzí exponátu a zprostředkovává zpětnou vazbu ostatním týmům. Zpřístupňuje výsledky projektu žákům a dalším relevantním cílovým skupinám prostřednictvím centra Didaktikon.
Tým ÚČL vede Karel Piorecký, tým je zodpovědný za literárněvědný rozměr projektu. Vytváří korpus, podílí se na vývoji a testování software exponátu, workshopech a metodice, a to zejména přípravou odborných podkladů, přednášením a výběrem a interpretací vhodných ukázek poezie.
Tým VŠVU vede Zuzana Husárová, tým je zodpovědný za umělecký rozměr projektu. Organizuje workshopy na VŠVU, implementaci textů do intermediálního prostředí, podílí se zásadní měrou na výstavě a na reflexi takto vzniklých digitálních děl.