[ Skip to the content ]

Institute of Formal and Applied Linguistics

at Faculty of Mathematics and Physics, Charles University, Prague, Czech Republic


[ Back to the navigation ]

Publication


Year 2012
Type in proceedings without ISBN
Status published
Language English
Author(s) Galuščáková, Petra Pecina, Pavel
Title CUNI at MediaEval 2012 Search and Hyperlinking Task
Czech title CUNI na MediaEvale 2012, Search and Hyperlinking Task
Proceedings 2012: Aachen, Germany: MediaEval 2012: Working Notes Proceedings of the MediaEval 2012 Workshop
How published online
URL http://ceur-ws.org/Vol-927/mediaeval2012_submission_46.pdf
Supported by 2012-2015 DF12P01OVV022 (Zpřístupnění rozsáhlého video archivu kulturního dědictví pomocí metod automatického rozpoznávání mluvené řeči a strojového překladu. (AMALACH)) 2010-2015 LM2010013 (LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat) 2012-2018 GBP103/12/G084 (Centrum pro multi-modální interpretaci dat velkého rozsahu)
Czech abstract Článok popisuje postup, ktorý sme použili v úlohe Search and Hyperlinking v MediaEval 2012 Multimedia Benchmark. Pri riešení bol použitý systém Terrier, ktorý bol aplikovaný na automatické prepisy video nahrávok. Nahrávky boli segmentované na menšie časti, ktoré boli ďalej prehľadané. Pri segmentácii boli použité dva prístupy: jeden založený na pravidelnej segmentácii podľa času a druhý založený na sémantickej segmentácii pomocou algoritmu TextTiling. Najlepší výsledok bol dosiahnutý pomocou pravidelnej segmentácie, pomocou modelov Hiemstra a TF-IDF na prepisoch LIMSI.
English abstract The paper describes the Charles University setup used in the Search and Hyperlinking task of the MediaEval 2012 Multimedia Benchmark. We applied the Terrier retrieval system to the automatic transcriptions of the video recordings segmented into shorter parts and searched for those relevant to given queries. Two strategies were applied for segmentation of the recordings: one based on regular segmentation according to time and the second based on semantic segmentation by the TextTiling algorithm. The best results were achieved by the Hiemstra and TF-IDF models on the LIMSI transcripts and various segmentation.
Specialization linguistics ("jazykověda")
Confidentiality default – not confidential
Open access no
Editor(s)* Martha A. Larson; Sebastian Schmiedeke; Pascal Kelm; Adam Rae; Vasileios Mezaris; Tomáš Piatrik; Mohammad Soleymani; Florian Metze; Gareth J.F. Jones
ISSN* 1613-0073
Address* Aachen, Germany
Month* October
Venue* Santa Croce in Fossabanda
Publisher* CEUR Workshop Proceedings
Institution* TU Delft
Creator: UNKNOWN
Created: 11/7/12 12:46 AM
Modifier: Common Account
Modified: 10/29/13 2:55 PM
***

Content, Design & Functionality: ÚFAL, 2006–2019. Page generated: Tue Mar 26 12:18:52 CET 2019

[ Back to the navigation ] [ Back to the content ]

100% OpenAIRE compliant