[ Skip to the content ]

Institute of Formal and Applied Linguistics

at Faculty of Mathematics and Physics, Charles University, Prague, Czech Republic


[ Back to the navigation ]

Publication


Year 2017
Type oral presentation *
Status published
Language Czech
Author(s) Rosa, Rudolf
Title Jak pracuje internetový vyhledávač
English title How an internet search engine works
Institution MFF UK
Publisher's city and country Praha, Czechia
Venue Malostranské náměstí 25
Month February
How published online
URL http://ufallab.ms.mff.cuni.cz/~rosa/papers/jdim_2017_presentation.pdf
Supported by 2016 SVV 260 333 (Teoretické základy informatiky a výpočetní lingvistiky) 2015-2018 H2020-ICT-2014-1-644402 (Himl (Health in my Language))
Czech abstract To je něco, co používá každý, přitom není úplně zřejmé, jak to funguje. Pro daný dotaz nejde prostě pro každý dotaz projít všechny existující miliardy webových stránek, a vrátit uživateli několik miliónů z nich, které obsahují hledaná slova. Ukážu, co je reverzní index (to zná každý pod názvem rejstřík), podle čeho se řadí výsledky, a přidám i pokročilejší vylepšení (TF.IDF, vektorový model, lematizace, synonyma, pojmenované entity).
English abstract This is something everyone uses, but it is not absolutely clear how it works. For a given query it is not possible to simply traverse all the existing billions of websites, and return the few millions that contain the sought words. I will show what a reverse index is, how results are sorted, and I will also add more advanced techniques (TF.IDF, vector model, lemmatization, synonyms, named entities).
Specialization computer science ("informatika")
Confidentiality default – not confidential
Event Jeden den s informatikou a matematikou
Presentation type invited talk (other)
Open access yes
Creator: Common Account
Created: 2/2/17 5:40 PM
Modifier: Common Account
Modified: 2/2/17 5:40 PM
***

slidypublicpresentation.pdfapplication/pdf
Content, Design & Functionality: ÚFAL, 2006–2016. Page generated: Tue Sep 26 02:13:56 CEST 2017

[ Back to the navigation ] [ Back to the content ]

100% OpenAIRE compliant