COURS EN HUMANITÉS NUMÉRIQUES ET ANALYSE DE DONNÉES

POUR ETUDIANTS DE TOUS NIVEAUX

  • 2e semestre 2022-2023
  • E-credits: 3

Destiné aux étudiants de la Faculté des Lettres,   le cours vise à les familiariser avec les méthodes et outils numériques, en leur donnant à la fois une culture et une pratique dans l’analyse et le traitement des données. Il équilibrera harmonieusement conférences et exercices pratiques, guidés ou en autonomie.  Une partie des exercices portera sur des corpus patrimoniaux en langues slaves.

Co-organisé par les universités Charles de Prague, de Varsovie et Sorbonne Université, dans le cadre de l’Alliance 4EU+ (Convention n° No 2021_F3_10), le cours se tiendra en anglais et en visio-conférence. Les étudiants retenus recevront un lien Zoom.

Un atelier final,  tenu à  l’université Charles de Prague, au mois de juin 2022 clora le semestre (Bourses de séjour octroyées).

Aucun pré-requis n’est exigé, hormis le maniement d’un ordinateur portable, une bonne maîtrise des logiciels de base et un niveau de compréhension suffisant en anglais. Des connaissances, même sommaires, en langues slaves sont bienvenues.

Programme

  • Numérisation de données
  • Structuration des bases de données
  • Annotation des données
  • Reconnaissance de caractères
  • Contraintes juridiques
  • Stockage et interrogation de données
  • Analyse textuelle quantitative en sociologie
  • Utilisation des données en droit
  • Utilisation des données dans le traitement du langage naturel
  • Outils de visualisation des données
  • Big data et bibliothèques numériques

Bibliographie

  • Brett, M.R. Topic Modeling: A Basic Introduction. The Journal of Digital Humanities 2(1): 12-16. 2012. on-line
  • Foster, Ian, Ghani, Rayid, Jarmin, R.S., Kreuter, F. and Lane, J. (ed.). Big Data and Social Science: A Practical Guide to Methods and Tools (Chapman & Hall/CRC Statistics in the Social and Behavioral Sciences). 2017.
  • Piotrowski, Michael. Natural Language Processing for Historical Texts. Morgan & Claypool Publishers. 2012. pdf