Utilisateur:Stevendelmotte/Analyses textuelles (M2 D2SN, 2024)

Une page de Wikiversité, la communauté pédagogique libre.

1830 articles de presse récupérés sur Europresse en lien avec les polèmiques / controverses entourant l'organisation des JOP de Paris 2024.

Exemple de requête : LEAD=("Paris 2024"|"JO 2024") & TEXT=(scandale*|polémique*||controverse*|débat*|critique*|discussion*) | TONE=Negative.

Transformation des fichiers .html en fichiers .txt avec Python et Tiresias.

Transformation des fichiers .txt en un fichier .csv puis dataframe pandas contenant le nom du fichier et le contenu du fichier.

À faire : ne sais pas