Utilisateur:馬帝思/Analyses textuelles (M2 D2SN, 2024)

Une page de Wikiversité, la communauté pédagogique libre.

Corpus étudié : Base de données Europresse d'articles consacrés à la question démographique dans la presse française, ainsi qu'à la situation démographique du Japon.

Séance 2

  • Téléchargement de corpus via Europresse.
  • Exploration des données via Cortext Manager : extraction de termes et constitution de réseaux en vue de voir des premiers résultats.
  • Ajustement du corpus à partir de ces premières visualisations en vue de le délimiter de la façon la plus pertinente possible avec les mots clés les plus pertinents.


Séance 3

  • Appropriation du script Sashimi sur Cortext Manager.
  • Application de Sashimi sur les corpus constitués à la précédente séance.
  • Etude des résultats, et prévision d'ajustement et de précision des corpus sur cette base.


Séance 4

  • A partir des résultats du dernier usage de Sashimi, retour sur Europresse pour adapter les mots clés pour constituer le corpus.
  • Sélection des mots-clés suivants : TEXT= (("démographie"|"natalité"|"fécondité") @ Japon*)& TIT_HEAD= Japon*
  • Sélection des 1000 résultats les plus pertinents, et traitement par Sashimi.


Séance 5

  • Travail sur différents scripts cortext : Sashimi, Network Mapping, Sentiment Analysis.
  • Difficultés dans l'usage de Sashimi malgré son étude. Sentiment Analysis non fonctionnel.
  • Réalisations de différents réseaux avec plusieurs paramètres.