Utilisateur:馬帝思/Analyses textuelles (M2 D2SN, 2024)
Corpus étudié : Base de données Europresse d'articles consacrés à la question démographique dans la presse française, ainsi qu'à la situation démographique du Japon.
Séance 2
- Téléchargement de corpus via Europresse.
- Exploration des données via Cortext Manager : extraction de termes et constitution de réseaux en vue de voir des premiers résultats.
- Ajustement du corpus à partir de ces premières visualisations en vue de le délimiter de la façon la plus pertinente possible avec les mots clés les plus pertinents.
Séance 3
- Appropriation du script Sashimi sur Cortext Manager.
- Application de Sashimi sur les corpus constitués à la précédente séance.
- Etude des résultats, et prévision d'ajustement et de précision des corpus sur cette base.
Séance 4
- A partir des résultats du dernier usage de Sashimi, retour sur Europresse pour adapter les mots clés pour constituer le corpus.
- Sélection des mots-clés suivants : TEXT= (("démographie"|"natalité"|"fécondité") @ Japon*)& TIT_HEAD= Japon*
- Sélection des 1000 résultats les plus pertinents, et traitement par Sashimi.
Séance 5
- Travail sur différents scripts cortext : Sashimi, Network Mapping, Sentiment Analysis.
- Difficultés dans l'usage de Sashimi malgré son étude. Sentiment Analysis non fonctionnel.
- Réalisations de différents réseaux avec plusieurs paramètres.