Utilisateur:Irenegirard/Analyses textuelles (M2 D2SN, 2024)

Cahier d'étude :

Dans le cadre de ce cours de text mining, je souhaiterais analyser des articles à propos des risques liés à l'IA générative (en particulier aux modèles de langage).

Mon objectif est de collecter des articles de presse traitant des incidents et problèmes liés à cette technologie pour connaître les risques dominants et comprendre comment ils sont perçus et présentés par les médias qui les ont relayé. Une problématique intéressante peut être la distinction entre le risque potentiel ('problème') et un évènement avéré ('incident'). Cette distinction peut être intéressante pour comprendre sur quels sujets de fond travaillent les journalistes sur le sujet de l'IA.

Les articles seraient issus de cette base de données : https://www.aiaaic.org/ (incidents liés à l'IA de 2012 à aujourd'hui) - mon idée serait de ne récupérer que les évènements problématiques des trois dernières années et comprendre les différents patterns dans les incidents.