Aller au contenu

D2SN/Séminaire Mémoire/Introduction

Une page de Wikiversité, la communauté pédagogique libre.

La préparation de l’article occupera une place importante durant votre année de master. Correspondant à 20 ECTS sur les 60 ECTS du master 2, la note de l’article ne peut être compensée avec aucune autre matière. De ce fait, il vous faut obtenir une note supérieure ou égale à 10 pour obtenir votre diplôme.

Voici quelques conseils pour réussir au mieux cette épreuve, et même y prendre du plaisir.

Le mémoire étant un exercice exigeant, nous vous conseillons de choisir un sujet qui vous plaît personnellement. Il est possible de réaliser votre mémoire à partir de ce que vous faites en entreprise, mais il faut que le travail de repurposing puisse coller aux exigences des sciences sociales computationnelles, ce qui est souvent compliqué à réaliser. Si vous réussissez la publication, vous pourrez montrer, dans votre cv, une formalisation concrète de vos savoirs faire et domaine d’intérêt.

Il est possible de réaliser ce travail à deux, mais nous le déconseillons, à moins que les compétences soient complémentaires (un profil info-stat et un profil SHS).

Comment choisir votre sujet ?

[modifier | modifier le wikicode]

L’éventail des sujets possibles est assez large. Voici quelques exemples de sujets choisis dans les années précédentes :

  • La diaspora des informaticiens russe : une analyse à partir des données de Github
  • Une analyse du système de recommandation de YouTube sur le thème du changement Climatique
  • Une analyse du système de recommandation de Spotify.
  • Un corpus d’une centaine de millier de lettre de motivation pour un recrutement au Ministère des armées.
  • La controverse des bébés sans bras sur Twitter
  • Analyse de contenu des Tweets du mouvement MeToo et Balance ton Porc.
  • Profils de surendettés

Lorsque vous avez une ou plusieurs idées de sujets, n’hésitez pas à venir me solliciter ou à solliciter les enseignants susceptibles d’encadrer des mémoires.

Nous proposons des sujets de mémoire en lien avec des sujets de recherche du laboratoire. J’ai pour ma part plusieurs jeu de données à fournir sur YouTube notamment. Nous avons signé un partenariat de recherche avec la Direction de l’Aviation Civile, qui nous a fourni un jeu de donnée très intéressant.

Construire un corpus ou constituer un dataset

[modifier | modifier le wikicode]

Nous attendons de vous que vous mobilisiez une approche quantitative qui peut prendre plusieurs formes ; l’enquête numérique (questionnaire en ligne ou le web expériment), la simulation ou la fouille de données.

On peut avoir un sujet en tête et chercher les jeux de données déjà disponibles ou imaginer une manière proactive de produire des données. On peut être opportuniste, c’est-à-dire choisir un sujet parce que le jeu de données existe. Il existe une quantité extraordinaire de jeu de données ou de corpus en ligne. On peut aussi partir d’un jeu de données ou d’un corpus fourni par votre entreprise.

On peut aussi choisir un sujet en fonction d’un évènement attendu ou inattendu que l’on peut suivre en temps réel. C’est le genre de situation typique des sciences sociales computationnelles : les gilets jaunes, le mouvement MeToo, les élections présidentielles.

Les sujets rencontrés dans le cadre des cours et ateliers du master sont possibles :

  • Un corpus Wikipedia
  • Un corpus RATP (analyse spatio-temporelle)
  • Fraudes scientifiques

L’attribution d’un tuteur

[modifier | modifier le wikicode]

À partir du 18 novembre, lorsque vous aurez un aperçu de votre sujet, vous pouvez suggérer le nom d’un tuteur parmi la liste ci-dessous des enseignants du Master :

  • Bilel Benbouzid (Sociologie numérique/YouTube)
  • Lionel Villard (Scientométrie)
  • Jean-François Bercher (Machine Learning)
  • Annick Vignes (Modélisation/Simulation/thème des violences faites aux femmes)
  • Marianne Noel (Sociologie numérique/YouTube)
  • Alexandre Hannud Abdo (Sociologie numérique/Open Access)
  • Marc Barbier (Sociologie numérique/Open Access)
  • Jean Samuel Beuscard (Sociologie numérique/ musique en ligne)
  • Alexis Perrier (Machine Learning)

D’une façon générale, tout au long de l’année, c’est à vous de solliciter votre tuteur, de préférence en lui apportant des matériaux pour nourrir vos échanges.

Les différentes approches possibles

[modifier | modifier le wikicode]

Votre protocole de recherche et la méthode associée peut prendre différentes formes :

  • Enquête numérique : ex : Questionnaire ou experimentation web
  • Fouille de données : ex : corpus textuels de très grandes tailles
  • Simulation orientée agents : nécessite une base empirique pour calibrer les modèles.

Il n’y a pas de volume indicatif pour le jeu de données (big ou small data), mais l’approche est nécessairement quantitative. Un complément qualitatif est néanmoins envisageable.

Nous attendons de vous que vous fassiez des lectures, dans une logique de couverture systématique en lien avec votre sujet et votre approche.

Avec les conseils de votre tuteur et des autres enseignants, vous constituerez une

bibliographie constituée de travaux qui vous aideront dans votre analyse et permettent de mieux situer votre travail.

Attention toutefois à ne pas trop vous disperser dans vos lectures. Pour cela, il important de mobiliser l’outil Zotéro qui vous permettra d’indexer votre bibliographie.

L’analyse de vos données, la production d’un résultat

[modifier | modifier le wikicode]

Une fois que vous aurez collecté et explorer vos données, nous vous conseillons de consacrer un temps important à l’analyse. C’est à partir de cette analyse que vous pourrez constituer un plan équilibré de votre article et apporter un résultat intéressant et robuste.

Il faut du temps pour dégager un discours analytique sur la base de graphes. C’est une construction et un exercice rhétorique assez complexe. Pour vous trouviez le temps, nous faisons en sorte que votre agenda du mois de juin soit entièrement consacré à l’écriture (plus de cours). Nous vous accompagnerons également dans l’écriture d’un article scientifique. La stabilisation d’un résultat et l’écritiure se fait dans une collaboration étroite avec le tuteur.

Respecter les normes d’écriture des articles scientifiques

[modifier | modifier le wikicode]

Les normes de l’écriture des articles scientifiques seront présentées en séances.

Deux types de formats peuvent être choisi :

  • Le format des articles des sciences computationnelles : le format IMRAD, permet de viser des plateformes de pré-publication comme arXiv ou la revue généraliste PLOS-one, l’approche statistique est souvent très avancées et robuste.
  • Le format des articles des revues scientifiques en SHS, en respectant les consignes aux auteurs de la Revue Réseaux ou Anthropologie des connaissances.

Dans l’écriture de l’article, pensez au volume d’annexes, qui est une partie importante à soigner. Ce qui montrer que le travail d’article correspond à un volume équivalent à celui d’un mémoire.

La soutenance de l’article dure 45 minutes

Vous aurez 10 minutes pour présenter (toujours sans Powerpoint) votre question de recherche, la méthode choisie et les principaux résultats qui se dégagent de votre article. Inutile de répéter ce qu’il y a dans l’article. (les membres du jury l'auront lu avec attention)

Vous essaierez de prendre du recul en élargissant éventuellement à d'autres objets ou à d'autres questionnements

Vous pouvez également évoquer les difficultés que vous avez rencontrées, les surprises éventuelles, les choix méthodologiques que vous regrettez éventuellement, etc.

Le jury vous posera des questions, auxquelles vous répondrez de façon précise, en prenant des exemples tirés de votre recherche ou de vos lectures.