Aller au contenu

La visualisation géospatiale avec CorText Manager

Une page de Wikiversité, la communauté pédagogique libre.

Atelier 3 — La visualisation géospatiale avec CorText Manager (14h–15h)

[modifier | modifier le wikicode]

Cet atelier présente un flux complet “de la donnée à l’analyse spatiale” dans CorText Manager :

  • géocoder des adresses / lieux (toponymes) et gérer les ambiguïtés ;
  • valider / corriger les localisations ;
  • agréger sur des objets géographiques (villes, régions, aires urbaines, etc.) ;
  • cartographier des valeurs (cartes choroplèthes / symboles proportionnels) ;
  • cartographier des réseaux (collaborations, flux origine–destination) et, au besoin, explorer ces réseaux dans Arabesque.

Matériel et prérequis

[modifier | modifier le wikicode]
  • Un projet CorText Manager et un corpus importé (ou un extrait d’exemple).
  • Au moins une colonne “où ?” :
    • adresse complète ;
    • ou ville/pays ;
    • ou codes structurés (ex. CP) ;
    • ou toponymes extraits.
  • Optionnel
    • pour les réseaux : plusieurs adresses par document, par exemple par “acteur” (auteur, organisation, établissement…), permettant de construire des collaborations.
    • pour un croisement de dimension d'analyse : une clustering thématique déjà effectué par Cortext Manager, où des catégories déjà présentes dans le corpus pour, par exemple, une comparaison des réseaux en fonction de thèmes.

0. Cas d’étude fil rouge (adaptation au changement climatique)

[modifier | modifier le wikicode]

Cette section sert d’illustration “avant / pendant / après” : elle définit les frontières du corpus et montre ce que l’on peut produire en géovisualisation (valeurs + réseaux), dans une logique similaire à la démonstration de l’atelier.


0.1 How? Définir les frontières de l’étude

[modifier | modifier le wikicode]
Contexte et cadrage Requêtes et périmètre de données

Les impacts du changement climatique sur nos modes de vie et nos formes d’organisation constituent un enjeu majeur du XXIe siècle. Les politiques publiques structurent classiquement la réponse autour de deux axes :

  • Atténuation (mitigation) : réduire les émissions / les causes ;
  • Adaptation : limiter les impacts sur les activités socio-économiques, les espèces, les milieux et les écosystèmes.

(Illustration mitigation vs adaptation)

  • Voir l’image : mitigation vs adaptation

Publications scientifiques (ex. Web of Science)

[modifier | modifier le wikicode]

Exemple de requête (2001–2024) :

TS=("adapt* to climat* chang*" OR "adapt* climat* chang*" OR "adapt* for climat* chang*" OR
    "climat* chang* adapt*" OR "adapt* to climat*" OR "adapt* climat*" OR
    "adapt* for climat*" OR "climat* adapt*")
AND PY=(2001-2024)

Filtre (exemple) : Scientific journal, book chapters, proceeding paper

Fronts de recherche doctorale (theses.fr)

[modifier | modifier le wikicode]

Exemple d’API de recherche theses.fr (paramètre q=…) :

 theses.fr/api/v1/theses/recherche/?q=(
  "adapt* to climat* chang*" OR "adapt* climat* chang*" OR "adapt* for climat* chang*" OR
  "climat* chang* adapt*" OR "adapt* to climat*" OR "adapt* climat*" OR
  "adapt* for climat*" OR "climat* adapt*" OR
  "adaptation* au* changement* climatique*" OR "adaptation* changement* climatique*" OR
  "adaptation* pour le* changement* climatique*" OR "adaptation* au* climat*" OR
  "adaptation* climatique*" OR "adaptation* pour le climat*" OR "climat* adaptation*"
)

Note de cadrage (exemple d’interprétation) :

  • 380 thèses (dont un sous-ensemble “en cours” et “soutenue”) selon les filtres retenus dans la démonstration.


1. Étape 1 — Géocodage dans CorText Manager (≈ 20 min)

[modifier | modifier le wikicode]

Le géocodage associe à une information textuelle (adresse, toponyme, code…) :

  • des coordonnées ;
  • (souvent) un type d’objet géographique et un niveau d’échelle.

Dans CorText Manager, on dispose :

  • d’un accès “application” (Manager) et de services “moteur” (API) selon les besoins.

1.2 Résolution d’ambiguïtés (ce que fait le moteur)

[modifier | modifier le wikicode]

Pour une adresse / un toponyme donné, le moteur peut arbitrer entre plusieurs candidats en mobilisant :

  • une classification des entités géographiques (placetypes / ontologie) ;
  • des variables externes (ex. critère de “popularité” / taille) pour ordonner les candidats.

Référence utile (placetypes Who’s On First)

1.3 Stratégies d’échelle (micro / méso)

[modifier | modifier le wikicode]

D’après la démonstration (Manager) :

  • Micro géocodage : priorité à l’échelle rue / bâtiment / POI (si les adresses sont riches et propres).
  • Méso géocodage : filtrage (noms d’organisations, rues, personnes, boîtes postales…) pour réduire les ambiguïtés et produire des localisations plus agrégées (quartier → ville → aire urbaine).

1.4 Pas à pas (dans l’atelier)

[modifier | modifier le wikicode]
  1. Identifier la/les colonnes de localisation (adresse, ville, pays, codes…).
  2. Lancer l’opération de géocodage dans CorText Manager.
  3. Choisir la stratégie (micro / méso) adaptée à la qualité de l’entrée.
  4. Exécuter et inspecter : taux de géocodage, valeurs manquantes, localisations aberrantes.

2. Étape 2 — Validation, corrections, “refine” (≈ 15 min)

[modifier | modifier le wikicode]

Le contrôle qualité est indispensable : homonymes, adresses tronquées, pays manquants, etc.

2.1 Ce qu’on vérifie

[modifier | modifier le wikicode]
  • Points “hors zone” (continent/pays inattendus).
  • Doublons (variantes d’écriture).
  • Ambiguïtés (“Cambridge”, “Springfield”…).
  • Valeurs non géocodées.

2.2 Correction / raffinement

[modifier | modifier le wikicode]

Dans la démonstration, une étape de validation/correction (“refine”) est utilisée pour filtrer et corriger les cas problématiques, puis relancer si nécessaire.


3. Étape 3 — Agrégation (≈ 10 min)

[modifier | modifier le wikicode]

Objectif : passer des points à des unités d’analyse stables :

  • villes (centroïdes),
  • régions/pays,
  • aires urbaines fonctionnelles, etc.

3.1 Pourquoi agréger ?

[modifier | modifier le wikicode]
  • Comparabilité (mêmes unités pour tous),
  • Robustesse (moins sensible au bruit des adresses),
  • Interprétation (territoires plutôt que points).

3.2 Exemple : aires urbaines fonctionnelles (FUA)

[modifier | modifier le wikicode]

La démonstration mentionne un assemblage multi-sources (Europe/JRC, Urban Audit, US Census, OCDE, Chine, Natural Earth/MODIS…) pour définir des unités urbaines cohérentes à l’échelle mondiale. (Penser aux crédits/citations selon l’usage).


4. Cartographier : valeurs vs réseaux (≈ 10 min)

[modifier | modifier le wikicode]

4.1 Cartes de valeurs (pas de réseau)

[modifier | modifier le wikicode]

Exemples :

  • volume de publications par ville/aire urbaine ;
  • intensité d’un thème par région ;
  • évolution par périodes.

Livrables typiques :

  • table agrégée (lieu → valeur),
  • exports compatibles carto (CSV géocodé ; GeoJSON si disponible selon pipeline).

4.2 Réseaux et flux (liens entre lieux)

[modifier | modifier le wikicode]

Exemples :

  • co-publications entre villes,
  • collaborations entre organisations multi-sites,
  • flux origine–destination.

Mesures usuelles :

  • compte entier : chaque lieu compte “plein” ;
  • compte fractionnaire : chaque lieu reçoit une fraction (1/n) de la collaboration.

5 Where? Résultats illustratifs (valeurs + réseaux)

[modifier | modifier le wikicode]

5.1.1 Publications scientifiques — top pays (valeurs agrégées)

[modifier | modifier le wikicode]
  • Voir l’image : top 10 countries

Lecture (exemple) : volume par pays, année moyenne de publication, impact (citations normalisées) – les contrastes peuvent signaler des entrées plus récentes dans le champ et des centres de production/impact.

5.1.2 Publications scientifiques — intensité de recherche des villes (carte interactive)

[modifier | modifier le wikicode]

Lien direct (toujours utilisable) :

  • Carte interactive : intensité de recherche des villes

5.1.3 Publications scientifiques — réseau international de collaborations (villes)

[modifier | modifier le wikicode]
  • réseau international
  • Ouvrir Arabesque

Lecture (exemple) : réseaux nationaux structurés (ex. Chine, Australie), liens faibles entre certains ensembles, et “portes d’entrée” (villes passerelles) pour des collaborations interrégionales. Pour explorer, filtrer et mettre en forme les flux : Arabesque.

5.1.4 Publications scientifiques — réseau France (villes)

[modifier | modifier le wikicode]
  • Voir l’image : réseau France

Lecture (exemple) : structuration en triangle (ex. Paris–Montpellier–Toulouse) et rôle de pôles régionaux (ex. Grenoble, Bordeaux, Rennes…).


5.2 Where? Fronts doctoraux — réseaux d’établissements

[modifier | modifier le wikicode]

5.2.1 Réseau national (France)

[modifier | modifier le wikicode]
  • Voir l’image : réseau national

Lecture (exemple) : réseau en étoile, centralités, hubs régionaux, et effet d’échelle selon l’unité (ville / établissement / aire urbaine).

5.2.2 Focus local (Île-de-France)

[modifier | modifier le wikicode]
  • Voir l’image : focus local

Lecture (exemple) : structuration par Paris/Saclay, et rôle de campus/organisations dans l’accueil des doctorant·es sur ces thématiques.


6. Interopérabilité : explorer un réseau spatial dans Arabesque

[modifier | modifier le wikicode]

Lorsque l’on veut aller plus loin dans la géovisualisation des réseaux/flux (sémiologie, filtrages attributaires, filtrage spatial par distance, couches, tuiles…), on peut utiliser Arabesque.

6.1 Ce qu’Arabesque permet (repères rapides)

[modifier | modifier le wikicode]
  • Importer des nœuds + liens (ou des matrices OD) ;
  • Paramétrer la géographie (fonds, couches, reprojection) ;
  • Paramétrer la géométrie et la sémiologie (nœuds/liens) ;
  • Filtrer (attributs, distances) et exporter.

Documentation (Arabesque 2) :

6.2 Repères d’interface (mémo)

[modifier | modifier le wikicode]

D’après le support :

  • Panneau central : géovisualisation
  • Panneau droit : statistiques, filtrage attributaire, filtrage spatial (distance)
  • Panneau gauche : géographie (tuiles/couches), implantation, géométrie (liens/nœuds), sémiologie

7. Conclusion (≈ 5 min)

[modifier | modifier le wikicode]

Questions pour guider l’interprétation :

  • Quelles unités spatiales sont pertinentes (ville, aire urbaine, région, pays) ?
  • Quelle mesure de collaboration (entier / fractionnaire) est la plus adaptée ?
  • Quelles hypothèses émergent (pôles, corridors, villes-ponts, effets d’échelle) ?

  • Arabesque (application)
  • Documentation Arabesque 2
  • Exemples d’usage de l’API theses.fr (paramètre q=)
  • Who’s On First — placetypes (ontologie)

Support de démonstration et trame de l’atelier (CorText / Arabesque ; géocodage, refine, agrégation, interopérabilité) : Lionel Villard, Françoise Bahoken, Étienne Côme, Luis Daniel Medina