Aller au contenu

Filtrage des informations/Techniques employées

Leçons de niveau 17
Une page de Wikiversité, la communauté pédagogique libre.
Début de la boite de navigation du chapitre
Techniques employées
Icône de la faculté
Chapitre no 2
Leçon : Filtrage des informations
Chap. préc. :Définition
Chap. suiv. :Filtrage national
fin de la boite de navigation du chapitre
En raison de limitations techniques, la typographie souhaitable du titre, « Filtrage des informations : Techniques employées
Filtrage des informations/Techniques employées
 », n'a pu être restituée correctement ci-dessus.


Le filtrage permet de laisser passer certaines informations, mais seulement après l'analyses de ces dernières. Ce sont ces analyses qui permettront de déterminer quelles informations sont autorisées à arriver jusqu'à leurs destinataires.

Plusieurs techniques peuvent être mises en place afin de filtrer les informations d'un site web. Nous allons en voir quatre.

I Filtrage par IP

[modifier | modifier le wikicode]

Le Filtrage par IP consiste à interdire l'accès et les connexions au serveur identifié par les IP incriminées.

Une adresse IP est un identifiant similaire à un numéro de téléphone. Elle permet d’identifier un composant tel qu'un ordinateur, un routeur sur un réseau supportant le protocole IP (Internet Protocol).


L' adresse IP (version IPv4) est un nombre de 32 bit (4 octets). Pour la simplicité, lorsqu'on écrit une adresse IP, on note séparément les 4 valeurs correspondantes aux octets, en les séparant par des points.

Ex: 215.236.02.123

Chacun des quatre nombres sera compris entre 0 et 255 étant donné qu’ils sont codés sur un octet chacun.

Un composant qu'elle qu'en soit le type (ordinateur, routeur, serveur) doit posséder une adresse IP pour être accessible. Sans adresse IP, ce serait comme posséder un téléphone sans numéro de téléphone, ce qui ne servirait strictement à rien.

Chaque site Internet a une adresse IP qui est convertie en nom de domaine (URL du site), il est évident que des mots sont plus faciles à retenir que des chiffres.


L'adresse IP nous est attribuée par notre F.A.I. (fournisseur d'accès Internet ). Elle change à chaque connexion on dit alors qu'elle est dynamique. Toutefois, il est possible de bénéficier d'une adresse IP fixe en en faisant la demande à votre F.A.I.


Pour connaître rapidement l'adresse IP d'un site, procédez de la manière suivante :


  • Dans le menu Démarrer, cliquez sur Programmes, puis sur Commandes MS-DOS ou cliquez sur la commande Exécuter dans le menu Démarrer
  • Tapez la commande suivante : ping www.nomdusite.com


(exemple www.yahoo.com donne 216.32.74.51).

  • Donner moins de permissions aux utilisateurs WIKIVERSITY connectés uniquement par IP et non par alias.
  • Bloquer l'adresse IP 216.32.74.51, pour bloquer le site www.yahoo.com.

Cette technique n’est pas très efficace car un site internet peut changer d'adresse rapidement. De plus il est difficile de connaitre précisément la liste des sites web abrités par une même adresse IP.

II Filtrage par nom de domaine

[modifier | modifier le wikicode]

Le Filtrage par nom de domaine consiste à interdire l'accès et les connexions aux serveurs identifiés par le nom de domaine incriminé.


Le nom de domaine est en quelque sorte la partie visible d'un site Internet. Chaque ordinateur connecté au réseau Internet possède une adresse IP constituée d'une suite de chiffres permettant de l'identifier. Pour plus de commodité et de facilité d'usage, il a été décidé de faire correspondre à chaque adresse IP un nom différent : le nom de domaine. La correspondance entre le nom de domaine et l'adresse IP est assurée par le DNS (Système de Noms de domaines). De cette manière, lorsque l’on saisit dans son navigateur Web l'adresse d'un site (de type : www.google.fr), le DNS va rechercher à quelle adresse IP correspond le nom, trouver son emplacement dans le réseau et en rapporter les informations.

  • Interdire l'accès au site internet avec le nom de domaine Facebook.com

Cette technique n’est pas très efficace car un tel blocage n'empêche l'accès au site par les adresses IP directement.

De plus un site internet peut changer de nom de domaine.

Le blocage d'un seul site internet (par exemple wordpress.com) peut bloquer des centaines de milliers de blogs, il faut donc bien choisir les sites que l’on bloque.

III Filtrage par URL

[modifier | modifier le wikicode]

Le filtrage par URL consiste à filtrer les site internet par rapport a leurs pages.


Une URL (Uniform Resource Locator) est un format de nommage universel pour désigner une ressource sur Internet. imprimables qui se décompose en cinq parties :

  • Le nom du protocole : c'est-à-dire en quelque sorte le langage utilisé pour communiquer sur le réseau. Le protocole le plus largement utilisé est le protocole HTTP (HyperText Transfer Protocol), le protocole permettant d'échanger des pages Web au format HTML.
  • Identifiant et mot de passe : permet de spécifier les paramètres d'accès à un serveur sécurisé. Cette option est déconseillée car le mot de passe est visible dans l'URL
  • Le nom du serveur : Il s'agit d'un nom de domaine de l'ordinateur hébergeant la ressource demandée. Notez qu’il est possible d’utiliser l'adresse IP du serveur, ce qui rend par contre l'URL moins lisible.
  • Le numéro de port : il s'agit d'un numéro associé à un service permettant au serveur de savoir quel type de ressource est demandée. Le port associé par défaut au protocole est le port numéro 80. Ainsi, lorsque le service Web du serveur est associé au numéro de port 80, le numéro de port est facultatif
  • Le chemin d'accès à la ressource : Cette dernière partie permet au serveur de connaître l'emplacement auquel la ressource est située, c'est-à-dire de manière générale l'emplacement (répertoire) et le nom du fichier demandé


Début de l'exemple
Fin de l'exemple


  • Sur un même site www.site.fr, autoriser la page correspondant à l'URL www.site.fr/page1.html et bloquer la page correspondant à l'URL www.site.fr/page2.html .

Cette technique est efficace car elle est plus précise (blocage des pages et non du site en entier). Il sera tous de même difficile de référencer l'intégralité des URL à filter.

IV Filtrage par contenu

[modifier | modifier le wikicode]

Le filtrage par contenu consiste à inspecter lors de l'accès au site Web, le contenu de ses pages et de filtrer selon ce que ces pages contiennent.

Les routeurs se contentent normalement de lire les en-têtes des paquets IP et n’inspectent pas leur contenu. Le filtrage de contenu nécessite l’installation de  serveurs d’inspection de contenu et le passage de tout le trafic par ces serveurs. Les serveurs permettent ensuite d’analyser le contenu des paquets et de les bloquer selon une très large gamme de critères. 

  • Bloquer toutes les pages qui contiennent le mot "voiture"

Bloquer un mot ou un terme ou une expression bloquera l’ensemble des sites comportant ce mot, ce terme ou cette expressions. Il faut donc bien choisir les mots que l’on souhaite filtrer.

Les problèmes liés à l’emploi de cette technique sont multiples : (i) elle conduit à l’analyse du contenu de tous les échanges sur internet, avec les risques de dérives que cela comporte ; (ii) elle oblige à concentrer le trafic en un nombre limité de points, avec risque de perte de qualité de service pour l’ensemble des utilisateurs, ou à installer des serveurs d’inspection de contenu à de nombreux points du réseau, avec un coût potentiellement exorbitant ; (iii) les expérimentations n’ont été réalisées qu’à un niveau limité et il subsiste de fortes incertitudes sur la possibilité de généraliser le dispositif.