Edition

Accueil
World wide web
Technique





Publication: 24 Mars 2006


Neutraliser les Shadock

Pomper des données est un des exercices les plus pratiqués sur le web et surtout utilisé pour récupérer des adresses e-mail. Il faut donc bloquer ceux qui s'adonnent à ce genre d'activité.


Rien de plus facile que pomper des pages web à la chaîne sur le web. Indépendamment du fait qu'il existe des tas de programmes, en construire un ne requiert que quelques minutes. Evidemment ce sera sauvage, mais les pompeurs qui cherchent des adresses e-mails ne se soucient généralement pas des serveurs qui se trouvent derrière.

Bref, ça pompe.
Et quand ça pompe, il faut interrompre le pompeur.

C'est là qu'il existe quelques configurations intéressantes.

Prérequis nécessaires à la lecture de cette page:
  • Disposer d'un site web
  • Avoir accès au site web
  • le serveur doit être apache
  • Avoir accès au fichier de configuration du serveur (optionnel)
  • ne pas être manchot en informatique
  • subir ou avoir subi des pompages
Et maintenant un peu de technique:

Cette technique de protection peut se mettre en place deux façons différentes:

  • En utilisant les fichiers .htaccess qui se trouve dans les répertoire de votre serveur. Cela évite de toucher à la configuration du serveur.
  • En intégrant directement les lignes de code dans le fichier configuration du serveur.

Le procédé consiste à utiliser le module de réécriture d'Apache Mod_rewrite. Un module qui n'est pas réputé pour sa simplicité, mais avec un peu d'attention, vous devriez y arriver sans trop de peine.

Exemple:

order deny,allow
deny from 207.234.248.28
RewriteEngine on
Options +FollowSymlinks
RewriteCond %{REMOTE_ADDR} "^63\.148\.99\.2(2[4-9]|[3-4][0-9]|5[0-5])$" [OR]
RewriteCond %{HTTP_USER_AGENT} "dts agent" [OR]
RewriteCond %{HTTP_USER_AGENT} .*almaden.* [OR]
RewriteCond %{HTTP_USER_AGENT} "^Missigua Locator" [OR] # Email harvester 20050410
RewriteCond %{HTTP_USER_AGENT} "^Port Huron Labs" [OR] # Email harvester 20050410
RewriteCond %{HTTP_USER_AGENT} ^InternetSeer.com
RewriteRule .* - [F]

Je pense que des explications sont nécessaires:

RewriteEngine on signale au serveur qu'il faut utiliser le module de réécriture

RewriteCond %{REMOTE_ADDR} "^63\.99" [OR]

analyse le variable REMOTE_ADDR qui contient l'adresse IP du client qui demande une page, la suite est une expression rationnelle qui précise quels éléments de l'adresse IP sont interdits.

[OR] signale qu'il y a d'autres conditions à analyser avant d'agir

RewriteCond %{HTTP_USER_AGENT} "dts agent" [OR]

où HTTP_USER_AGENT est le nom du logiciel qui se connecte. Cela peut-être utile dans certains cas pour interdire les outils de pompage qui ont un nom spécifique.

La dernière ligne avant la régle à appliquer ne sera évidemment pas terminée par [OR]

RewriteRule .* - [F]

Dit sur quoi il faut agir ".*" désigne tous les fichiers, tandis que [F] signale l'interdiction d'accéder à la page.

Il suffit ensuite d'ajouter les lignes souhaitées en fonction des besoins.

Dans le cas d'un fichier de configuration avec serveurs virtuels, il faut ajouter pour chaque configuation virtuelle la ligne suivante:

ReWriteOptions inherit

Et hop, les indésirables finissent au panier.

Date de péremption: 00 0000 00:00:00
Date de création: 24 Mars 2006 15:11:28
Date de dernière modification: 24 Mars 2006 15:12:08

Répondre à cette information Neutraliser les Shadock






Intervenir dans la rubrique
Technique