Il suffit de parser chaque page du forum, et placer les résultat d'une série de regex dans une base de données type sqlite ou mysql.
Je n'y aurait même pas pensé !!! Mais cela sous entend d'externaliser le moteur ???
Externaliser le moteur et la base de donnée, ou avoir un accord d'accès à celle déja existante (on peut toujours rêver

).
Externalisé -> avoir un controle total -> pouvoir optimiser selon NOS besoin.
Cà j'y avait déjà pensé, mais pour une toute autre utilité, celle du nettoyage du forum que nous commençons

A vrai dire, j'ai une flemmingite aigüe grave, même un simple
pavuk me fait horreur en ce moment

Ainsi l'image récuperée aurait subie un traitement recursif.
L'avantage d'avoir une copie de travail c'est de pouvoir la journaliser, en cas d'erreur on ne touche jamais à l'original.
Et aussi de pouvoir envoyer des requête / script trés puissant pour manipuler les post très rapidement et de manière totalement automatisé.
Dans l'idée génerale, nous avions déjà évoqué les problèmes relatifs au moteur de recherche, même si il contient les options qui permettent une recherche spécifique, si nous pouvions faciliter son utilisation et le contenir au forum francophone, je suis 100% partant.
J'avais déja fait un client en java pour le forum korben .info, donc si d'autre membres sont partant pour ce lancer dans le projet pourquoi pas.
EDIT: J'ai renverser la mise en forme du forum, tout le design est basé sur des <table> <tr> <td>.
je suis en train de faire un script python qui va générer une bdd contenant les info suivante :
icône du topic, nom du topic,
nom du membre rédacteur,
nombre de reply,
nombre de vue,
date du derniers post,
nom du membre rédacteur du derniers post,
lien vers le topic
En parallèle je vais faire en sort qu'il génère une table des membres avec les info suivante :
nom du membre, lien vers son profil
Affaire à suivre, pour le contenu des topics je verrais dans un second temps.
Problème que je viens de découvrir, il n'est pas possible d'avoir un avertissement en cas de post édité, je sait pas comment je vais faire pour détecter les éditions de post, enfin je verrai ça plus tard.
(Je suis sur le point de générer 1520 requêtes http, je vais devoir limiter le nombre de requêtes par seconde sinon je vais me faire tuer.)