[WikiFR-l] ChronoBot...

Athymik athymik at ifrance.com
Ven 13 Déc 12:15:06 UTC 2002


> > Alors, je l'implemente ou pas la fonction de vérification
> > (pour savoir si  l'article a bien été posté) ?
>
> Pour moi, oui... mais si les autres s'en foutent, on ferra sans ;o)

Ce serait bien d'avoir quelques autres avis...
Pas grand chose, mais ce serait bien utile ;-)

> > En fait, il faut obtenir la page d'édition pour comparer
> > le texte de la textbox avec l'article que l'on aurait dû obtenir...
> > Qq problèmes : certains caractères sont remplacés par des
> > entités html, etc
>
> Ils s'agit surement des caracteres non-ASCII.
> Ca doit pas etre sorcier a detecter, mais je t'accorde que ca rend la tache
> plus ardu.

Les caractères non-latin-1 du texte (lors du post) sont remplacés par leur 
équivalent unicode par le bot...
Alors que ceux du texte que le bot récupère sont codés en entités HTML.
Ce devrait (normalement) pas poser de problème mais Rebol me rajoute des fins 
de ligne où il ne devrait pas y en avoir et le logiciel de Wikipedia ne 
supporte pas de trouver des entités HTML pour >, <, & et " dans le texte de 
l'article.
C'est assez "galère"...

> Une solution intermediaire pourrai etre, par exemple, de placer des balises
> (liens invisibles) en debut et fin d'article, pour pouvoir au moin
> verifier, apres coup, que l'ensenble de l'article a bien ete poste.

C'est une excellente idée ça ! Retenu !

> > En fait, ça contribuerait à ralentir encore plus le serveur...
> > Sinon, c'est clair que l'opération gênera les contributeurs :
> > 1994 articles dans les RC -> l'effet piranha à l'eau.
>
> La, je suis pas du tout d'accord.
> Pour moi, un bot "poster" doit avoir une limite (parametrable) de nombre
> d'access au serveur par minute (ou par seconde peu importe).

Pour l'instant j'avais prévu 3,5 s entre chaque accès.

> A partir de
> la, si tu as besoin de 5 access par page au lieu de 1, ca devrai ralonger
> le temps d'execution du bot de 5 fois, mais en aucun cas ca devrai
> accelerer le nombre d'access par minute.

J'suis d'accord. Je voulais dire qu'un bot ralentit le serveur, mais que la 
vérification le ralentit encore plus (pour le même délai entre deux posts...).
En fait, je ne souviens plus pourquoi j'ai dit ça... parce que c'est 
complètement évident. 

> Bon, j'en ai un peu mare de t'embeter avec tout ca. En tout cas, en ce qui
> me concerne, j'enleve mon veto pour le "post" sauvage d'article. Si tu as
> la bonte de verifier un max de chose tant mieux, sinon "advienne que
> poura".

Je compte :
- obtenir la liste des articles existants ou pas, durant le post (si le 
serveur retourne une page avec un titre qui commence par "C" comme "Confit de 
modification", le bot ajoute le nom de l'article à un bloc "art_existants" 
sinon il l'ajoute à "art_nouveaux".
- vérifier le post au moins par des balises (une balise quelconque au début 
et le "W3 ru73 d4 w1k1..." à la fin)

J'espère pouvoir effectuer une vérification complète de l'article...

> Pour la generation des pages d'annees, il reste 2 problemes en supend :
>
> - N'y a t'il pas d'erreure dans le generateur de nombre en lettre

J'en ai pas vu... mais je vois mal ;-)

> - Comment decouper les dates en decennie :
> Si on prend [Annees 1930] = 1930~1939 ca pose un probleme pour les [annees
> 0], puisse que l'annee 0 n'existant pas, on aurra que 1~9... une decennie
> de 9 ans !?
> Si on dit que la premiere decennie va de 1~10, alors les [annees 1930]
> irrons de 1931~1939 (pas d'annee 1930) !!!
> Une solution serrai de nommer les decennies [Annees 1] et [Annees 1931],
> mais c'est pas tres naturelle.
> Enfin, peux etre le plus rigoureux serrai de faire comme pour les siecles :
> [1er decennie] (1~10), [193e decennie] (1931~1940)... mais la non plus
> c'est pas tres intuitif.
> En resume on a le choix entre :
>
> 1) [Annees 0] = 1~9 et [Annees 1930] = 1930~1939
> 2) [Annees 0] = 1~10 et [Annees 1930] = 1931~1940
> 3) [Annees 1] = 1~10 et [Annees 1931] = 1931~1940
> 4) [1er decennie] = 1~10 et [193e decennie] = 1931~1940
>
> J'aimerai avoir l'avis d'au moin une personne (Athymik?) comme ca, apres
> coup, quand on nous dira que ca va pas du tout, je pourrai toujours dire
> que c'est sa faute... :oD

Ok... Je suppose que tu as décidé au hasard ;-D
Ben moi je dirai que Rebol Technologies remplace tous les nombres dans REBOL 
par des nombres aléatoires...
Qui ira prouver le contraire (merci de ne pas répondre à cette question ;-D) 
???

J'suis plutôt pour la solution 1...

> Aoineko

Athymik




Plus d'informations sur la liste de diffusion WikiFR-l