Hallo,
auf
http://www.itp.uni-hannover.de/~krohn/wscan.html.utf8
läuft jetzt eine neue Version des copyright checkers. Optisch hat sich nicht viel geändert, außer dass ein Teil der Ausgabe weggelassen wird, wenn er zu keinen Ergebnissen geführt hat.
Dafür ist der Programmcode jetzt in weiten Teilen wesentlich besser geordnet und arbeitet deutlich besser als zuvor. Ein paar Beispiele:
* Die Konvertierung von wiki text -> text ist besser geworden * Links werden jetzt korrekt in "interne", "externe", "auf andere Sprachen", "Kategorien" Links unterteilt * Verwandte Themen: dort werden jetzt die Themen nicht mehr aufgeführt, falls sie schon im Artikel verlinkt sind. Auch werden jetzt keine URLs mehr angezeigt. * Einige Templates, wie {{löschen}} werden erkannt und das Ergebnis wird angezeigt
Die letzten zwei Punkte haben zwar noch kleine bugs, aber da der code jetzt recht übersichtlich ist, sollte es nur eine Frage der Zeit sein, bis ich eine neue Version einspiele. Auch andere Interessierte sollten sich jetzt deutlich besser im code zurecht finden können - und der code ist natürlich wie immer Python license / GPL.
Erfreuliches gibt es auch von google zu vermelden: ohne große Probleme habe ich eine Erhöhung auf 7000 Anfragen/Tag bekommen. Das sollte nach meinen bisherigen Berechnungen locker für eine ganze Zeit ausreichen, zumal ich bei der anstehenden Optimierung der google Anfragen in Zukunft eher noch Anfragen einsparen werde.
Das "Layout" ist wie eingangs beschrieben im wesentlichen nicht stark verändert. Über Ideen, die ganzen Informationen optisch ansprechender zu gestalten würde ich mich sehr freuen. Am Besten wäre es eine einfache Vorlage mitzuschicken, da meine HTML/XHTML/CSS Kenntnisse sehr beschränkt sind.
Viele Grüße, Marco
________________________________________________________________ Verschicken Sie romantische, coole und witzige Bilder per SMS! Jetzt neu bei WEB.DE FreeMail: http://freemail.web.de/?mc=021193