Am Dienstag, 22. März 2005 10:14 schrieb elwp@gmx.de:
Um Probleme mit der Zuordnung kurzer Sequenzen zu verringern habe ich das Programm etwas geändert: Jetzt wird nicht mehr einer ganzen 5-Worte-Sequenz eine Versionsnummer, in der sie zuerst auftrat, zugeordnet, sondern jedem einzelnen Wort darin eine eigene. Dadurch ist es auch möglich, konsequent jede 5-Wort-Sequenz zu erfassen, also nicht nur die, die komplett in den Lücken liegen.
Damit man sehen kann, dass das tatsächlich funktioniert, gibt das Programm jetzt auch den Text farbig markiert aus. Ein Beispiel habe ich unter Wikipedia:Hauptautoren/Lorentz-Transformation hochgeladen.
Ich kuck mir das grade mal an - versuch das mal mit einem größeren Artikel mit ner längeren Historie und vielen Autoren (Deutschland oder so) - dann siehst Du vermutlich, was ich in einer anderen Mail mit "zersplitterung" meinte.
Uli