Um Probleme mit der Zuordnung kurzer Sequenzen zu verringern habe ich das Programm etwas geändert: Jetzt wird nicht mehr einer ganzen 5-Worte-Sequenz eine Versionsnummer, in der sie zuerst auftrat, zugeordnet, sondern jedem einzelnen Wort darin eine eigene. Dadurch ist es auch möglich, konsequent jede 5-Wort-Sequenz zu erfassen, also nicht nur die, die komplett in den Lücken liegen.
Damit man sehen kann, dass das tatsächlich funktioniert, gibt das Programm jetzt auch den Text farbig markiert aus. Ein Beispiel habe ich unter Wikipedia:Hauptautoren/Lorentz-Transformation hochgeladen.