Sucher Programmierer für einfache Fehleranalyse!
Kann ein lieber Programmierer mal eine Live-Webseite programmieren (Toolserver) auf der angezeigt wird, welche Artikel eine ungleiche Anzahl von "[" und "]" haben.
Beim Filtern der Datenbank ist mir aufgefallen, dass bei einigen Artikeln z.B. bei den Kategorien immer wieder eine "]" fehlt.
http://de.wikipedia.org/w/index.php?title=Vox_%28Verst%C3%A4rker%29&diff...
Beim aktuellen Dump waren bei 27 Aritkeln die Kategorien nicht korrekt mit Klammern versehen. Sicherlich sind es bei normalen Links in den Texten wesentlich mehr.
Da eine korrekte Syntax wünschenswert ist, wäre eine Webseite, die alle fehlerhaften Artikel auflistet sinnvoll.
Besten Dank Stefan
Beim aktuellen Dump waren bei 27 Aritkeln die Kategorien nicht korrekt mit Klammern versehen. Sicherlich sind es bei normalen Links in den Texten wesentlich mehr.
Da eine korrekte Syntax wünschenswert ist, wäre eine Webseite, die alle fehlerhaften Artikel auflistet sinnvoll.
Wünschenswert wäre also ein Syntaxchecker, der die komplette Syntax prüft, z.B. auch defekte Tabellen, was bei geschachtelten leider häufig ist und je nach Browser evtl. gar nicht sofort auffällt.
Genial wäre natürlich ein "Live-Checker", der gleich das Abspeichern verhindert, wenn man die Syntax zerhauen hat. .oO("Du hast die Tabelle ruiniert, das speichere ich nicht!")
Bei der Gelegenheit könnte man auch gleich verhindern dass man Edits mit "'''Fetter Text'''" und "[[Bild:Beispiel.jpg]]" überhaupt abspeichern kann ;-)
-jha-
Man könnte ja auch einen Checker machen, der so ähnlich wie Revvars Rechtschreibkontrolle funktioniert, nur halt für die ganze Syntax.
Gruß
Liesel
Johann H. Addicks schrieb:
Beim aktuellen Dump waren bei 27 Aritkeln die Kategorien nicht korrekt mit Klammern versehen. Sicherlich sind es bei normalen Links in den Texten wesentlich mehr.
Da eine korrekte Syntax wünschenswert ist, wäre eine Webseite, die alle fehlerhaften Artikel auflistet sinnvoll.
Wünschenswert wäre also ein Syntaxchecker, der die komplette Syntax prüft, z.B. auch defekte Tabellen, was bei geschachtelten leider häufig ist und je nach Browser evtl. gar nicht sofort auffällt.
Genial wäre natürlich ein "Live-Checker", der gleich das Abspeichern verhindert, wenn man die Syntax zerhauen hat. .oO("Du hast die Tabelle ruiniert, das speichere ich nicht!")
Bei der Gelegenheit könnte man auch gleich verhindern dass man Edits mit "'''Fetter Text'''" und "[[Bild:Beispiel.jpg]]" überhaupt abspeichern kann ;-)
-jha-
Hi Wikipedianer,
Liesel schrieb am 10.08.2006 19:25:
Man könnte ja auch einen Checker machen, der so ähnlich wie Revvars Rechtschreibkontrolle funktioniert, nur halt für die ganze Syntax.
Apper. Nein, das funktioniert so nicht.
Appers Rechtschreibcheck macht nichts anderes als ein einfaches String-Matching. So etwas kannst du nicht mit einem Syntax-Parser ("wird alles wieder zugemacht, was aufgemacht wird") vergleichen.
Tschuess, Tim.
Hallo,
nein, Revvar war schon richtig. Das Typo-Tool arbeitet mit dem onlinewortschatz zusammen.
Mit freundlichen Grüssen DaB.
Hi,
Tim 'avatar' Bartel wikipedia@computerkultur.org schrieb am Thu, 10 Aug 2006 19:43:02 +0200:
Man könnte ja auch einen Checker machen, der so ähnlich wie Revvars Rechtschreibkontrolle funktioniert, nur halt für die ganze Syntax.
Apper. Nein, das funktioniert so nicht.
Wie von DaB. schon klar gestellt, ist Revvar richtig, er hat eine erweiterte, sehr gute Rechtschreibprüfung entwickelt. Im Endeffekt egal: beide arbeiten auf dem Artikeltext. Es ist aber auch möglich im Bearbeitungsmodus die Eingabe auf syntaktische Korrektheit zu prüfen - theoretisch zumindest. Der Syntax ist sehr komplex und eine komplette Prüfung wird schon daran scheitern, dass es keine eindeutige Grammatik dafür gibt. Einfache Prüfungen vorm Abspeichern sollten aber theoretisch möglich sein. Ich mach das nicht, ich wollt nur sagen, dass es möglich ist *g*
Weil wir grad bei Syntaxwartung sind. Bisher hatte ich nirgends Gelegenheit es zu erwähnen. Für Leute, die gerne aufräumen gibt es unter [[Benutzer:APPER/ISBN]] eine Liste falscher ISBN-Nummern. Jede ISBN enthält eine Prüfziffer, wodurch fehlerhafte erkannt werden können. Einige Fleißige haben sich die Arbeit schon gemacht und einige Hundert abgearbeitet, circa 1000 sind aber noch. Die Arbeit ist relativ zeitintensiv, da eine fehlende Ziffer oder verdrehte Zahlen recht schwer zu erkennen sind, sodass es häufig darauf hinausläuft, das Buch im Index der Deutschen Bibliothek nachzuschlagen um die korrekte ISBN zu finden. In vielen Fällen wurden aber auch einfach Leerzeichen in die ISBN gepackt, sodass die ISBN-Verlinkung nur nicht funktioniert. Also wenn jemand Lust hat ;). So genug Werbung ;).
Mit freundlichen Grüßen Christian Thiele / APPER
Hallo. Sehr gute idee. Ich fang mal an zu programmieren, allerdings weis ich nicht obs was wird. Leider kooperiert Wikipedia nicht mit der C-Programmiersprache, oder? Gruß, Frederic
Stefan Kühn wrote:
Sucher Programmierer für einfache Fehleranalyse!
Kann ein lieber Programmierer mal eine Live-Webseite programmieren (Toolserver) auf der angezeigt wird, welche Artikel eine ungleiche Anzahl von "[" und "]" haben.
[...]
Da eine korrekte Syntax wünschenswert ist, wäre eine Webseite, die alle fehlerhaften Artikel auflistet sinnvoll.
Wenn ich Dich nicht missverstehe, existiert sowas bereits: [[Benutzer:Vlado/Sauberes_Markup]] Regelmäßige Läufe mit diesem Tool(vielleicht alle drei Monate) und es dürfte auch nicht mehr so ein Haufen zusammenkommen wie letztes Jahr.
Ciao, Christian