Ich möchte noch einmal darum bitte, diese "<!-- sic! -->" nicht mitten in ein Wort zu setzen. Wenn man beispielsweise schreibt:
"Schlo<!-- sic! -->ß"
dann findet die WP-interne den betreffenden Artikel nicht mehr, wenn man nach "Schloß" sucht :-(
Die Rechtschreibungsfanatiker mögen sich bitte ein wenig bremsen. Tolerabel ist folgende Schreibweise:
"Schloß <!-- sic! -->"
Man kann der Software auch beibringen alle Wörter zu überspringen, hinter denen " <!-- sic! -->" folgt.
* Karl Eichwalder ke@gnu.franken.de [2003-12-18 00:17]:
Ich möchte noch einmal darum bitte, diese "<!-- sic! -->" nicht mitten in ein Wort zu setzen. Wenn man beispielsweise schreibt:
"Schlo<!-- sic! -->ß"
dann findet die WP-interne den betreffenden Artikel nicht mehr, wenn man nach "Schloß" sucht :-(
Genau das ist eigentlich der Zweck des sic!-Tags. Die getaggten Wörter sollen nicht mehr von Abfragen wie unter [1] erfasst werden.
[1] http://de.wikipedia.org/wiki/Wikipedia:Artikel_mit_Rechtschreibfehlern
Gruß, Matthäus Wander.
Matthäus Wander theo@swznet.de writes:
Genau das ist eigentlich der Zweck des sic!-Tags. Die getaggten Wörter sollen nicht mehr von Abfragen wie unter [1] erfasst werden.
[1] http://de.wikipedia.org/wiki/Wikipedia:Artikel_mit_Rechtschreibfehlern
Das ist mir schon klar und das ist genau das Problem.
Ja, und was ist mit den Lesern, die nach eben diesem Begriff suchen (die WP hat eine Suchfunktion!)? Es kann doch wohl nicht angehen, daß wir die Rechtschreibfehlersucher besser unterstützen als die Leser...
Ich möchte noch einmal darum bitte, diese "<!-- sic! -->" nicht mitten in ein Wort zu setzen. Wenn man beispielsweise schreibt:
"Schlo<!-- sic! -->ß"
dann findet die WP-interne den betreffenden Artikel nicht mehr, wenn man nach "Schloß" sucht :-(
Die Rechtschreibungsfanatiker mögen sich bitte ein wenig bremsen. Tolerabel ist folgende Schreibweise:
"Schloß <!-- sic! -->"
Man kann der Software auch beibringen alle Wörter zu überspringen, hinter denen " <!-- sic! -->" folgt.
Da ich, so glaube ich, der Hauptübeltäter bin, möchte ich kurz erklären warum ich es so mache. Wenn man die [[Wikipedia:Liste_von_Tippfehlern]] abarbeitet, kommt man immer wieder auf die Artikel, die ein Zitat oder ein Buchtitel haben, das/der nach neuer deutscher Rechtschreibung falsch ist. 10 Mal mache ich das ja mit, aber beim 11 Mal möchte ich mir das ersparen. Deshalb fand ich die Idee mit dem [[sic!]] als Kommentar <!--sic!--> sehr gut. Aus der Liste verschwanden die lästigen Plagegeister. Das erleichterte mir die Arbeit und ich hoffe durch die ständigen Korrekturen die Qualität der Artikel zu steigern.
Ich bin auch nicht hundertprozentig glücklich, aber besser wäre es nur mit einem Tag für Zitate und Buchtitel. <Zitat> Das Schloß </Zitat> sieht auch besser aus als Schlo<!--sic!-->ß, aber da dies bis zum jetzigen Zeitpunkt trotz mehrfacher Vorschläge nicht umgesetzt wurde, muss man sich halt anders behelfen.
Überall, wo es nicht falsch ist, statt Schloß Schloss zu schreiben, dort ändere ich das einfach!
Verbesserungsvorschlägen gegenüber bin ich aufgeschlossen! ;-) Vorausgesetzt die Arbeit wird vereinfacht.
Stefan Kühn
Stefan Kühn kuehns@uni-trier.de writes:
fand ich die Idee mit dem [[sic!]] als Kommentar <!--sic!--> sehr gut.
Ja, meinetwegen, aber man findet das jeweilige Wort dann mit der internen Suche nicht mehr! Weder als "Schloß" noch als "Schloss" - aus diesem Grund dürfen die "Marker" nicht mitten ins Wort eingebaut werden.
Das "sic" muß nachgestellt werden und die eingesetzte Rechtschreibroutine muß lernen, daß Wörter mit nachgestelltem "sic" zu ignorieren sind. Einfach ein Script vorschalten oder so etwas ähnliches ;)
fand ich die Idee mit dem [[sic!]] als Kommentar
<!--sic!--> sehr gut.
Ja, meinetwegen, aber man findet das jeweilige Wort dann mit der internen Suche nicht mehr! Weder als "Schloß" noch als "Schloss" - aus diesem Grund dürfen die "Marker" nicht mitten ins Wort eingebaut werden.
Das "sic" muß nachgestellt werden und die eingesetzte Rechtschreibroutine muß lernen, daß Wörter mit nachgestelltem "sic" zu ignorieren sind. Einfach ein Script vorschalten oder so etwas ähnliches ;)
Wenn das Script dementsprechend angepasst wird und die Wartungseite wieder freigeschaltet wird, würde ich mich sofort an die neue sic! Schreibweise halten. Bis dahin werde ich aber noch weiter mit der Worttennenden sic! Schreibweise arbeiten. Sorry, aber das ist für den Fall erst mal die beste Lösung!
Und mal ehrlich, wer sucht nach "daß" oder "muß" in einem Zitat oder Buchtitel? Da kann ich noch tausendmal schreiben da<!--sic!-->ß bzw. mu<!--sic!-->ß! Und auch "Schloß" oder "Prozeß" kann ich verschmerzen. Den die Meisten wissen, dass z.B. das Buch "Der Prozeß" von Kafka ist und schauen dort nach.
Stefan
Stefan-
Und mal ehrlich, wer sucht nach "daß" oder "muß" in einem Zitat oder Buchtitel? Da kann ich noch tausendmal schreiben da<!--sic!-->ß bzw. mu<!--sic!-->ß! Und auch "Schloß" oder "Prozeß" kann ich verschmerzen. Den die Meisten wissen, dass z.B. das Buch "Der Prozeß" von Kafka ist und schauen dort nach.
Ich muss mich hier Karl anschließen. Bitte nicht die Suchfunktion beeinträchtigen, um Editierhilfen zu ermöglichen. Warum jemand danach sucht, kann uns letztlich egal sein. Solche Fälle wird es immer geben, und es ist grundsätzlich sehr schlecht, wenn sich Software in einer Weise verhält, die den Erwartungen des Nutzers nicht entspricht.
Für diese Art von internen Suchen ist es eigentlich ganz nützlich, sich einen Datenbank-Dump zu ziehen. Da kann man dann filtern wie man froh und lustig ist. Schwer ist das nicht -- ein bisschen Perl- und Regex- Kenntnisse genügen. Da bastelt man sich dann ein Skript, das irgendwelche Marker erkennt, oder ganz selbständig lernt, welche Rechtschreibung es zu ignorieren hat (zwei Zeilen Kontext sollten als eindeutige Identifikation genügen, in ein File speichern und vor dem Parsen in ein Array lesen). Einmal in Monat einen Dump ziehen, Skript laufen lassen (mit LWP kann man einen Browser simulieren und die Inhalte automatisch live verändern) und das war's.
Ein guter Tip für Perl-Anfänger ist dieses Uni-Skript: http://pstdbf.tfh-berlin.de/~welker/Vorlesungen/Perl/index.htm
Wer Zeit hat, <!-- sic! -->s in Artikel zu setzen, hat auch Zeit, das zu lernen. In jedem Mann[*] steckt ein bisschen Programmierfähigkeit. Und das Wissen ist immer nützlich.
MfG EMÖ
[*] Dafür können die Frauen besser ko.. OK, ich höre jetzt lieber auf ;-)
Kein Problem der Programmierfähigkeit!
Ich habe da an einen Bot gedacht, aber auf meine Frage hin, wie man so einen steuert, bzw. überhaupt programmiert, war schweigen im Wald!
Lokal wollte ich mir die Wikipedia jetzt nicht unbedingt installieren. (Oder führt da kein weg dran vorbei?)
Stefan
Stefan-
Ich habe da an einen Bot gedacht, aber auf meine Frage hin, wie man so einen steuert, bzw. überhaupt programmiert, war schweigen im Wald!
Frag beim nächsten Mal einfach mich ;-).
Für Perl gibt es da eine sehr nette Bibliothek namens LWP. Ein englisches Tutorial findest Du hier: http://search.cpan.org/dist/libwww-perl/lwptut.pod
Es gibt auch einen deutschen c't-Artikel dazu, komplett im Netz: http://www.heise.de/ct/03/15/158/default.shtml
Mit LWP kannst Du einen Web-Browser simulieren, inkl. Cookies, Client- String und allem. Eignet sich hervorragend für Skripte aller Art. Beim Posten von Formulardaten musst Du die Feldnamen aus dem Quellcode der jeweiligen Seiten raussuchen und dann gemäß Tutorial mit $browser->post($url,[daten]) abschicken.
Lokal wollte ich mir die Wikipedia jetzt nicht unbedingt installieren. (Oder führt da kein weg dran vorbei?)
Nö, brauchst Du nicht und ist zumindest unter Windows auch ordentlich Arbeit. Erik Zachtes Wikistats-Seite ist z.B. komplett ohne realisiert, er parst einfach die SQL-Daten im Rohformat. Klingt komplizierter als es ist -- jede Zeile in der Datenbank ist eine INSERT-Zeile im SQL-Dump. Da musst Du dann per Regex nach dem Feld cur_text suchen und kannst dann beliebige Suchoperationen im Quelltext jeder Seite vornehmen.
MfG EMÖ
On Thu, Dec 18, 2003 at 11:10:15AM +0100, Stefan Kühn wrote:
Kein Problem der Programmierfähigkeit!
Ich habe da an einen Bot gedacht, aber auf meine Frage hin, wie man so einen steuert, bzw. überhaupt programmiert, war schweigen im Wald!
Wenn wir uns auf Schloß<!--sic--> oder Schloß einigen können, dann werd ich das Zwobot beibringen.
Vielleicht finde ich aber auch die Zeit dir ein Script zu schreiben dass die Dumps immer schön vergleicht und gültige 'Schloß'e quasi abhakt. Mit GUI wenn über die Ferien gar kein Schnee bleibt ;-)
ciao, tom
On Thu, Dec 18, 2003 at 11:10:15AM +0100, Stefan Kühn wrote:
Kein Problem der Programmierfähigkeit!
Ich habe da an einen Bot gedacht, aber auf meine Frage hin,
wie man so
einen steuert, bzw. überhaupt programmiert, war schweigen im Wald!
Wenn wir uns auf Schloß<!--sic--> oder Schloß einigen können, dann werd ich das Zwobot beibringen.
Vielleicht finde ich aber auch die Zeit dir ein Script zu schreiben dass die Dumps immer schön vergleicht und gültige 'Schloß'e quasi abhakt. Mit GUI wenn über die Ferien gar kein Schnee bleibt ;-)
Auja fein! Klingt echt gut. Also das Script müsste, jedes Schloß, Schloßgarten und schloß etc. findet ohne dabei alle Schloß<!--sic!--> anzuzeigen! So könnte man dann die entsprechenden Korekturen durchführen und Buchtitel und Zitate mit <!--sic!--> kennzeichen. Damit würden alle Sucher ihr "Schloß" finden und alle Lektoren hätten eine tolle Arbeitserleichterung.
Das GUI wäre dann das I-Tüpfelchen! ;-)
Stefan
Am Do, den 18.12.2003 schrieb Stefan Kühn um 12:40:
On Thu, Dec 18, 2003 at 11:10:15AM +0100, Stefan Kühn wrote:
Kein Problem der Programmierfähigkeit!
Ich habe da an einen Bot gedacht, aber auf meine Frage hin,
wie man so
einen steuert, bzw. überhaupt programmiert, war schweigen im Wald!
Wenn wir uns auf Schloß<!--sic--> oder Schloß einigen können, dann werd ich das Zwobot beibringen.
Vielleicht finde ich aber auch die Zeit dir ein Script zu schreiben dass die Dumps immer schön vergleicht und gültige 'Schloß'e quasi abhakt. Mit GUI wenn über die Ferien gar kein Schnee bleibt ;-)
Auja fein! Klingt echt gut. Also das Script müsste, jedes Schloß, Schloßgarten und schloß etc. findet ohne dabei alle Schloß<!--sic!--> anzuzeigen! So könnte man dann die entsprechenden Korekturen durchführen und Buchtitel und Zitate mit <!--sic!--> kennzeichen. Damit würden alle Sucher ihr "Schloß" finden und alle Lektoren hätten eine tolle Arbeitserleichterung.
Zwobot ist uptodate und wird die <!-- sic! --> ans Ende des Wortes schieben. Es sind 353 Artikel, pro Minute wird einer erledigt. Deinen SQL-Query wirst du ein wenig ereitern müssen.
Mir ist aufgefallen das sehr of lange Zeilen existieren. Wer mir also das Lesen der Logfiles erleichtern will sollte öfter mal die Entertaste drücken.
ciao, tom
Am Do, den 18.12.2003 schrieb Thomas R. Koll um 16:00:
Deinen SQL-Query wirst du ein wenig ereitern müssen.
Da fällt mir erst auf wie mies dein Query ist. Alles innerhalb von [[ ]] sollte er ignorieren. Bei URLs das gleiche.
ciao, tom
erik_moeller@gmx.de (Erik Moeller) schrieb:
Solche Fälle wird es immer geben, und es ist grundsätzlich sehr schlecht, wenn sich Software in einer Weise verhält, die den Erwartungen des Nutzers nicht entspricht.
Danke für dieses Statement. Damit "fordere" ich:
Pluralformen jetzt! Pluralformen jetzt! Pluralformen jetzt!
Gruß, Flups
Florian-
erik_moeller@gmx.de (Erik Moeller) schrieb:
Solche Fälle wird es immer geben, und es ist grundsätzlich sehr schlecht, wenn sich Software in einer Weise verhält, die den Erwartungen des Nutzers nicht entspricht.
Danke für dieses Statement. Damit "fordere" ich:
Pluralformen jetzt! Pluralformen jetzt! Pluralformen jetzt!
Was meinst Du? Redirects sind doch völlig OK.
MfG EMÖ