Thomas Corell corell@corell.dyndns.org writes:
Naja und jetzt Volltext-Suchen wir (oder nicht) über ganze Texte und wundern uns warums langsam wird.
Man darf eben keine Volltext-Suche über die Felder bzw. das Textfeld machen! Es muß separat gespeichert werden, wo überall "Albrecht" und "Dürer" vorkommen und das wird über Indizes bzw. einen eigenen Index verwaltet. Bei Google geht das so auch ;) Notfalls legt dafür eine eigene Tabelle an. Den Index für die Volltextsuche kann man meinetwegen auch gern asynchron füttern - eben immer dann, wenn "Luft" ist; oder man nimmt dafür einen dezidierten Rechner. In der Wikipedia gibt es zwar einen Artikel zu "Architektur (EDV oder Software???)", aber der scheint noch nicht zielführend zu sein.
Es geht bestimmt mit MySQL. Man kann aber aus spezialisierte Datenbanken nehmen. "kleio" ist so ein, leider nicht richtig freies System: es ist speziell geeignet zur Aufnahme von Geschichtsquellen (von Daten bis zu Quelltexten und auch Multimediadaten); ich weiß leider nicht, ob das (noch) auf einem Server liegt.
id-zebra müßte man auch verwenden können...
Notfalls oder als Übergang muß ein Indexer eigenständig daneben gestellt werden (ht://dig oder etwas besseres); die permanente Fehlermeldung oder der Verweis auf Google ist jedenfalls keine Lösung.
Achja, und ausserdem ist es glaub ich allen bewusst das die Hardware der Wikipedia einfach nicht mehr kann. Es sind Aufrüstungen von Jimbo angedeutet worden, vielleicht bekommen wir dann wieder kurzzeitig Luft. Spenden für Hardware ...aber das wisst ihr ja.
a) ist mir nicht klar, wie man von Deutschland aus steuerbegünstigt spenden kann.
b) halte ich wenig von einem e-cash-System.
c) motiviert es nicht, wenn meine Hinweise auf SGML/XML mit Standardargumenten abgebügelt werden (nicht von dir!).
d) sollten vorhandenen Ressource für die wichtigen Dinge eingesetzt werden (Aufbereiten der Daten auf Seiten der Clients). So sollte z.B. keine Power dafür verwendet werden, solche nebensächlichen Info wie dies zu generieren (auch wenn das nicht viel "kostet"):
(577 Artikel werden beobachtet (ohne Diskussionsseiten); 381 Artikel insgesamt bearbeitet in eingestelltem Zeitraum; überprüfen der letzten Bearbeitungen für die Beobachtungsliste... komplette Liste zeigen und bearbeiten.)
Ein datenbank-gestütztes System ohne gescheite Suche ist jedenfalls etwas eigenartig ;)