Hej liste
Jeg har løbende lidt problemer med dump-filer fra Wikipedia. Seneste sidder jeg og bokser med "dawiki-20110112-pagelinks.sql", som ingen af mine tekst-editorer vil acceptere. Jeg ved det burde være UTF-8, men de siger, at de indeholder ulovlige karakterer. Ligeledes kan jeg heller ikke få lov til at indlæse dem i mine mysql-databaser, som dels brokker sig over format og dels over dubletter.
Er der noget, som jeg misser?
Mvh. Rune
Hej Rune,
dette er ikke rette sted for den slags spørgsmål. Jeg foreslår, at du ser på
http://meta.wikimedia.org/wiki/Dumps#Where_to_go_for_help
(og iøvrigt læser den side - der kan være noget, som falder dig i øjnene)
Mvt Thyge
2011/1/17 Rune Stilling subs@rdfined.dk
Hej liste
Jeg har løbende lidt problemer med dump-filer fra Wikipedia. Seneste sidder jeg og bokser med "dawiki-20110112-pagelinks.sql", som ingen af mine tekst-editorer vil acceptere. Jeg ved det burde være UTF-8, men de siger, at de indeholder ulovlige karakterer. Ligeledes kan jeg heller ikke få lov til at indlæse dem i mine mysql-databaser, som dels brokker sig over format og dels over dubletter.
Er der noget, som jeg misser?
Mvh. Rune _______________________________________________ WikimediaDK mailing list WikimediaDK@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikimediadk
Hej Rune,
On Mon, 17 Jan 2011, Rune Stilling wrote:
Jeg har løbende lidt problemer med dump-filer fra Wikipedia. Seneste sidder jeg og bokser med "dawiki-20110112-pagelinks.sql", som ingen af mine tekst-editorer vil acceptere. Jeg ved det burde være UTF-8, men de siger, at de indeholder ulovlige karakterer. Ligeledes kan jeg heller ikke få lov til at indlæse dem i mine mysql-databaser, som dels brokker sig over format og dels over dubletter.
Er der noget, som jeg misser?
Jeg har tilsyneladende ikke noget problem med at se "dawiki-20110112-pagelinks.sql.gz" filen med 'less' på en Ubuntu Linux. Er du sikker på du har ungzippet den (hvis jeg må spørge)? Min less sørger selv for udpakningen. I MySQL dumpet står der "SET character_set_client = utf8;" så det må være utf8.
mvh Finn
wikimediadk@lists.wikimedia.org