Guten Tag,
bin schon seit mehreren Tagen am probieren die API richtig anzusprechen aber ich kann einfach nicht die richtige Kombination finden. Ich möchte lediglich den ersten Abschnitt des Wiki Artikels in Klartext extrahieren. Komme allerdings nur auf folgende Lösungen die eine Mischung aus Wiki-Zeugs und HTML ist:
"<p><b>Polen</b> (polnisch <i>Polska</i> [ˈpɔlska] <i>Anhören</i><sup>?/i</sup>, amtlich <i>Rzeczpospolita Polska</i>, [ʐɛʈ͡ʂpɔsˈpɔlita ˈpɔlska]<sup>?/i</sup>, deutsch <i>Republik Polen</i>) ist eine parlamentarische Republik in Mitteleuropa. [...]"
https://de.wikipedia.org/w/api.php?action=query&format=xml&prop=extr...
brauche aber lediglich:
"Polen (polnisch Polska [ˈpɔlska], amtlich Rzeczpospolita Polska, [ʐɛʈ͡ʂpɔsˈpɔlita ˈpɔlska], deutsch Republik Polen) ist eine parlamentarische Republik in Mitteleuropa. [...]"
Hab es versucht mit replaces und anderen Befehlen zu bereinigen aber so richtig professionell ist das ja auch nicht.
Gibts noch eine andere Möglichkeit?
Beste Grüße
Bahlox mediawiki-api@lists.wikimedia.org