Guten Tag,
bin schon seit mehreren Tagen am probieren die API richtig anzusprechen aber ich kann
einfach nicht die richtige Kombination finden. Ich möchte lediglich den ersten Abschnitt
des Wiki Artikels in Klartext extrahieren. Komme allerdings nur auf folgende Lösungen die
eine Mischung aus Wiki-Zeugs und HTML ist:
"<p><b>Polen</b> (polnisch <i>Polska</i> [ˈpɔlska]
<i>Anhören</i><sup>?/i</sup>, amtlich <i>Rzeczpospolita
Polska</i>, [ʐɛʈ͡ʂpɔsˈpɔlita ˈpɔlska]<sup>?/i</sup>, deutsch
<i>Republik Polen</i>) ist eine parlamentarische Republik in Mitteleuropa.
[...]"
https://de.wikipedia.org/w/api.php?action=query&format=xml&prop=ext…
brauche aber lediglich:
"Polen (polnisch Polska [ˈpɔlska], amtlich Rzeczpospolita Polska, [ʐɛʈ͡ʂpɔsˈpɔlita
ˈpɔlska], deutsch Republik Polen) ist eine parlamentarische Republik in Mitteleuropa.
[...]"
Hab es versucht mit replaces und anderen Befehlen zu bereinigen aber so richtig
professionell ist das ja auch nicht.
Gibts noch eine andere Möglichkeit?
Beste Grüße
Bahlox
mediawiki-api(a)lists.wikimedia.org