Does AWB not do something along those lines?<br><br><div class="gmail_quote">2009/7/25 Danny B. <span dir="ltr">&lt;<a href="mailto:Wikipedia.Danny.B@email.cz">Wikipedia.Danny.B@email.cz</a>&gt;</span><br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Hello,<br>
<br>
I&#39;m looking for any kind of tool which would take the XML dump (most probably the pages-meta-current.xml.bz2, at least the pages-articles.xml.bz2) and would return the list of page titles (or alternatively/configurably page ids) of pages containing given string.<br>

<br>
Does anybody have such (kind of) tool and is willing to share? Both command line or webpage interface are OK.<br>
<br>
Thank you.<br>
<br>
<br>
Danny B.<br>
<br>
_______________________________________________<br>
Toolserver-l mailing list<br>
<a href="mailto:Toolserver-l@lists.wikimedia.org">Toolserver-l@lists.wikimedia.org</a><br>
<a href="https://lists.wikimedia.org/mailman/listinfo/toolserver-l" target="_blank">https://lists.wikimedia.org/mailman/listinfo/toolserver-l</a><br>
</blockquote></div><br><br clear="all"><br>-- <br>Regards,<br><br>Simon Walker<br>User:Stwalkerster on all public Wikimedia Foundation wikis<br>Administrator on the English Wikipedia<br>Developer of Helpmebot, the ACC tool, and Nubio 2 FAQ repository<br>