Hi,<br><br>when I download a page in HTML, which contains titles of articles, these titles are something like urlencode()-ed, but not quite; characters like &quot;(&quot;, &quot;)&quot;, &quot;!&quot;, &quot;,&quot;, &quot;:&quot; appear without encoding.<br>
<br>For example:<br>&lt;li&gt;&lt;a href=&quot;/w/index.php?title=Avant_l%27aurore_<font style="color: rgb(204, 0, 0);" size="4"><b>(</b></font>court-m%C3%A9trage<font size="4"><b style="color: rgb(204, 0, 0);">)</b></font>&amp;amp;action=edit&amp;amp;redlink=1&quot; class=&quot;new&quot; title=&quot;Avant l&#39;aurore (court-métrage) (page does not exist)&quot;&gt;Avant l&#39;aurore (court-métrage)&lt;/a&gt;&lt;/li&gt;<br>
<br>Is there a function in pywiki to handle this, or is there available a full list of non-encoded characters? I used urlencode() + a dict of known exceptions, but this is not the best solution.<br clear="all"><br>-- <br>
Bináris<br>