<br><div class="gmail_quote">Hi Felipe,<br>Thanks for the response and the suggestion. In fact, I have used a modified version of the python import script (the modifications fix the empty contributor bug) but all the rev len are empty. It seems the script did not calculate this field. <br>

If the number is just the rev length, I can get it by running an SQL query. <br><br>I still have another major problem with the categories. I am not sure why I am not able to get that althought I did a full xml import and imported also frwiki-latest-categorylinks.sql.gz?<br>

Any suggestion on this end please?<br><font color="#888888"><br>bilal</font><div><div></div><div class="h5"><br><br><br><div class="gmail_quote">On Wed, Sep 30, 2009 at 4:08 PM, Felipe Ortega <span dir="ltr">&lt;<a href="mailto:glimmer_phoenix@yahoo.es" target="_blank">glimmer_phoenix@yahoo.es</a>&gt;</span> wrote:<br>

<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">--- El mar, 29/9/09, Bilal Abdul Kader &lt;<a href="mailto:bilalak@gmail.com" target="_blank">bilalak@gmail.com</a>&gt; escribió:<br>


<br>
&gt; De: Bilal Abdul Kader &lt;<a href="mailto:bilalak@gmail.com" target="_blank">bilalak@gmail.com</a>&gt;<br>
&gt; Asunto: [Xmldatadumps-admin-l] Errors in importing frWiki XML<br>
&gt; Para: <a href="mailto:xmldatadumps-admin-l@lists.wikimedia.org" target="_blank">xmldatadumps-admin-l@lists.wikimedia.org</a><br>
&gt; Fecha: martes, 29 septiembre, 2009 11:53<br>
<div>&gt; Greetings,<br>
&gt; I imported the french wiki. I was able to get it all with<br>
&gt; full history but the number of bytes between versions is<br>
&gt; empty. It seems it was not imported for a weird reason.<br>
&gt;<br>
<br>
</div>Dear Bilal,<br>
<br>
I&#39;m not sure which field in the revision table are you referring to. If it is &#39;rev_len&#39;, it stores the length of the revision, in bytes, not the diff between the revision of a page and the previous one:<br>
<br>
<a href="http://www.mediawiki.org/wiki/Manual:Revision_table" target="_blank">http://www.mediawiki.org/wiki/Manual:Revision_table</a><br>
<br>
Likewise, AFAIK that number is not provided in the full dump. For instance, WikiXRay Python parser have to compute it from the text content of each revision to fill in the value in the rev_len field for that row.<br>
<br>
If you also have rev_parent_id field (for instance, the WikiXRay Python parser also computes this), it shouldn&#39;t be difficult to compute the diff between any given pair of revisions.<br>
<br>
Regards,<br>
F --<br>
<div><br>
&gt; Is there any script to do that in the maintenance folder?<br>
&gt; Is the diff algorithm a simple characters count or there is<br>
&gt; more behind the generation of this number.<br>
&gt;<br>
&gt;<br>
&gt; The categories are not imported on the main page of the<br>
&gt; wiki. How to solve that?<br>
&gt;<br>
&gt; bilal<br>
&gt;<br>
&gt;<br>
&gt; --<br>
&gt; Verily, with hardship comes ease.<br>
&gt;<br></div></blockquote></div></div></div></div><br>-- <br>Verily, with hardship comes ease.<br>