<div dir="ltr"><br><div class="gmail_extra"><div class="gmail_quote">On Thu, May 22, 2014 at 4:03 PM, Emilio J. Rodríguez-Posada <span dir="ltr"><<a href="mailto:emijrp@gmail.com" target="_blank">emijrp@gmail.com</a>></span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div><div><div>Hello;<br><br></div>I'm processing Wikipedia dumps. For now, I'm copying some dumps into the tool path (/data/project/tool/dumps) to preserve them for my study, because only the last 2 dumps are in /public/dumps. And when I launch the jsub, the script read them from there.<br>



<br></div>But I have a question, is /public/dumps faster than /data/project ? I mean in <a href="http://r.pm" target="_blank">r.pm</a>. or any technical feature. Or all are the same?<br><br></div></div></blockquote><div>

<br></div><div>As far as I know they both come from the same system right now.<br><br>/mnt is the fastest you're going to get, but I'm almost positive you can't use that in the tools project<br> <br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">

<div dir="ltr"><div></div><div>By the way, when processing dumps, I have found that reading from a 7z dump is faster than from a bz2, so I think that the hard disks are playing here a important role, more than CPU.<br>

<br></div></div></blockquote><div><br></div><div>Yep, that's very likely.<br><br></div><div>- Ryan<br></div></div><br></div></div>