<html><head><meta http-equiv="Content-Type" content="text/html charset=utf-8"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class=""><a href="https://phabricator.wikimedia.org/F4978348" class="">https://phabricator.wikimedia.org/F4978348</a> Done.<div class=""><br class=""><div class="">
<div style="color: rgb(0, 0, 0); letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class=""><div style="color: rgb(0, 0, 0); letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class=""><div style="color: rgb(0, 0, 0); letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">Cyberpower678<br class="">English Wikipedia Account Creation Team<br class="">ACC Mailing List Moderator</div><div style="color: rgb(0, 0, 0); letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">Global User Renamer</div></div></div>
</div>

<br class=""><div style=""><blockquote type="cite" class=""><div class="">On Dec 4, 2016, at 11:49, Merlijn van Deen (valhallasw) <<a href="mailto:valhallasw@arctus.nl" class="">valhallasw@arctus.nl</a>> wrote:</div><br class="Apple-interchange-newline"><div class=""><div dir="ltr" class="">Hi Maximilian,<div class=""><br class=""></div><div class=""><a href="https://phabricator.wikimedia.org/file/upload/" class="">https://phabricator.wikimedia.org/file/upload/</a> allows you to specify 'Visible to'. You can select 'Custom policy' and select the relevant users, i.e.<br class=""></div><div class=""><span id="cid:ii_158cabce8cde097a"><image.png></span><br class=""></div><div class=""><br class=""></div><div class="">In the meanwhile, I'll try to figure out if I can get some information from netstat.</div><div class=""><br class=""></div><div class="">Cheers,</div><div class="">Merlijn</div></div><div class="gmail_extra"><br class=""><div class="gmail_quote">On 4 December 2016 at 17:36, Maximilian Doerr <span dir="ltr" class=""><<a href="mailto:maximilian.doerr@gmail.com" target="_blank" class="">maximilian.doerr@gmail.com</a>></span> wrote:<br class=""><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div lang="EN-US" link="blue" vlink="purple" class=""><div class="m_-2916909184822639306WordSection1"><p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif" class="">Sure, how would I be able to restrict it’s visibility?  Harvard is kind enough to unblock, if the culprit is stopped.<u class=""></u><u class=""></u></span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif" class=""><u class=""></u> <u class=""></u></span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif" class="">As for exact URLs, it’s the entire domains owned by Harvard.  But the access log can provide specifics.  The Python script is attempting to get all 140,000 pieces of data about minor planets from <a href="http://www.minorplanetcenter.net/" target="_blank" class="">www.minorplanetcenter.net</a> according to IT, who also claims that such an action the way being done now would severely tie up their servers for quite a while, which they cannot afford.<u class=""></u><u class=""></u></span></p><span class=""><p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif" class=""><u class=""></u> <u class=""></u></span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif" class="">Cyberpower678<u class=""></u><u class=""></u></span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif" class="">English Wikipedia Account Creation Team<u class=""></u><u class=""></u></span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif" class="">Mailing List Moderator<u class=""></u><u class=""></u></span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif" class="">Global User Renamer<u class=""></u><u class=""></u></span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri",sans-serif" class=""><u class=""></u> <u class=""></u></span></p></span><p class="MsoNormal"><b class=""><span style="font-size:11.0pt;font-family:"Calibri",sans-serif" class="">From:</span></b><span style="font-size:11.0pt;font-family:"Calibri",sans-serif" class=""> Merlijn van Deen (valhallasw) [mailto:<a href="mailto:valhallasw@arctus.nl" target="_blank" class="">valhallasw@arctus.nl</a>] <br class=""><b class="">Sent:</b> Sunday, December 4, 2016 10:59<br class=""><b class="">To:</b> <a href="mailto:maximilian.doerr@gmail.com" target="_blank" class="">maximilian.doerr@gmail.com</a><br class=""><b class="">Subject:</b> Re: [Labs-l] Some using a Python framework is relentlessly hammering Harvard sites, resulting an IP range ban.<u class=""></u><u class=""></u></span></p><div class=""><div class="h5"><p class="MsoNormal"><u class=""></u> <u class=""></u></p><div class=""><div class=""><div class=""><p class="MsoNormal">Hi Maximilian,<u class=""></u><u class=""></u></p></div><div class=""><p class="MsoNormal"><u class=""></u> <u class=""></u></p></div><div class=""><p class="MsoNormal">On 4 December 2016 at 05:51, Maximilian Doerr <<a href="mailto:maximilian.doerr@gmail.com" target="_blank" class="">maximilian.doerr@gmail.com</a>> wrote:<u class=""></u><u class=""></u></p><blockquote style="border:none;border-left:solid #cccccc 1.0pt;padding:0in 0in 0in 6.0pt;margin-left:4.8pt;margin-right:0in" class=""><div class=""><div class=""><p class="MsoNormal">Would the user who is querying the Harvard sites for planet data, that is carrying the UA “weblinkchecker Pywikibot/3.0-dev (g7171) requests/2.2.1 Python/2.7.6.final.0”, please stop, or severely throttle the GET requests.  It’s making 168 requests to that site a minute, and consequently they banned labs from accessing it, according to the IT department there, who kindly shared with me the access log.<u class=""></u><u class=""></u></p><p class="MsoNormal"><u class=""></u> <u class=""></u></p></div></div></blockquote><div class=""><p class="MsoNormal"><u class=""></u> <u class=""></u></p></div><div class=""><p class="MsoNormal">Would you be able to share the access log with the Tools admins (say, via Phabricator, only shared to Yuvi, Bryan Davis, Andrew Bogott, Chase, scfc and me)? From the combination of external IP and timestamp we may be able to pinpoint which tool was causing this.<u class=""></u><u class=""></u></p></div><div class=""><p class="MsoNormal"><u class=""></u> <u class=""></u></p></div><div class=""><p class="MsoNormal">Can you also clarify which exact URLs we are talking about?<u class=""></u><u class=""></u></p></div><div class=""><p class="MsoNormal"><u class=""></u> <u class=""></u></p></div><div class=""><p class="MsoNormal">Cheers,<u class=""></u><u class=""></u></p></div><div class=""><p class="MsoNormal">Merlijn<u class=""></u><u class=""></u></p></div></div></div></div></div></div></div></div></blockquote></div><br class=""></div>
</div></blockquote></div><br class=""></div></body></html>