<div dir="ltr">><span style="font-size:12.8000001907349px">Well, I think this is the problem right here. If something must have</span><br style="font-size:12.8000001907349px"><span style="font-size:12.8000001907349px">>"24/7 uptime", it should be in production, not labs.</span><div><span style="font-size:12.8000001907349px">Not really, that would be the case if it could not tolerate outages of any sort, 'ideally' we would like our tools to be 24/7. Now, can the tools tolerate a full-day outage? They sure can, the issue is that - as of the last quarter- we have had several outages not just </span></div><div><span style="font-size:12.8000001907349px">one. And some of them have lasted over a day and that is when things start to be problematic for our users. </span></div><div><span style="font-size:12.8000001907349px"><br></span></div><div><span style="font-size:12.8000001907349px">We get that there had been a bunch of events related to db, memory, virt machines that had to get fixed but to be clear we are not asking for production-type services (we also own several of those and they are deployed on our prod stack) we just would like to have a slightly better uptime in labs for our tools.</span></div><div><span style="font-size:12.8000001907349px"><br></span></div><div>Looks like a bunch of things related to firewalls, IP rules, db replication and several others have been fixed as of late, we can take it up from here and see how does the uptime do going forward.</div><div><br></div><div>Thanks, </div><div><br></div><div>Nuria</div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div><div><span style="font-size:12.8000001907349px"><br></span></div><div><span style="font-size:12.8000001907349px"><br></span></div><div><span style="font-size:12.8000001907349px"><br></span></div><div><span style="font-size:12.8000001907349px"><br></span></div><div><span style="font-size:12.8000001907349px"><br></span></div><div><span style="font-size:12.8000001907349px"><br></span></div><div><span style="font-size:12.8000001907349px"><br></span></div><div><span style="font-size:12.8000001907349px"><br></span></div></div><div class="gmail_extra"><br><div class="gmail_quote">On Wed, Feb 4, 2015 at 11:17 AM, Legoktm <span dir="ltr"><<a href="mailto:legoktm.wikipedia@gmail.com" target="_blank">legoktm.wikipedia@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><span class="">On 02/02/2015 07:04 PM, Dan Andreescu wrote:<br>
> Since a lot<br>
> of people depend on those tools having pretty much 24/7 uptime<br>
<br>
</span>Well, I think this is the problem right here. If something must have<br>
"24/7 uptime", it should be in production, not labs.<br>
<div class="HOEnZb"><div class="h5"><br>
-- Legoktm<br>
<br>
_______________________________________________<br>
Labs-l mailing list<br>
<a href="mailto:Labs-l@lists.wikimedia.org">Labs-l@lists.wikimedia.org</a><br>
<a href="https://lists.wikimedia.org/mailman/listinfo/labs-l" target="_blank">https://lists.wikimedia.org/mailman/listinfo/labs-l</a><br>
</div></div></blockquote></div><br></div>