<div dir="ltr">On Tue, Oct 7, 2014 at 4:43 AM, Krinkle <span dir="ltr"><<a href="mailto:krinklemail@gmail.com" target="_blank">krinklemail@gmail.com</a>></span> wrote:<br><div class="gmail_extra"><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">Also, thanks to Yuvi, there's alerts set up via production Icinga:<div style="word-wrap:break-word">...<div><br></div><div><a href="https://icinga.wikimedia.org/cgi-bin/icinga/status.cgi?host=labmon1001&nostatusheader" target="_blank">https://icinga.wikimedia.org/cgi-bin/icinga/status.cgi?host=labmon1001&nostatusheader</a></div><span class=""></span></div></blockquote></div><br></div><div class="gmail_extra">This appears to have beta labs monitors such as "BetaLabs: Low disk space", "Puppet failure events", etc.  Is there an Icinga check "Expect visiting <a href="http://en.wikipedia.beta.wmflabs.org/">http://en.wikipedia.beta.wmflabs.org/</a> to give me an error-free wiki page, not a 503 error or a site down"?<br>If there is, is there a way to graph the status of this over time?<br><br></div><div class="gmail_extra">The pain point I would like eased is: When I review failing browser tests I can quickly establish "Duh, beta labs was 503 or overloaded at the time of the test", before I spend time investigating the particular browser failure.<br><br></div><div class="gmail_extra">There's more to this than monitoring:<br></div><div class="gmail_extra">* Can't easily see status of other tests that ran at the same time.<br></div><div class="gmail_extra">* Jenkins /ci/job/browsertests-Foo/* pages don't consistently show the ISO9601 UTC time of a test<br></div><div class="gmail_extra"><br></div><div class="gmail_extra">Whining is cheap, implementing is harder :-)  I really appreciate jenkins/ci and beta labs. <3 and thanks, <br></div><div class="gmail_extra"><br>--<br><div dir="ltr">=S Page  Features engineer<br></div>
</div></div>