<div dir="ltr">Wonderful news, thank you Chris :)<div><br></div><div>Is <a href="https://bugzilla.wikimedia.org/show_bug.cgi?id=68465">https://bugzilla.wikimedia.org/show_bug.cgi?id=68465</a> related to the db issues that are now resolved, or is that a different issue?</div>
</div><div class="gmail_extra"><br><br><div class="gmail_quote">On Fri, Jul 25, 2014 at 9:29 AM, Chris McMahon <span dir="ltr"><<a href="mailto:cmcmahon@wikimedia.org" target="_blank">cmcmahon@wikimedia.org</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><br><div>This month we've made two big improvements that should greatly reduce the number of flaky test failures in all of the builds. </div>
<div><br></div><div>For one thing, the MobileFrontend test that used to walk through a dozen steps to protect a page in the UI and then logout, is now using the API to protect the test page, and not logging out prevents flaky failures when another test that expects to be logged-in unexpectedly gets logged out.  We have seen this before in VisualEditor tests in particular. </div>

<div><br></div><div>Another thing is that we should no longer see the beta labs db become read-only.  Some time ago we had requests from the Language team to be able to test in situations where there is replication lag between master and slave dbs.  At the same time, the Flow team wanted to be able to test deploying in a situation with master and slave dbs. So we created a slave db for beta labs.</div>

<div><br></div><div>What we only discovered recently is that there is a process that monitors the replication lag time between master and slave dbs, and when that time goes over 5 seconds, the db is set to read-only. This is fine in production, but it was causing a lot of problems in beta labs.  We have now set the value for replication lag to 5 minutes instead of 5 seconds, and this has stopped a number of kinds of faillures: </div>

<div><br></div><div>* the explicit "database is read-only" failure from the VisualEditor tests</div><div>* the generic "Save failed" failure message in MobileFrontend tests</div><div>* the unexplained 90-second timeouts in Flow tests</div>

<div><br></div><div>Sorry for the inconvenience, but things should be much improved from now on. </div><span class="HOEnZb"><font color="#888888"><div>-Chris</div></font></span></div>
<br>_______________________________________________<br>
QA mailing list<br>
<a href="mailto:QA@lists.wikimedia.org">QA@lists.wikimedia.org</a><br>
<a href="https://lists.wikimedia.org/mailman/listinfo/qa" target="_blank">https://lists.wikimedia.org/mailman/listinfo/qa</a><br>
<br></blockquote></div><br><br clear="all"><div><br></div>-- <br><div dir="ltr">Arthur Richards<div>Team Practices Manager</div><div>[[User:Awjrichards]]</div><div>IRC: awjr</div><div>+1-415-839-6885 x6687</div></div>
</div>