<br><br><div class="gmail_quote">On Sat, Sep 10, 2011 at 16:23, Bala Jeyaraman <span dir="ltr">&lt;<a href="mailto:sodabottle@gmail.com">sodabottle@gmail.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">

<div class="im">&gt;&gt;A question - how hard is it to write a bot that runs contributions<br>
through Google and flags it based on the degree of match and whether a<br>
footnote exists or not?<br><br></div>One such bot existed called corensearchbot which used yahoo to flag copyvios. But yahoo changed its terms of service and it had be to stopped.<br></blockquote><div><br></div><div>Infact, we need not go all automatic way, the kind of copying here is very elementary. 1500+ chars without wiki syntax means something suspicious.None of us write paragraphs at one shot. I guess Huggle might already flag those(not sure). I just added watchlist to all course pages[1], so that ambassadors could monitor them and check manually. It will be great if some common template is applied on all talk pages where students edit so we could get one consolidated watchlist with some template. Will work over sometime during next week.</div>

<div><br></div><div>On the other hand, if the teachers could monitor individual watch-list for content getting added as and when it will be good. Instead of doing one review at end, spotting diffs would mean lesser rework for students,shorter the duration junk stays(Some of the topics chosen by the program have very few watchers). But it cant be done by ambassadors without subject knowledge. I definitely cant review Artificial Intelligence topics :D</div>

</div><div><br></div><div>[1] <a href="http://en.wikipedia.org/wiki/Wikipedia:India_Education_Program/Courses">http://en.wikipedia.org/wiki/Wikipedia:India_Education_Program/Courses</a></div><div><br></div>-- <br>Regards<br>

Srikanth.L<br><a href="http://srik.me" target="_blank">http://srik.me</a><br>