Pywikipedia-svn August 2009

pywikipedia-svn@lists.wikimedia.org

11 participants
93 discussions

SVN: [7124] trunk/pywikipedia/login.py
by alexsh＠svn.wikimedia.org 07 Aug '09

07 Aug '09

Revision: 7124 Author: alexsh Date: 2009-08-07 07:51:37 +0000 (Fri, 07 Aug 2009) Log Message: ----------- login.py: *LoginManager.logout():sometimes put edit could came back badtoken because two or more duplicate login session used in pybot and other browsers, this function could abandon server login session, and delete local cookie data. *LoginManager.getCookie(): change API to pure query..(it will handle other login error codes) *cleanup no necessary syntaxes. Modified Paths: -------------- trunk/pywikipedia/login.py Modified: trunk/pywikipedia/login.py =================================================================== --- trunk/pywikipedia/login.py 2009-08-06 21:57:43 UTC (rev 7123) +++ trunk/pywikipedia/login.py 2009-08-07 07:51:37 UTC (rev 7124) @@ -50,7 +50,7 @@ # __version__='$Id$' -import re +import re, os, query import urllib2 import wikipedia, config @@ -122,7 +122,7 @@ if api: predata = { 'action': 'login', - 'lgname': self.username.encode(self.site.encoding()), + 'lgname': self.username, 'lgpassword': self.password, 'lgdomain': self.site.family.ldapDomain, } @@ -163,14 +163,17 @@ wikipedia.cj.save(wikipedia.COOKIEFILE) return "Ok" else: - response, data = self.site.postData(address, self.site.urlEncode(predata)) - if self.verbose: - fakepredata = predata - fakepredata['wpPassword'] = fakepredata['lgpassword'] = u'XXXXX' - wikipedia.output(u"self.site.postData(%s, %s)" % (address, self.site.urlEncode(fakepredata))) - fakeresponsemsg = re.sub(r"(session|Token)=..........", r"session=XXXXXXXXXX", response.msg.__str__()) - wikipedia.output(u"%s/%s\n%s" % (response.status, response.reason, fakeresponsemsg)) - wikipedia.output(u"%s" % data) + if api: + response, data = query.GetData(predata, self.site, back_response = True) + else: + response, data = self.site.postData(address, self.site.urlEncode(predata)) + if self.verbose: + fakepredata = predata + fakepredata['wpPassword'] = fakepredata['lgpassword'] = u'XXXXX' + wikipedia.output(u"self.site.postData(%s, %s)" % (address, self.site.urlEncode(fakepredata))) + fakeresponsemsg = re.sub(r"(session|Token)=..........", r"session=XXXXXXXXXX", response.msg.__str__()) + wikipedia.output(u"%s/%s\n%s" % (response.status, response.reason, fakeresponsemsg)) + wikipedia.output(u"%s" % data) Reat=re.compile(': (.*?);') L = [] @@ -246,11 +249,11 @@ wikipedia.output(u"Logging in to %s as %s" % (self.site, self.username)) try: - cookiedata = self.getCookie(api = api) + cookiedata = self.getCookie(api) except NotImplementedError: wikipedia.output('API disabled because this site does not support.') - config.use_api_login = api = False - cookiedata = self.getCookie(api = api) + api = False + cookiedata = self.getCookie(api) if cookiedata: self.storecookiedata(cookiedata) wikipedia.output(u"Should be logged in now") @@ -262,17 +265,40 @@ wikipedia.output(u"Login failed. Wrong password or CAPTCHA answer?") if api: wikipedia.output(u"API login failed, retrying using standard webpage.") - return self.login(api = False, retry = retry) + return self.login(False, retry) if retry: self.password = None return self.login(api = api, retry = True) else: return False + + def logout(self, api = config.use_api): + flushCk = False + if api and self.site.versionnumber() >= 12: + if query.GetData({'action':'logout'}, self.site) == []: + flushCk = True + else: + logout_address = self.site.get_address("Special:Version") + text = self.site.getUrl(logout_address) + if wikipedia.mediawiki_message('logouttext') in text: #confirm loggedout + flushCk = True + + if flushCk: + filename = wikipedia.config.datafilepath('login-data', + '%s-%s-%s-login.data' + % (self.site.family.name, self.site.lang, self.username)) + try: + os.remove(filename) + except: + pass + return True + + return False def showCaptchaWindow(self, url): pass - + def main(): username = password = None sysop = False @@ -304,11 +330,12 @@ namedict = config.sysopnames else: namedict = config.usernames + for familyName in namedict.iterkeys(): for lang in namedict[familyName].iterkeys(): try: - site = wikipedia.getSite( code=lang, fam=familyName ) - if not forceLogin and site.loggedInAs(sysop = sysop) is not None: + site = wikipedia.getSite(lang, familyName) + if not forceLogin and site.loggedInAs(sysop = sysop): wikipedia.output(u'Already logged in on %s' % site) else: loginMan = LoginManager(password, sysop = sysop, site = site, verbose=verbose)

1 0

SVN: [7123] trunk/pywikipedia/wikipedia.py
by alexsh＠svn.wikimedia.org 06 Aug '09

06 Aug '09

Revision: 7123 Author: alexsh Date: 2009-08-06 21:57:43 +0000 (Thu, 06 Aug 2009) Log Message: ----------- *Site().mediawiki_message(): make temporary remedial when API query messages got KeyError (turn off API, back to ordinary) *let all query.GetData() use current available Site() in all functions, not create again in query.py Modified Paths: -------------- trunk/pywikipedia/wikipedia.py Modified: trunk/pywikipedia/wikipedia.py =================================================================== --- trunk/pywikipedia/wikipedia.py 2009-08-06 21:56:05 UTC (rev 7122) +++ trunk/pywikipedia/wikipedia.py 2009-08-06 21:57:43 UTC (rev 7123) @@ -919,7 +919,7 @@ 'prop' :'info', 'titles' :self.title(), } - data = query.GetData(params, encodeTitle = False) + data = query.GetData(params, self.site(), encodeTitle = False) pageid = data['query']['pages'].keys()[0] if data['query']['pages'][pageid].keys()[0] == 'lastrevid': return data['query']['pages'][pageid]['lastrevid'] # if ok, @@ -951,7 +951,7 @@ 'tllimit' :tllimit, } - data = query.GetData(params, encodeTitle = False) + data = query.GetData(params, self.site(), encodeTitle = False) try: pageid = data['query']['pages'].keys()[0] except KeyError: @@ -1325,7 +1325,7 @@ #if titles: # predata['titles'] = query.ListToParam(titles) - text = query.GetData(predata)['query']['pages'] + text = query.GetData(predata, self.site())['query']['pages'] for pageid in text: if text[pageid].has_key('missing'): @@ -2784,7 +2784,7 @@ 'titles' :self.title(), } try: - data = query.GetData(params, encodeTitle = False)['query']['pages'] + data = query.GetData(params, self,site(), encodeTitle = False)['query']['pages'] except KeyError: raise NoPage(u'API Error, nothing found in the APIs') @@ -2848,7 +2848,7 @@ 'titles' :self.title(), 'iiprop' :'url', } - imagedata = query.GetData(params, encodeTitle = False) + imagedata = query.GetData(params, self.site(), encodeTitle = False) try: url=imagedata['query']['pages'].values()[0]['imageinfo'][0]['url'] # urlR = re.compile(r'<div class="fullImageLink" id="file">.*?<a href="(?P<url>[^ ]+?)"(?! class="image")|<span class="dangerousLink"><a href="(?P<url2>.+?)"', re.DOTALL) @@ -2918,7 +2918,7 @@ 'prop' :'imageinfo', 'titles' :self.title(), } - data = query.GetData(params, encodeTitle = False) + data = query.GetData(params, self.site(), encodeTitle = False) try: # We don't know the page's id, if any other better idea please change it pageid = data['query']['pages'].keys()[0] @@ -2940,7 +2940,7 @@ 'iiprop' :'sha1', } # First of all we need the Hash that identify an image - data = query.GetData(params, encodeTitle = False) + data = query.GetData(params, self.site(), encodeTitle = False) pageid = data['query']['pages'].keys()[0] try: hash_found = data['query']['pages'][pageid][u'imageinfo'][0][u'sha1'] @@ -5103,6 +5103,7 @@ """Return the MediaWiki message text for key "key" """ # Allmessages is retrieved once for all per created Site object if not self._mediawiki_messages: + api = False if verbose: output( u"Retrieving mediawiki messages from Special:Allmessages") @@ -5110,6 +5111,8 @@ if self.versionnumber() < 12: usePHP = True else: + if config.use_api: + api = True usePHP = False elementtree = True try: @@ -5133,20 +5136,22 @@ retry_idle_time = 1 while True: - if config.use_api and self.versionnumber() >= 12: + if api and self.versionnumber() >= 12: params = { 'action':'query', 'meta':'allmessages', } try: - datas = query.GetData(params)['query']['allmessages'] + datas = query.GetData(params, self)['query']['allmessages'] + self._mediawiki_messages = _dict([(tag['name'].lower(), tag['*']) + for tag in datas]) except KeyError: - raise ServerError("The APIs don't return data, the site may be down") + output('API get messages had some error, retrying by ordinary.') + api = False + continue except NotImplementedError: - config.use_api = False + api = False continue - self._mediawiki_messages = _dict([(tag['name'].lower(), tag['*']) - for tag in datas]) elif usePHP: phppage = self.getUrl(self.get_address("Special:Allmessages") + "&ot=php") @@ -5522,7 +5527,7 @@ if leuser is not None: params['leuser'] = leuser if letitle is not None: params['letitle'] = letitle while True: - data = query.GetData(params, encodeTitle = False) + data = query.GetData(params, self, encodeTitle = False) try: imagesData = data['query']['logevents'] except KeyError: @@ -5590,7 +5595,7 @@ if rcshow is not None: params['rcshow'] = rcshow if rctype is not None: params['rctype'] = rctype while True: - data = query.GetData(params, encodeTitle = False) + data = query.GetData(params, self, encodeTitle = False) try: rcData = data['query']['recentchanges'] except KeyError: @@ -5726,7 +5731,7 @@ 'rnlimit': '1', #'': '', } - data = query.GetData(params) + data = query.GetData(params, self) return Page(self, data['query']['random'][0]['title']) else: """Yield random page via Special:Random""" @@ -5744,7 +5749,7 @@ 'rnlimit': '1', 'rnredirect': '1', } - data = query.GetData(params) + data = query.GetData(params, self) return Page(self, data['query']['random'][0]['title']) else: """Yield random redirect page via Special:RandomRedirect.""" @@ -5798,7 +5803,7 @@ params['apfrom'] = start if throttle: get_throttle() - data = query.GetData(params) + data = query.GetData(params, self) for p in data['query']['allpages']: yield Page(self, p['title']) @@ -5990,7 +5995,7 @@ 'euquery': url, } while True: - data = query.GetData(params) + data = query.GetData(params, self) if data['query']['exturlusage'] == []: break for pages in data['query']['exturlusage']: @@ -6606,7 +6611,7 @@ 'list' :'allimages', 'aisha1' :hash_found, } - allimages = query.GetData(params, getSite(self.lang, self.family), encodeTitle = False)['query']['allimages'] + allimages = query.GetData(params, self, encodeTitle = False)['query']['allimages'] files = list() for imagedata in allimages: image = imagedata[u'name']

1 0

SVN: [7122] trunk/pywikipedia/commonsdelinker/image_replacer.py
by btongminh＠svn.wikimedia.org 06 Aug '09

06 Aug '09

Revision: 7122 Author: btongminh Date: 2009-08-06 21:56:05 +0000 (Thu, 06 Aug 2009) Log Message: ----------- Fix freaky typo Modified Paths: -------------- trunk/pywikipedia/commonsdelinker/image_replacer.py Modified: trunk/pywikipedia/commonsdelinker/image_replacer.py =================================================================== --- trunk/pywikipedia/commonsdelinker/image_replacer.py 2009-08-06 18:10:15 UTC (rev 7121) +++ trunk/pywikipedia/commonsdelinker/image_replacer.py 2009-08-06 21:56:05 UTC (rev 7122) @@ -133,7 +133,7 @@ for remove in remove_from_list: text = text.replace(remove, u'') # Kill the freaky CommonsDupes - text = text.replacer('== Dummy section, heading can be deleted (using [http://tools.wikimedia.de/~magnus/commons_dupes.php CommonsDupes]) ==', '') + text = text.replace('== Dummy section, heading can be deleted (using [http://tools.wikimedia.de/~magnus/commons_dupes.php CommonsDupes]) ==', '') # Kill the freaky whitespace text = text.replace('\r', '') while '\n\n\n' in text:

1 0

SVN: [7121] trunk/pywikipedia/welcome.py
by alexsh＠svn.wikimedia.org 06 Aug '09

06 Aug '09

Revision: 7121 Author: alexsh Date: 2009-08-06 18:10:15 +0000 (Thu, 06 Aug 2009) Log Message: ----------- welcome.py.blocked(): make simple to return user is blocked Modified Paths: -------------- trunk/pywikipedia/welcome.py Modified: trunk/pywikipedia/welcome.py =================================================================== --- trunk/pywikipedia/welcome.py 2009-08-06 17:54:49 UTC (rev 7120) +++ trunk/pywikipedia/welcome.py 2009-08-06 18:10:15 UTC (rev 7121) @@ -497,22 +497,16 @@ #action=query&list=users&ususers=Filnik&usprop=blockinfo """ Function that detects if a user is currently blocked or not. - """ - + """ params = { - 'action' :'query', - 'list' :'users', - 'ususers' :username, - 'usprop' :'blockinfo', - } + 'action': 'query', + 'list': 'users', + 'ususers': username, + 'usprop': 'blockinfo', + } - data = query.GetData(params, encodeTitle = False) # If there's not the blockedby parameter (that means the user isn't blocked), it will return False otherwise True. - try: - blockedBy = data['query']['users'][0]['blockedby'] - except KeyError: - return False # No he's not - return True # Yes is blocked + return query.GetData(params, encodeTitle = False)['query']['users'][0].has_key('blockedby') def defineSign(wsite, signPageTitle, fileSignName = None, fileOption = False): """ Function to load the random signatures. """

1 0

SVN: [7120] trunk/pywikipedia
by alexsh＠svn.wikimedia.org 06 Aug '09

06 Aug '09

Revision: 7120 Author: alexsh Date: 2009-08-06 17:54:49 +0000 (Thu, 06 Aug 2009) Log Message: ----------- patch bug #2832749 #2820797 Modified Paths: -------------- trunk/pywikipedia/families/wikipedia_family.py trunk/pywikipedia/featured.py trunk/pywikipedia/lonelypages.py Modified: trunk/pywikipedia/families/wikipedia_family.py =================================================================== --- trunk/pywikipedia/families/wikipedia_family.py 2009-08-06 13:55:25 UTC (rev 7119) +++ trunk/pywikipedia/families/wikipedia_family.py 2009-08-06 17:54:49 UTC (rev 7120) @@ -652,6 +652,7 @@ 'an': [u'Desambig', u'Disambig'], 'ar': [u'Disambig', u'توضيح'], 'arc': [u'ܕ'], + 'arz': [u'توضيح'], 'ast': [u'Dixebra'], 'av': [u'Неоднозначность'], 'az': [u'Dəqiqləşdirmə'], Modified: trunk/pywikipedia/featured.py =================================================================== --- trunk/pywikipedia/featured.py 2009-08-06 13:55:25 UTC (rev 7119) +++ trunk/pywikipedia/featured.py 2009-08-06 17:54:49 UTC (rev 7120) @@ -175,6 +175,7 @@ 'ko': (CAT, u"알찬 글"), 'ksh': (CAT, u"Exzälenter Aatikkel"), 'la': (CAT, u"Paginae mensis"), + 'li': (CAT, u"Wikipedia:Sjterartikele"), 'lmo': (CAT, u"Articol ben faa"), 'lo': (CAT, u"ບົດຄວາມດີເດັ່ນ"), 'lt': (CAT, u"Vikipedijos pavyzdiniai straipsniai"), Modified: trunk/pywikipedia/lonelypages.py =================================================================== --- trunk/pywikipedia/lonelypages.py 2009-08-06 13:55:25 UTC (rev 7119) +++ trunk/pywikipedia/lonelypages.py 2009-08-06 17:54:49 UTC (rev 7120) @@ -66,6 +66,7 @@ 'ar':u'{{يتيمة|تاريخ={{نسخ:اسم_شهر}} {{نسخ:عام}}}}', 'en':u'{{Orphan|date={{subst:CURRENTMONTHNAME}} {{subst:CURRENTYEAR}}}}', 'it':u'{{O||mese={{subst:CURRENTMONTHNAME}} {{subst:CURRENTYEAR}}}}', + 'ja':u'{{孤立|{{subst:DATE}}}}', 'zh':u'{{subst:Orphan/auto}}', } @@ -74,6 +75,7 @@ 'ar':u'بوت: صفحة يتيمة، إضافة قالب', 'en':u'Bot: Orphan page, add template', 'it':u'Bot: Voce orfana, aggiungo template {{O}}', + 'ja':u'ロボットによる: 孤立したページへのテンプレート貼付け', 'zh':u'機器人: 本頁的鏈入頁面太少', } @@ -83,6 +85,7 @@ 'ar':u'بوت: إضافة صفحة توضيح', 'en':u'Bot: Adding a disambig page', 'it':u'Bot: Aggiungo una disambigua', + 'ja':u'ロボットによる: 曖昧さ回避の追加', 'zh':u'機器人: 增加消歧義頁面', } @@ -93,6 +96,7 @@ 'ar': [ur'\{\{(?:قالب:|)(يتيمة)[\|\}]'], 'en': [r'\{\{(?:template:|)(orphan)[\|\}]', r'\{\{(?:template:|)(wi)[\|\}]'], 'it': [r'\{\{(?:template:|)(o)[\|\}]'], + 'ja': [ur'\{\{(?:template:|)(孤立)[\|\}]'], 'zh': [r'\{\{(?:template:|)(orphan)[\|\}]'], }

1 0

SVN: [7119] trunk/pywikipedia/casechecker.py
by alexsh＠svn.wikimedia.org 06 Aug '09

06 Aug '09

Revision: 7119 Author: alexsh Date: 2009-08-06 13:55:25 +0000 (Thu, 06 Aug 2009) Log Message: ----------- Fix:query.getData() parameter Modified Paths: -------------- trunk/pywikipedia/casechecker.py Modified: trunk/pywikipedia/casechecker.py =================================================================== --- trunk/pywikipedia/casechecker.py 2009-08-06 11:08:52 UTC (rev 7118) +++ trunk/pywikipedia/casechecker.py 2009-08-06 13:55:25 UTC (rev 7119) @@ -232,7 +232,7 @@ while True: # Get data self.params['gapfrom'] = self.apfrom - data = query.GetData(self.site.lang, self.params, wikipedia.verbose, True) + data = query.GetData(self.params, self.site, wikipedia.verbose, True) try: self.apfrom = data['query-continue']['allpages']['gapfrom'] except:

1 0

SVN: [7118] trunk/pywikipedia/wikipedia.py
by alexsh＠svn.wikimedia.org 06 Aug '09

06 Aug '09

Revision: 7118 Author: alexsh Date: 2009-08-06 11:08:52 +0000 (Thu, 06 Aug 2009) Log Message: ----------- wikipedia.py: Put API version lock. according [[mw:API:Query]] information (some API query is not necessary because they start from 1.9) Modified Paths: -------------- trunk/pywikipedia/wikipedia.py Modified: trunk/pywikipedia/wikipedia.py =================================================================== --- trunk/pywikipedia/wikipedia.py 2009-08-06 10:45:42 UTC (rev 7117) +++ trunk/pywikipedia/wikipedia.py 2009-08-06 11:08:52 UTC (rev 7118) @@ -5133,7 +5133,7 @@ retry_idle_time = 1 while True: - if config.use_api: + if config.use_api and self.versionnumber() >= 12: params = { 'action':'query', 'meta':'allmessages', @@ -5718,7 +5718,7 @@ break def randompage(self): - if config.use_api: + if config.use_api and self.versionnumber() >= 12: params = { 'action': 'query', 'list': 'random', @@ -5736,7 +5736,7 @@ return Page(self, m.group('title')) def randomredirectpage(self): - if config.use_api: + if config.use_api and self.versionnumber() >= 12: params = { 'action': 'query', 'list': 'random', @@ -5980,7 +5980,7 @@ urlsToRetrieve = [siteurl] if not siteurl.startswith('*.'): urlsToRetrieve.append('*.' + siteurl) - if config.use_api: + if config.use_api and self.versionnumber() >= 11: output(u'Querying API exturlusage...') for url in urlsToRetrieve: params = { @@ -6593,6 +6593,9 @@ NOTE 2: it returns the image WITHOUT the image namespace. """ + if self.versionnumber() < 12: + return None + if hash_found is None: # If the hash is none return None and not continue return None # Now get all the images with the same hash

1 0

SVN: [7117] trunk/pywikipedia/wikipedia.py
by alexsh＠svn.wikimedia.org 06 Aug '09

06 Aug '09

Revision: 7117 Author: alexsh Date: 2009-08-06 10:45:42 +0000 (Thu, 06 Aug 2009) Log Message: ----------- *Site()._getUserData(): add description for collect data from API. *Page().delete(): Add API option to delete page.(tested on redirect.py broken, could reduce more time to load delete page.) Modified Paths: -------------- trunk/pywikipedia/wikipedia.py Modified: trunk/pywikipedia/wikipedia.py =================================================================== --- trunk/pywikipedia/wikipedia.py 2009-08-06 07:15:41 UTC (rev 7116) +++ trunk/pywikipedia/wikipedia.py 2009-08-06 10:45:42 UTC (rev 7117) @@ -2396,50 +2396,71 @@ answer = 'y' self.site()._noDeletePrompt = True if answer == 'y': - host = self.site().hostname() - address = self.site().delete_address(self.urlname()) - - reason = reason.encode(self.site().encoding()) + token = self.site().getToken(self, sysop = True) - predata = { - 'wpDeleteReasonList': 'other', - 'wpReason': reason, - 'wpComment': reason, - 'wpConfirm': '1', - 'wpConfirmB': '1' - } - if token: - predata['wpEditToken'] = token - if self.site().hostname() in config.authenticate.keys(): - predata['Content-type'] = 'application/x-www-form-urlencoded' - predata['User-agent'] = useragent - data = self.site().urlEncode(predata) - response = urllib2.urlopen(urllib2.Request(self.site().protocol() + '://' + self.site().hostname() + address, data)) - data = u'' - else: - response, data = self.site().postForm(address, predata, sysop = True) - if data: - self.site().checkBlocks(sysop = True) - if self.site().mediawiki_message('actioncomplete') in data: + + if config.use_api and self.site().versionnumber() >= 12: + params = { + 'action': 'delete', + 'title': self.title(), + 'token': token, + 'reason': reason, + } + datas = query.GetData(params, self.site(), sysop = True) + if datas.has_key('delete'): output(u'Page %s deleted' % self.aslink(forceInterwiki = True)) return True - elif self.site().mediawiki_message('cannotdelete') in data: - output(u'Page %s could not be deleted - it doesn\'t exist' % self.aslink(forceInterwiki = True)) - return False else: - output(u'Deletion of %s failed for an unknown reason. The response text is:' % self.aslink(forceInterwiki = True)) - try: - ibegin = data.index('') + 22 - iend = data.index('') - except ValueError: - # if begin/end markers weren't found, show entire HTML file - output(data) + if datas['error']['code'] == 'missingtitle': + output(u'Page %s could not be deleted - it doesn\'t exist' % self.aslink(forceInterwiki = True)) + return False else: - # otherwise, remove the irrelevant sections - data = data[ibegin:iend] - output(data) - return False + output(u'Deletion of %s failed for an unknown reason. The response text is:' % self.aslink(forceInterwiki = True)) + output('%s' % datas) + else: + host = self.site().hostname() + address = self.site().delete_address(self.urlname()) + reason = reason.encode(self.site().encoding()) + predata = { + 'wpDeleteReasonList': 'other', + 'wpReason': reason, + 'wpComment': reason, + 'wpConfirm': '1', + 'wpConfirmB': '1' + } + if token: + predata['wpEditToken'] = token + if self.site().hostname() in config.authenticate.keys(): + predata['Content-type'] = 'application/x-www-form-urlencoded' + predata['User-agent'] = useragent + data = self.site().urlEncode(predata) + response = urllib2.urlopen(urllib2.Request(self.site().protocol() + '://' + self.site().hostname() + address, data)) + data = u'' + else: + response, data = self.site().postForm(address, predata, sysop = True) + if data: + self.site().checkBlocks(sysop = True) + if self.site().mediawiki_message('actioncomplete') in data: + output(u'Page %s deleted' % self.aslink(forceInterwiki = True)) + return True + elif self.site().mediawiki_message('cannotdelete') in data: + output(u'Page %s could not be deleted - it doesn\'t exist' % self.aslink(forceInterwiki = True)) + return False + else: + output(u'Deletion of %s failed for an unknown reason. The response text is:' % self.aslink(forceInterwiki = True)) + try: + ibegin = data.index('') + 22 + iend = data.index('') + except ValueError: + # if begin/end markers weren't found, show entire HTML file + output(data) + else: + # otherwise, remove the irrelevant sections + data = data[ibegin:iend] + output(data) + return False + def loadDeletedRevisions(self): """Retrieve all deleted revisions for this Page from Special/Undelete. @@ -4879,8 +4900,7 @@ index = self._userIndex(sysop) if type(text) == dict: #text is dict, query from API - # Check for blocks - but only if version is 1.11 (userinfo is available) - # and the user data was not yet loaded + # Check for blocks if text.has_key('blockedby') and not self._isBlocked[index]: # Write a warning if not shown earlier if sysop: @@ -4890,7 +4910,7 @@ output(u'WARNING: %s on %s is blocked. Editing using this account will stop the run.' % (account, self)) self._isBlocked[index] = text.has_key('blockedby') - # Check for new messages, show key 'messages' in dict. + # Check for new messages, the data must had key 'messages' in dict. if text.has_key('messages'): if not self._messages[index]: # User has *new* messages @@ -4907,16 +4927,16 @@ return # Get username. - # anonymous mode will show key 'anon' + # The data in anonymous mode had key 'anon' + # if 'anon' exist, username is IP address, not to collect it right now if not text.has_key('anon'): self._isLoggedIn[index] = True self._userName[index] = text['name'] else: self._isLoggedIn[index] = False - # No idea what is the user name, and it isn't important self._userName[index] = None - # Check user groups and rights + # Get user groups and rights if text.has_key('groups') and text['groups'] != []: self._rights[index] = text['groups'] self._rights[index].extend(text['rights']) @@ -4933,7 +4953,7 @@ if sysop and 'sysop' not in self._rights[index]: output(u'WARNING: Your sysop account on %s does not seem to have sysop rights. You may not be able to perform any sysop-restricted actions using it.' % self) else: - # key groups is not exists, setup a default rights + # 'groups' is not exists, set default rights self._rights[index] = [] if self._isLoggedIn[index]: # Logged in user @@ -4948,13 +4968,13 @@ #remove Duplicate rights self._rights[index] = list(set(self._rights[index])) - # Search for a token + # Get token if text.has_key('preferencestoken') and len(text['preferencestoken']) > 2: # anonymous token is '+\\', check len('+\\') = 2 # if preferencestoken > 2, it must be loggedin. self._token[index] = text['preferencestoken'] if self._rights[index] is not None: - # In this case, token and rights are loaded - user data is now loaded + # Token and rights are loaded - user data is now loaded self._userData[index] = True else: output(u'WARNING: Token not found on %s. You will not be able to edit any page.' % self) @@ -5213,6 +5233,7 @@ config.use_api = False # Get data + # API Userinfo is available from version 1.11 if config.use_api and self.versionnumber() >= 11: #Query userinfo params = {

1 0

SVN: [7116] trunk/pywikipedia/query.py
by alexsh＠svn.wikimedia.org 06 Aug '09

06 Aug '09

Revision: 7116 Author: alexsh Date: 2009-08-06 07:15:41 +0000 (Thu, 06 Aug 2009) Log Message: ----------- query.GetData(): Fix postData cookie cannot use sysop data Modified Paths: -------------- trunk/pywikipedia/query.py Modified: trunk/pywikipedia/query.py =================================================================== --- trunk/pywikipedia/query.py 2009-08-06 06:00:28 UTC (rev 7115) +++ trunk/pywikipedia/query.py 2009-08-06 07:15:41 UTC (rev 7116) @@ -81,7 +81,7 @@ try: jsontext = "Nothing received" if params['action'] in postAC: - res, jsontext = site.postData(path, urllib.urlencode(params.items()), cookies=site.cookies(), sysop=sysop) + res, jsontext = site.postData(path, urllib.urlencode(params.items()), cookies=site.cookies(sysop=sysop), sysop=sysop) else: if back_response: res, jsontext = site.getUrl( path, retry=True, data=data, sysop=sysop, back_response=True)

1 0

SVN: [7115] trunk/pywikipedia/replace.py
by purodha＠svn.wikimedia.org 06 Aug '09

06 Aug '09

Revision: 7115 Author: purodha Date: 2009-08-06 06:00:28 +0000 (Thu, 06 Aug 2009) Log Message: ----------- Add -query:(pagecount) parameter to replace.py - same as interwiki.py has. Modified Paths: -------------- trunk/pywikipedia/replace.py Modified: trunk/pywikipedia/replace.py =================================================================== --- trunk/pywikipedia/replace.py 2009-08-05 21:40:30 UTC (rev 7114) +++ trunk/pywikipedia/replace.py 2009-08-06 06:00:28 UTC (rev 7115) @@ -62,6 +62,9 @@ the bot will check every regex without waiting using all the resources. This will slow it down between a regex and another in order not to waste too much CPU. + +-query: The maximum number of pages that the bot will load at once. + Default value is 60. Ignored when reading an XML file. -fix:XYZ Perform one of the predefined replacements tasks, which are given in the dictionary 'fixes' defined inside the file @@ -495,6 +498,8 @@ allowoverlap = False # Do not recurse replacement recursive = False + # This is the maximum number of pages to load per query + maxquerysize = 60 # This factory is responsible for processing command line arguments # that are also used by other scripts and that determine on which pages # to work on. @@ -561,6 +566,8 @@ summary_commandline = True elif arg.startswith('-allowoverlap'): allowoverlap = True + elif arg.startswith('-query:'): + maxquerysize = int(arg[7:]) else: if not genFactory.handleArg(arg): commandline_replacements.append(arg) @@ -696,7 +703,7 @@ preloadingGen = pagegenerators.PreloadingGenerator(gen, pageNumber=20, lookahead=100) else: - preloadingGen = pagegenerators.PreloadingGenerator(gen, pageNumber=60) + preloadingGen = pagegenerators.PreloadingGenerator(gen, pageNumber=maxquerysize) bot = ReplaceRobot(preloadingGen, replacements, exceptions, acceptall, allowoverlap, recursive, add_cat, sleep, editSummary) bot.run()

1 0

← Newer
1
2
3
4
5
6
7
8
9
10
Older →

2024

2023

2022

2021

2020

2019

2018

2017

2016

2015

2014

2013

2012

2011

2010

2009

Pywikipedia-svn August 2009