jenkins-bot has submitted this change and it was merged.
Change subject: [PEP8]ify fixes.py ......................................................................
[PEP8]ify fixes.py
Change-Id: I6ef4a5fa5671f462a5042fd766887f90b2b7075d --- M fixes.py 1 file changed, 121 insertions(+), 117 deletions(-)
Approvals: Xqt: Looks good to me, approved jenkins-bot: Verified
diff --git a/fixes.py b/fixes.py index 58cbcfa..1bbf6ac 100644 --- a/fixes.py +++ b/fixes.py @@ -49,28 +49,28 @@ 'HTML': { 'regex': True, 'msg': { - 'ar':u'روبوت: تحويل/تصليح HTML', - 'be':u'Бот: карэкцыя HTML', - 'be-x-old':u'Бот: карэкцыя HTML', - 'cs':u'převod/oprava HTML', - 'en':u'Robot: Converting/fixing HTML', - 'eo':u'Bot: koredtado de HTMLa teksto', - 'fa':u'ربات:تبدیل/تصحیح کدهای اچتیامال', - 'de':u'Bot: konvertiere/korrigiere HTML', - 'fr':u'Robot: convertit/fixe HTML', - 'he':u'בוט: ממיר/מתקן HTML', - 'ja':u'ロボットによる: HTML転換', - 'ksh':u'Bot: vun HTML en Wikikood wandelle', - 'ia':u'Robot: conversion/reparation de HTML', - 'lt':u'robotas: konvertuojamas/taisomas HTML', - 'nl':u'Bot: conversie/reparatie HTML', - 'pl':u'Robot konwertuje/naprawia HTML', - 'pt':u'Bot: Corrigindo HTML', - 'ru':u'Бот: коррекция HTML', - 'sr':u'Бот: Поправка HTML-а', - 'sv':u'Bot: Konverterar/korrigerar HTML', - 'uk':u'Бот: корекцiя HTML', - 'zh':u'機器人: 轉換HTML', + 'ar': u'روبوت: تحويل/تصليح HTML', + 'be': u'Бот: карэкцыя HTML', + 'be-x-old': u'Бот: карэкцыя HTML', + 'cs': u'převod/oprava HTML', + 'en': u'Robot: Converting/fixing HTML', + 'eo': u'Bot: koredtado de HTMLa teksto', + 'fa': u'ربات:تبدیل/تصحیح کدهای اچتیامال', + 'de': u'Bot: konvertiere/korrigiere HTML', + 'fr': u'Robot: convertit/fixe HTML', + 'he': u'בוט: ממיר/מתקן HTML', + 'ja': u'ロボットによる: HTML転換', + 'ksh': u'Bot: vun HTML en Wikikood wandelle', + 'ia': u'Robot: conversion/reparation de HTML', + 'lt': u'robotas: konvertuojamas/taisomas HTML', + 'nl': u'Bot: conversie/reparatie HTML', + 'pl': u'Robot konwertuje/naprawia HTML', + 'pt': u'Bot: Corrigindo HTML', + 'ru': u'Бот: коррекция HTML', + 'sr': u'Бот: Поправка HTML-а', + 'sv': u'Bot: Konverterar/korrigerar HTML', + 'uk': u'Бот: корекцiя HTML', + 'zh': u'機器人: 轉換HTML', }, 'replacements': [ # Everything case-insensitive (?i) @@ -92,12 +92,12 @@ # so we only make it XHTML compliant (r'(?i)<hr ([^>/]+?)>', r'<hr \1 />'), # a header where only spaces are in the same line - (r'(?i)([\r\n]) *<h1> *([^<]+?) *</h1> *([\r\n])', r"\1= \2 =\3"), - (r'(?i)([\r\n]) *<h2> *([^<]+?) *</h2> *([\r\n])', r"\1== \2 ==\3"), - (r'(?i)([\r\n]) *<h3> *([^<]+?) *</h3> *([\r\n])', r"\1=== \2 ===\3"), - (r'(?i)([\r\n]) *<h4> *([^<]+?) *</h4> *([\r\n])', r"\1==== \2 ====\3"), - (r'(?i)([\r\n]) *<h5> *([^<]+?) *</h5> *([\r\n])', r"\1===== \2 =====\3"), - (r'(?i)([\r\n]) *<h6> *([^<]+?) *</h6> *([\r\n])', r"\1====== \2 ======\3"), + (r'(?i)([\r\n]) *<h1> *([^<]+?) *</h1> *([\r\n])', r"\1= \2 =\3"), + (r'(?i)([\r\n]) *<h2> *([^<]+?) *</h2> *([\r\n])', r"\1== \2 ==\3"), + (r'(?i)([\r\n]) *<h3> *([^<]+?) *</h3> *([\r\n])', r"\1=== \2 ===\3"), + (r'(?i)([\r\n]) *<h4> *([^<]+?) *</h4> *([\r\n])', r"\1==== \2 ====\3"), + (r'(?i)([\r\n]) *<h5> *([^<]+?) *</h5> *([\r\n])', r"\1===== \2 =====\3"), + (r'(?i)([\r\n]) *<h6> *([^<]+?) *</h6> *([\r\n])', r"\1====== \2 ======\3"), # TODO: maybe we can make the bot replace <p> tags with \r\n's. ], 'exceptions': { @@ -115,7 +115,7 @@ 'grammar-de': { 'regex': True, 'msg': { - 'de':u'Bot: korrigiere Grammatik', + 'de': u'Bot: korrigiere Grammatik', }, 'replacements': [ #(u'([Ss]owohl) ([^,.]+?), als auch', r'\1 \2 als auch'), @@ -157,26 +157,28 @@ r'20min.ch', # Schweizer News-Seite ], 'inside': [ - r'<code>.*</code>', # because of code examples + r'<code>.*</code>', # because of code examples r'{{[Zz]itat|.*?}}', - ur'{{§|.*?}}', # Gesetzesparagraph + ur'{{§|.*?}}', # Gesetzesparagraph ur'§ ?\d+[a-z]', # Gesetzesparagraph - r'Ju 52/1m', # Flugzeugbezeichnung - r'Ju 52/3m', # Flugzeugbezeichnung - r'AH-1W', # Hubschrauberbezeichnung - r'ZPG-3W', # Luftschiffbezeichnung - r'8mm', # Filmtitel - r'802.11g', # WLAN-Standard - r'DOS/4GW', # Software - r'ntfs-3g', # Dateisystem-Treiber - r'/\w(,\w)*/', # Laut-Aufzählung in der Linguistik - r'[xyz](,[xyz])+', # Variablen in der Mathematik (unklar, ob Leerzeichen hier Pflicht sind) - r'(?m)^;(.*?)$', # Definitionslisten, dort gibt es oft absichtlich Leerzeichen vor Doppelpunkten - r'\d+h( | )\d+m', # Schreibweise für Zeiten, vor allem in Film-Infoboxen. Nicht korrekt, aber dafür schön kurz. - r'(?i)[[(Bild|Image|Media):.+?|', # Dateinamen auslassen - r'{{bgc|.*?}}', # Hintergrundfarbe - r'<sup>\d+m</sup>', # bei chemischen Formeln - r'([A-Z][A-Za-z]*(,[A-Z][A-Za-z]*(<sup>.*?</sup>|<sub>.*?</sub>|))+)' # chemische Formel, z. B. AuPb(Pb,Sb,Bi)Te. Hier sollen keine Leerzeichen hinter die Kommata. + r'Ju 52/1m', # Flugzeugbezeichnung + r'Ju 52/3m', # Flugzeugbezeichnung + r'AH-1W', # Hubschrauberbezeichnung + r'ZPG-3W', # Luftschiffbezeichnung + r'8mm', # Filmtitel + r'802.11g', # WLAN-Standard + r'DOS/4GW', # Software + r'ntfs-3g', # Dateisystem-Treiber + r'/\w(,\w)*/', # Laut-Aufzählung in der Linguistik + r'[xyz](,[xyz])+', # Variablen in der Mathematik (unklar, ob Leerzeichen hier Pflicht sind) + r'(?m)^;(.*?)$', # Definitionslisten, dort gibt es oft absichtlich Leerzeichen vor Doppelpunkten + r'\d+h( | )\d+m', # Schreibweise für Zeiten, vor allem in Film-Infoboxen. Nicht korrekt, aber dafür schön kurz. + r'(?i)[[(Bild|Image|Media):.+?|', # Dateinamen auslassen + r'{{bgc|.*?}}', # Hintergrundfarbe + r'<sup>\d+m</sup>', # bei chemischen Formeln + # chemische Formel, z. B. AuPb(Pb,Sb,Bi)Te. Hier sollen keine + # Leerzeichen hinter die Kommata. + r'([A-Z][A-Za-z]*(,[A-Z][A-Za-z]*(<sup>.*?</sup>|<sub>.*?</sub>|))+)' ], 'title': [ r'Arsen', # chemische Formel @@ -191,26 +193,26 @@ 'syntax': { 'regex': True, 'msg': { - 'ar':u'بوت: تصليح تهيئة الويكي', - 'be':u'Бот: Карэкцыя вiкi-сiнтаксiсу', - 'be-x-old':u'Бот выпраўляе вiкi-сынтаксiс', - 'cs':u'Oprava wikisyntaxe', - 'de':u'Bot: Korrigiere Wiki-Syntax', - 'en':u'Robot: Fixing wiki syntax', - 'eo':u'Bot: Korektado de vikia sintakso', - 'fa':u'ربات:تصحیح قالب ویکینویسی', - 'fr':u'Bot: Corrige wiki-syntaxe', - 'he':u'בוט: מתקן תחביר ויקי', - 'ia':u'Robot: Reparation de syntaxe wiki', - 'ja':u'ロボットによる: wiki構文修正', - 'lt':u'robotas: Taisoma wiki sintaksė', - 'nl':u'Bot: reparatie wikisyntaxis', - 'pl':u'Robot poprawia wiki-składnię', - 'pt':u'Bot: Corrigindo sintaxe wiki', - 'ru':u'Бот: Коррекция вики синтаксиса', - 'sr':u'Бот: Поправка вики синтаксе', - 'uk':u'Бот: Корекцiя вiкi-синтаксису', - 'zh':u'機器人: 修正wiki語法', + 'ar': u'بوت: تصليح تهيئة الويكي', + 'be': u'Бот: Карэкцыя вiкi-сiнтаксiсу', + 'be-x-old': u'Бот выпраўляе вiкi-сынтаксiс', + 'cs': u'Oprava wikisyntaxe', + 'de': u'Bot: Korrigiere Wiki-Syntax', + 'en': u'Robot: Fixing wiki syntax', + 'eo': u'Bot: Korektado de vikia sintakso', + 'fa': u'ربات:تصحیح قالب ویکینویسی', + 'fr': u'Bot: Corrige wiki-syntaxe', + 'he': u'בוט: מתקן תחביר ויקי', + 'ia': u'Robot: Reparation de syntaxe wiki', + 'ja': u'ロボットによる: wiki構文修正', + 'lt': u'robotas: Taisoma wiki sintaksė', + 'nl': u'Bot: reparatie wikisyntaxis', + 'pl': u'Robot poprawia wiki-składnię', + 'pt': u'Bot: Corrigindo sintaxe wiki', + 'ru': u'Бот: Коррекция вики синтаксиса', + 'sr': u'Бот: Поправка вики синтаксе', + 'uk': u'Бот: Корекцiя вiкi-синтаксису', + 'zh': u'機器人: 修正wiki語法', }, 'replacements': [ # external link in double brackets @@ -251,14 +253,14 @@ 'startspace', # because of code examples ], 'text-contains': [ - r'http://.*?object=tx%5C%7C', # regular dash in URL - r'http://.*?allmusic%5C.com', # regular dash in URL - r'http://.*?allmovie%5C.com', # regular dash in URL - r'http://physics.nist.gov/', # regular dash in URL - r'http://www.forum-seniorenarbeit.de/', # regular dash in URL - r'http://kuenstlerdatenbank.ifa.de/', # regular dash in URL - r'&object=med', # regular dash in URL - r'[CDATA[' # lots of brackets + r'http://.*?object=tx%5C%7C', # regular dash in URL + r'http://.*?allmusic%5C.com', # regular dash in URL + r'http://.*?allmovie%5C.com', # regular dash in URL + r'http://physics.nist.gov/', # regular dash in URL + r'http://www.forum-seniorenarbeit.de/', # regular dash in URL + r'http://kuenstlerdatenbank.ifa.de/', # regular dash in URL + r'&object=med', # regular dash in URL + r'[CDATA[' # lots of brackets ], } }, @@ -268,26 +270,26 @@ 'syntax-safe': { 'regex': True, 'msg': { - 'ar':u'بوت: تصليح تهيئة الويكي', - 'be':u'Бот: Карэкцыя вiкi-сiнтаксiсу', - 'be-x-old':u'Бот выпраўляе вiкi-сынтаксiс', - 'cs':u'Oprava wikisyntaxe', - 'de':u'Bot: Korrigiere Wiki-Syntax', - 'en':u'Robot: Fixing wiki syntax', - 'eo':u'Bot: Korektado de vikia sintakso', - 'fa':u'ربات:تصحیح قالب ویکینویسی', - 'fr':u'Bot: Corrige wiki-syntaxe', - 'he':u'בוט: מתקן תחביר ויקי', - 'ia':u'Robot: Reparation de syntaxe wiki', - 'ja':u'ロボットによる: wiki構文修正', - 'lt':u'robotas: Taisoma wiki sintaksė', - 'nl':u'Bot: reparatie wikisyntaxis', - 'pl':u'Robot poprawia wiki-składnię', - 'pt':u'Bot: Corrigindo sintaxe wiki', - 'ru':u'Бот: Коррекция вики синтаксиса', - 'sr':u'Бот: Поправка вики синтаксе', - 'uk':u'Бот: Корекцiя вiкi-синтаксису', - 'zh':u'機器人: 修正wiki語法', + 'ar': u'بوت: تصليح تهيئة الويكي', + 'be': u'Бот: Карэкцыя вiкi-сiнтаксiсу', + 'be-x-old': u'Бот выпраўляе вiкi-сынтаксiс', + 'cs': u'Oprava wikisyntaxe', + 'de': u'Bot: Korrigiere Wiki-Syntax', + 'en': u'Robot: Fixing wiki syntax', + 'eo': u'Bot: Korektado de vikia sintakso', + 'fa': u'ربات:تصحیح قالب ویکینویسی', + 'fr': u'Bot: Corrige wiki-syntaxe', + 'he': u'בוט: מתקן תחביר ויקי', + 'ia': u'Robot: Reparation de syntaxe wiki', + 'ja': u'ロボットによる: wiki構文修正', + 'lt': u'robotas: Taisoma wiki sintaksė', + 'nl': u'Bot: reparatie wikisyntaxis', + 'pl': u'Robot poprawia wiki-składnię', + 'pt': u'Bot: Corrigindo sintaxe wiki', + 'ru': u'Бот: Коррекция вики синтаксиса', + 'sr': u'Бот: Поправка вики синтаксе', + 'uk': u'Бот: Корекцiя вiкi-синтаксису', + 'zh': u'機器人: 修正wiki語法', }, 'replacements': [ # external link in double brackets @@ -317,17 +319,17 @@ } },
- 'case-de': { # German upper / lower case issues + 'case-de': { # German upper / lower case issues 'regex': True, 'msg': { - 'de':u'Bot: Korrigiere Groß-/Kleinschreibung', + 'de': u'Bot: Korrigiere Groß-/Kleinschreibung', }, 'replacements': [ (r'\batlantische(r|n|) Ozean', r'Atlantische\1 Ozean'), (r'\bdeutsche(r|n|) Bundestag\b', r'Deutsche\1 Bundestag'), - (r'\bdeutschen Bundestags\b', r'Deutschen Bundestags'), # Aufpassen, z. B. 'deutsche Bundestagswahl' + (r'\bdeutschen Bundestags\b', r'Deutschen Bundestags'), # Aufpassen, z. B. 'deutsche Bundestagswahl' (r'\bdeutsche(r|n|) Reich\b', r'Deutsche\1 Reich'), - (r'\bdeutschen Reichs\b', r'Deutschen Reichs'), # Aufpassen, z. B. 'deutsche Reichsgrenzen' + (r'\bdeutschen Reichs\b', r'Deutschen Reichs'), # Aufpassen, z. B. 'deutsche Reichsgrenzen' (r'\bdritte(n|) Welt(?!krieg)', r'Dritte\1 Welt'), (r'\bdreißigjährige(r|n|) Krieg', r'Dreißigjährige\1 Krieg'), (r'\beuropäische(n|) Gemeinschaft', r'Europäische\1 Gemeinschaft'), @@ -356,7 +358,7 @@ 'vonbis': { 'regex': True, 'msg': { - 'de':u'Bot: Ersetze Binde-/Gedankenstrich durch "bis"', + 'de': u'Bot: Ersetze Binde-/Gedankenstrich durch "bis"', }, 'replacements': [ # Bindestrich, Gedankenstrich, Geviertstrich @@ -369,7 +371,7 @@ 'music-de': { 'regex': False, 'msg': { - 'de':u'Bot: korrigiere Links auf Begriffsklärungen', + 'de': u'Bot: korrigiere Links auf Begriffsklärungen', }, 'replacements': [ (u'[[CD]]', u'[[Audio-CD|CD]]'), @@ -413,10 +415,10 @@ ], 'exceptions': { 'inside': [ - r'[[20. Juli 1944]]', # Hitler-Attentat - r'[[17. Juni 1953]]', # Ost-Berliner Volksaufstand - r'[[1. April 2000]]', # Film - r'[[11. September 2001]]', # Anschläge in den USA + r'[[20. Juli 1944]]', # Hitler-Attentat + r'[[17. Juni 1953]]', # Ost-Berliner Volksaufstand + r'[[1. April 2000]]', # Film + r'[[11. September 2001]]', # Anschläge in den USA r'[[7. Juli 2005]]', # Terroranschläge in Spanien ], } @@ -424,7 +426,7 @@
'isbn': { 'regex': True, - 'msg': 'isbn-formatting', # use i18n translations + 'msg': 'isbn-formatting', # use i18n translations 'replacements': [ # colon (r'ISBN: (\d+)', r'ISBN \1'), @@ -434,8 +436,10 @@ # hyphen-minus as separator, or spaces between digits and separators. # Note that these regular expressions also match valid ISBNs, but # these won't be changed. - (ur'ISBN (978|979) *[- −.‐-―] *(\d+) *[- −.‐-―] *(\d+) *[- −.‐-―] *(\d+) *[- −.‐-―] *(\d)(?!\d)', r'ISBN \1-\2-\3-\4-\5'), # ISBN-13 - (ur'ISBN (\d+) *[- −.‐-―] *(\d+) *[- −.‐-―] *(\d+) *[- −.‐-―] *(\d|X|x)(?!\d)', r'ISBN \1-\2-\3-\4'), # ISBN-10 + # ISBN-13 + (ur'ISBN (978|979) *[- −.‐-―] *(\d+) *[- −.‐-―] *(\d+) *[- −.‐-―] *(\d+) *[- −.‐-―] *(\d)(?!\d)', r'ISBN \1-\2-\3-\4-\5'), + # ISBN-10 + (ur'ISBN (\d+) *[- −.‐-―] *(\d+) *[- −.‐-―] *(\d+) *[- −.‐-―] *(\d|X|x)(?!\d)', r'ISBN \1-\2-\3-\4'), # missing space before ISBN-10 or before ISBN-13, # or non-breaking space. (r'ISBN(| | )((\d(-?)){12}\d|(\d(-?)){9}[\dXx])', r'ISBN \2'), @@ -447,7 +451,7 @@ ], 'inside': [ r'ISBN (\d(-?)){12}\d', # matches valid ISBN-13s - r'ISBN (\d(-?)){9}[\dXx]', # matches valid ISBN-10s + r'ISBN (\d(-?)){9}[\dXx]', # matches valid ISBN-10s ], } }, @@ -458,7 +462,7 @@ 'correct-ar': { 'regex': True, 'msg': { - 'ar':u'تدقيق إملائي', + 'ar': u'تدقيق إملائي', }, 'replacements': [ #(u' ,', u' ،'), #FIXME: Do not replace comma in non-Arabic text, interwiki, image links or <math> syntax. @@ -565,7 +569,7 @@ 'regex': False, 'msg': { 'en': u'Robot: Fixing special page capitalisation', - 'fa':u'ربات: تصحیح بزرگی و کوچکی حروف صفحههای ویژه', + 'fa': u'ربات: تصحیح بزرگی و کوچکی حروف صفحههای ویژه', }, 'replacements': [ (u'Special:Allpages', u'Special:AllPages'), @@ -600,8 +604,8 @@ 'fa': u'ربات: جایگزینی پیوندها به دامنهها با پسوند yu', 'fr': u'Robot: Correction des liens pointant vers le domaine .yu, qui expire en 2009', 'ksh': u'Bot: de ahle .yu-Domains loufe us, dröm ußjetuusch', - }, - 'replacements': [ + }, + 'replacements': [ (u'www.budva.cg.yu', u'www.budva.rs'), (u'spc.org.yu', u'spc.rs'), (u'www.oks.org.yu', u'www.oks.org.rs'), @@ -653,12 +657,12 @@ 'msg': { 'en': u'Robot: Fixing rich-editor html', 'fa': u'ربات: تصحیح اچتیامال ویرایشگر پیشرفته', - }, - 'replacements': [ + }, + 'replacements': [ # replace <br> with a new line - (r'(?i)<br>', r'\n'), + (r'(?i)<br>', r'\n'), # replace with a space - (r'(?i) ', r' '), + (r'(?i) ', r' '), ], }, }
pywikibot-commits@lists.wikimedia.org