[Pywikipedia-l] SVN: [5942] trunk/pywikipedia/fixes.py

wikipedian at svn.wikimedia.org wikipedian at svn.wikimedia.org
Thu Oct 9 23:35:13 UTC 2008


Revision: 5942
Author:   wikipedian
Date:     2008-10-09 23:35:13 +0000 (Thu, 09 Oct 2008)

Log Message:
-----------
applied patch [ 2155727 ] Fixes.py patch

This patch is for updating Arabic language corrections in fixes.py. Created
by [[User:OsamaK]]

Modified Paths:
--------------
    trunk/pywikipedia/fixes.py

Modified: trunk/pywikipedia/fixes.py
===================================================================
--- trunk/pywikipedia/fixes.py	2008-10-09 16:18:16 UTC (rev 5941)
+++ trunk/pywikipedia/fixes.py	2008-10-09 23:35:13 UTC (rev 5942)
@@ -21,7 +21,7 @@
     'HTML': {
         'regex': True,
         'msg': {
-		    'ar':u'روبوت: تحويل/تصليح HTML',
+            'ar':u'روبوت: تحويل/تصليح HTML',
             'en':u'Robot: converting/fixing HTML',
             'de':u'Bot: konvertiere/korrigiere HTML',
             'fr':u'Robot: convertit/fixe HTML',
@@ -155,7 +155,7 @@
     'syntax': {
         'regex': True,
         'msg': {
-		    'ar':u'بوت: تصليح تهيئة الويكي',
+            'ar':u'بوت: تصليح تهيئة الويكي',
             'de':u'Bot: Korrigiere Wiki-Syntax',
             'en':u'Bot: Fixing wiki syntax',
             'fr':u'Bot: Corrige wiki-syntaxe',
@@ -225,7 +225,7 @@
     'syntax-safe': {
         'regex': True,
         'msg': {
-		    'ar':u'بوت: تصليح تهيئة الويكي',
+            'ar':u'بوت: تصليح تهيئة الويكي',
             'de':u'Bot: Korrigiere Wiki-Syntax',
             'en':u'Bot: Fixing wiki syntax',
             'fr':u'Bot: Corrige wiki-syntaxe',
@@ -375,7 +375,7 @@
     'isbn': {
         'regex': True,
         'msg': {
-		    'ar': u'روبوت: تصليح صيغة ISBN',
+            'ar': u'روبوت: تصليح صيغة ISBN',
             'de': u'Bot: Korrigiere ISBN-Format',
             'en': u'Robot: Fixing ISBN format',
             'es': u'Arreglando formato ISBN',
@@ -405,143 +405,106 @@
     },
 
     #Corrections for Arabic Wikipedia and any Arabic wiki.
-	#python replace.py -always -start:! -fix:correct-ar
+    #python replace.py -always -start:! -fix:correct-ar
 
     'correct-ar': {
-        'regex': False,
+        'regex': True,
         'msg': {
-            'ar':u'تدقيق إملائي. 128 كلمة مستهدفة حاليًا.',
+            'ar':u'تدقيق إملائي. 528 كلمة مستهدفة حاليًا.',
         },
         'replacements': [
-            (u' ,', u' ،'),
-            (u' إمرأة ', u' امرأة '),
-            (u' الى ', u' إلى '),
-            (u' إسم ', u' اسم '),
-            (u' الأن ', u' الآن '),
-            (u' اول ', u' أول '),
-            (u' الة ', u' آلة '),
-            (u' فى ', u' في '),
-            (u' اثقل ', u' أثقل '),
-            (u' إبن ', u' ابن '),
-            (u' إبنة ', u' ابنة '),
-            (u' إقتصاد ', u' اقتصاد '),
-            (u' إجتماع ', u' اجتماع '),
-            (u' انجيل ', u' إنجيل '),
-            (u' اجماع ', u' إجماع '),
-            (u' امريكا ', u' أمريكا '),
-            (u' اوروبا ', u' أوروبا '),
-            (u' انجلترا ', u' إنجلترا '),
-            (u' اكتوبر ', u' أكتوبر '),
-            (u' اسرائيل ', u' إسرائيل '),
-            (u' المانيا ', u' ألمانيا '),
-            (u' ايطاليا ', u' إيطاليا '),
-            (u' ايران ', u' إيران '),
-            (u' إستخراج ', u' استخراج '),
-            (u' إستعمال ', u' استعمال '),
-            (u' إستبدال ', u' استبدال '),
-            (u' إشتراك ', u' اشتراك '),
-            (u' إستعادة ', u' استعادة '),
-            (u' إستقلال ', u' استقلال '),
-            (u' إنتقال ', u' انتقال '),
-            (u' إتحاد ', u' اتحاد '),
-            (u' املاء ', u' إملاء '),
-            (u' إستخدام ', u' استخدام '),
-            (u' أحدى ', u' إحدى '),
-            (u' لاكن ', u' لكن '),
-            (u' الاردن ', u' الأردن '),
-            (u' إثنان ', u' اثنان '),
-            (u' شيئ ', u' شيء '),
-            (u' إحتياط ', u' احتياط '),
-            (u' إقتباس ', u' اقتباس '),
-            (u' الامارات ', u' الإمارات '),
-            (u' اكثر ', u' أكثر '),
-            (u' افضل ', u' أفضل '),
-            (u' اكبر ', u' أكبر '),
-            (u' اشهر ', u' أشهر '),
-            (u' ادارة ', u' إدارة '),
-            (u' ابناء ', u' أبناء '),
-            (u' الانصار ', u'  الأنصار '),
-            (u' اشارة ', u' إشارة '),
-            (u' إقرأ ', u' اقرأ '),
-            (u' إمتياز ', u' امتياز '),
-            (u' ارق ', u' أرق '),
-            (u' أرثوذوكس ', u' أرثوذكس '),
-            (u' الأرثوذوكس ', u' الأرثوذكس '),
-            (u' أرثوذوكسية ', u' أرثوذكسية '),
-            (u' الأرثوذوكسية ', u' الأرثوذكسية '),
-            (u' الأرثوذوكسي ', u' الأرثوذكسي '),
-            (u' ارثوذوكس ', u' أرثوذكس '),
-            (u' ارثوذوكسي ', u' أرثوذكسي '),
-            (u' ارثوذوكسية ', u' أرثوذكسية '),
-            (u' الارثوذوكسية ', u' الأرثوذكسية '),
-            (u' اللة ', u' الله '),
-            (u' إختبار ', u' اختبار '),
-            (u'== روابط خارجية ==', u'== وصلات خارجية =='),
-            (u'==روابط خارجية==', u'== وصلات خارجية =='),
-            (u' ارسال ', u' إرسال '),
-            (u' إتصالات ', u' اتصالات '),
-            (u' اسامة ', u' أسامة '),
-            (u' ابراهيم ', u' إبراهيم '),
-            (u' اسماعيل ', u' إسماعيل '),
-            (u' ايوب ', u' أيوب '),
-            (u' ايمن ', u' أيمن '),
-            (u' ابو ', u' أبو '),
-            (u' ابا ', u' أبا '),
-            (u' اخو ', u' أخو '),
-            (u' اخا ', u' أخا '),
-            (u' اخي ', u' أخي '),
-            (u' احد ', u' أحد '),
-            (u' اربعاء ', u' أربعاء '),
-            (u' اهم ', u' أهم '),
-            (u' اوزبكستان ', u' أوزبكستان '),
-            (u' اذربيجان ', u' أذربيجان '),
-            (u' افغانستان ', u' أفغانستان '),
-            (u' امجد ', u' أمجد '),
-            (u' اوسط ', u' أوسط '),
-            (u' اشقر ', u' أشقر '),
-            (u' انور ', u' أنور '),
-            (u' اصعب ', u' أصعب '),
-            (u' اسهل ', u' أسهل '),
-            (u' اجمل ', u' أجمل '),
-            (u' اقبح ', u' أقبح '),
-            (u' اطول ', u' أطول '),
-            (u' اقصر ', u' أقصر '),
-            (u' اسمن ', u' أسمن '),
-            (u' اذكى ', u' أذكى '),
-            (u' اماني ', u' أماني '),
-            (u' احلام ', u' أحلام '),
-            (u' اسماء ', u' أسماء '),
-            (u' ابطأ ', u' أبطأ '),
-            (u' اوربا ', u' أوروبا '),
-            (u' أوربا ', u' أوروبا '),
-            (u' امريكي ', u' أمريكي '),
-            (u' امريكية ', u' أمريكية '),
-            (u' امريكيان ', u' أمريكيان '),
-            (u' امريكيتان ', u' أمريكيتان '),
-            (u' امريكيون ', u' أمريكيون '),
-            (u' امريكيات ', u' أمريكيات '),
-            (u' الامريكي ', u' الأمريكي '),
-            (u' الامريكية ', u' الأمريكية '),
-            (u' الامريكيان ', u' الأمريكيان '),
-            (u' الامريكيتان ', u' الأمريكيتان '),
-            (u' الامريكيون ', u' الأمريكيون '),
-            (u' الامريكيات ', u' الأمريكيات '),
-            (u' اوروبي ', u' أوروبي '),
-            (u' اوروبية ', u' أوروبية '),
-            (u' اوروبيان ', u' أوروبيان '),
-            (u' اوروبيتان ', u' أوروبيتان '),
-            (u' اوروبيون ', u' أوروبيون '),
-            (u' اوروبيات ', u' أوروبيات '),
-            (u' الاوروبي ', u' الأوروبي '),
-            (u' الاوروبية ', u' الأوروبية '),
-            (u' الاوروبيان ', u' الأوروبيان '),
-            (u' الاوروبيتان ', u' الأوروبيتان '),
-            (u' الاوروبيون ', u' الأوروبيون '),
-            (u' الاوروبيات ', u' الأوروبيات '),
-            (u' اسرائيلي ', u' إسرائيلي '),
-            (u' اسرائيلية ', u' إسرائيلية '),
-            (u' اسرائيليان ', u' إسرائيليان '),
-            (u' اسرائيليتان ', u' إسرائيليتان '),
+            #(u' ,', u' ،'), #FIXME: Do not replace comma in non-Arabic text, interwiki, image links or <math> syntax.
+            (ur'\bإمرأة\b', u'امرأة'),
+            (ur'\bالى\b', ur'إلى'),
+            (ur'\bإسم\b', u'اسم'),
+            (ur'\bالأن\b', u'الآن'),
+            (ur'\bالة\b', u'آلة'),
+            (ur'\bفى\b', u'في'),
+            (ur'\bإبن\b', u'ابن'),
+            (ur'\bإبنة\b', u'ابنة'),
+            (ur'\bإقتصاد\b', u'اقتصاد'),
+            (ur'\bإجتماع\b', u'اجتماع'),
+            (ur'\bانجيل\b', u'إنجيل'),
+            (ur'\bاجماع\b', u'إجماع'),
+            (ur'\bاكتوبر\b', u'أكتوبر'),
+            (ur'\bإستخراج\b', u'استخراج'),
+            (ur'\bإستعمال\b', u'استعمال'),
+            (ur'\bإستبدال\b', u'استبدال'),
+            (ur'\bإشتراك\b', u'اشتراك'),
+            (ur'\bإستعادة\b', u'استعادة'),
+            (ur'\bإستقلال\b', u'استقلال'),
+            (ur'\bإنتقال\b', u'انتقال'),
+            (ur'\bإتحاد\b', u'اتحاد'),
+            (ur'\bاملاء\b', u'إملاء'),
+            (ur'\bإستخدام\b', u'استخدام'),
+            (ur'\bأحدى\b', u'إحدى'),
+            (ur'\bلاكن\b', u'لكن'),
+            (ur'\bإثنان\b', u'اثنان'),
+            (ur'\bشيئ\b', u'شيء'),
+            (ur'\bإحتياط\b', u'احتياط'),
+            (ur'\bإقتباس\b', u'اقتباس'),
+            (ur'\bادارة\b', u'إدارة'),
+            (ur'\bابناء\b', u'أبناء'),
+            (ur'\bالانصار\b', u'الأنصار'),
+            (ur'\bاشارة\b', u'إشارة'),
+            (ur'\bإقرأ\b', u'اقرأ'),
+            (ur'\bإمتياز\b', u'امتياز'),
+            (ur'\bارق\b', u'أرق'),
+            (ur'\bاللة\b', u'الله'),
+            (ur'\bإختبار\b', u'اختبار'),
+            (ur'==[ ]?روابط خارجية[ ]?==', u'== وصلات خارجية =='),
+            (ur'\bارسال\b', u'إرسال'),
+            (ur'\bإتصالات\b', u'اتصالات'),
+            (ur'\bابو\b', u'أبو'),
+            (ur'\bابا\b', u'أبا'),
+            (ur'\bاخو\b', u'أخو'),
+            (ur'\bاخا\b', u'أخا'),
+            (ur'\bاخي\b', u'أخي'),
+            (ur'\bاحد\b', u'أحد'),
+            (ur'\bاربعاء\b', u'أربعاء'),
+            #(ur'\bاول\b', u'أول'), #FIXME: Do not replace this (and all others) in interwiki links. This is an Arabic typo, but it is correct in Farsi.
+            (ur'\b(ال|)اهم\b', ur'\1أهم'),
+            (ur'\b(ال|)اثقل\b', ur'\1أثقل'),
+            (ur'\b(ال|)امجد\b', ur'\1أمجد'),
+            (ur'\b(ال|)اوسط\b', ur'\1أوسط'),
+            (ur'\b(ال|)اشقر\b', ur'\1أشقر'),
+            (ur'\b(ال|)انور\b', ur'\1أنور'),
+            (ur'\b(ال|)اصعب\b', ur'\1أصعب'),
+            (ur'\b(ال|)اسهل\b', ur'\1أسهل'),
+            (ur'\b(ال|)اجمل\b', ur'\1أجمل'),
+            (ur'\b(ال|)اقبح\b', ur'\1أقبح'),
+            (ur'\b(ال|)اطول\b', ur'\1أطول'),
+            (ur'\b(ال|)اقصر\b', ur'\1أقصر'),
+            (ur'\b(ال|)اسمن\b', ur'\1أسمن'),
+            (ur'\b(ال|)اذكى\b', ur'\1أذكى'),
+            (ur'\b(ال|)اكثر\b', ur'\1أكثر'),
+            (ur'\b(ال|)افضل\b', ur'\1أفضل'),
+            (ur'\b(ال|)اكبر\b', ur'\1أكبر'),
+            (ur'\b(ال|)اشهر\b', ur'\1أشهر'),
+            (ur'\b(ال|)ابطأ\b', ur'\1أبطأ'),
+            (ur'\b(ال|)اماني\b', ur'\1أماني'),
+            (ur'\b(ال|)احلام\b', ur'\1أحلام'),
+            (ur'\b(ال|)اسماء\b', ur'\1أسماء'),
+            (ur'\b(ال|)اسامة\b', ur'\1أسامة'),
+            (ur'\bابراهيم\b', u'إبراهيم'),
+            (ur'\bاسماعيل\b', u'إسماعيل'),
+            (ur'\bايوب\b', u'أيوب'),
+            (ur'\bايمن\b', u'أيمن'),
+            (ur'\bاوزبكستان\b', u'أوزبكستان'),
+            (ur'\bاذربيجان\b', u'أذربيجان'),
+            (ur'\bافغانستان\b', u'أفغانستان'),
+            (ur'\bانجلترا\b', u'إنجلترا'),
+            (ur'\bايطاليا\b', u'إيطاليا'),
+            (ur'\bاوربا\b', u'أوروبا'),
+            (ur'\bأوربا\b', u'أوروبا'),
+            (ur'\bاوغندة\b', u'أوغندة'),
+            (ur'\b(ال|)ا(لماني|فريقي|سترالي)(ا|ة|تان|ان|ين|ي|ون|و|ات|)\b', ur'\1أ\2\3'),
+            (ur'\b(ال|)ا(وروب|مريك)(ا|ي|ية|يتان|يان|يين|يي|يون|يو|يات|)\b', ur'\1أ\2\3'),
+            (ur'\b(ال|)ا(ردن|رجنتين|وغند|سبان|وكران|فغان)(ي|ية|يتان|يان|يين|يي|يون|يو|يات|)\b', ur'\1أ\2\3'),
+            (ur'\b(ال|)ا(سرائيل|يران|مارات|نكليز|نجليز)(ي|ية|يتان|يان|يين|يي|يون|يو|يات|)\b', ur'\1إ\2\3'),
+            (ur'\b(ال|)(ا|أ)(رثوذكس|رثوذوكس)(ي|ية|يتان|يان|يين|يي|يون|يو|يات|)\b', ur'\1أرثوذكس\4'),
+            (ur'\bإست(عمل|خدم|مر|مد|مال|عاض|قام|حال|جاب|قال|زاد|عان|طال)(ت|ا|وا|)\b', ur'است\1\2'),
+            (ur'\bإست(حال|قال|طال|زاد|عان|قام|راح|جاب|عاض|مال)ة\b', ur'است\1ة'),
         ]
     },
     'specialpages': {
@@ -560,7 +523,7 @@
             (u'Special:Listgrouprights', u'Special:ListGroupRights'),
             (u'Special:Listusers',       u'Special:ListUsers'),
             (u'Special:Newimages',       u'Special:NewImages'),
-			(u'Special:Prefixindex',   u'Special:PrefixIndex'),
+            (u'Special:Prefixindex',   u'Special:PrefixIndex'),
             (u'Special:Protectedpages',  u'Special:ProtectedPages'),
             (u'Special:Recentchanges',   u'Special:RecentChanges'),
             (u'Special:Specialpages',    u'Special:SpecialPages'),





More information about the Pywikipedia-l mailing list