Revision: 5942
Author: wikipedian
Date: 2008-10-09 23:35:13 +0000 (Thu, 09 Oct 2008)
Log Message:
-----------
applied patch [ 2155727 ] Fixes.py patch
This patch is for updating Arabic language corrections in fixes.py. Created
by [[User:OsamaK]]
Modified Paths:
--------------
trunk/pywikipedia/fixes.py
Modified: trunk/pywikipedia/fixes.py
===================================================================
--- trunk/pywikipedia/fixes.py 2008-10-09 16:18:16 UTC (rev 5941)
+++ trunk/pywikipedia/fixes.py 2008-10-09 23:35:13 UTC (rev 5942)
@@ -21,7 +21,7 @@
'HTML': {
'regex': True,
'msg': {
- 'ar':u'روبوت: تحويل/تصليح HTML',
+ 'ar':u'روبوت: تحويل/تصليح HTML',
'en':u'Robot: converting/fixing HTML',
'de':u'Bot: konvertiere/korrigiere HTML',
'fr':u'Robot: convertit/fixe HTML',
@@ -155,7 +155,7 @@
'syntax': {
'regex': True,
'msg': {
- 'ar':u'بوت: تصليح تهيئة الويكي',
+ 'ar':u'بوت: تصليح تهيئة الويكي',
'de':u'Bot: Korrigiere Wiki-Syntax',
'en':u'Bot: Fixing wiki syntax',
'fr':u'Bot: Corrige wiki-syntaxe',
@@ -225,7 +225,7 @@
'syntax-safe': {
'regex': True,
'msg': {
- 'ar':u'بوت: تصليح تهيئة الويكي',
+ 'ar':u'بوت: تصليح تهيئة الويكي',
'de':u'Bot: Korrigiere Wiki-Syntax',
'en':u'Bot: Fixing wiki syntax',
'fr':u'Bot: Corrige wiki-syntaxe',
@@ -375,7 +375,7 @@
'isbn': {
'regex': True,
'msg': {
- 'ar': u'روبوت: تصليح صيغة ISBN',
+ 'ar': u'روبوت: تصليح صيغة ISBN',
'de': u'Bot: Korrigiere ISBN-Format',
'en': u'Robot: Fixing ISBN format',
'es': u'Arreglando formato ISBN',
@@ -405,143 +405,106 @@
},
#Corrections for Arabic Wikipedia and any Arabic wiki.
- #python replace.py -always -start:! -fix:correct-ar
+ #python replace.py -always -start:! -fix:correct-ar
'correct-ar': {
- 'regex': False,
+ 'regex': True,
'msg': {
- 'ar':u'تدقيق إملائي. 128 كلمة مستهدفة حاليًا.',
+ 'ar':u'تدقيق إملائي. 528 كلمة مستهدفة حاليًا.',
},
'replacements': [
- (u' ,', u' ،'),
- (u' إمرأة ', u' امرأة '),
- (u' الى ', u' إلى '),
- (u' إسم ', u' اسم '),
- (u' الأن ', u' الآن '),
- (u' اول ', u' أول '),
- (u' الة ', u' آلة '),
- (u' فى ', u' في '),
- (u' اثقل ', u' أثقل '),
- (u' إبن ', u' ابن '),
- (u' إبنة ', u' ابنة '),
- (u' إقتصاد ', u' اقتصاد '),
- (u' إجتماع ', u' اجتماع '),
- (u' انجيل ', u' إنجيل '),
- (u' اجماع ', u' إجماع '),
- (u' امريكا ', u' أمريكا '),
- (u' اوروبا ', u' أوروبا '),
- (u' انجلترا ', u' إنجلترا '),
- (u' اكتوبر ', u' أكتوبر '),
- (u' اسرائيل ', u' إسرائيل '),
- (u' المانيا ', u' ألمانيا '),
- (u' ايطاليا ', u' إيطاليا '),
- (u' ايران ', u' إيران '),
- (u' إستخراج ', u' استخراج '),
- (u' إستعمال ', u' استعمال '),
- (u' إستبدال ', u' استبدال '),
- (u' إشتراك ', u' اشتراك '),
- (u' إستعادة ', u' استعادة '),
- (u' إستقلال ', u' استقلال '),
- (u' إنتقال ', u' انتقال '),
- (u' إتحاد ', u' اتحاد '),
- (u' املاء ', u' إملاء '),
- (u' إستخدام ', u' استخدام '),
- (u' أحدى ', u' إحدى '),
- (u' لاكن ', u' لكن '),
- (u' الاردن ', u' الأردن '),
- (u' إثنان ', u' اثنان '),
- (u' شيئ ', u' شيء '),
- (u' إحتياط ', u' احتياط '),
- (u' إقتباس ', u' اقتباس '),
- (u' الامارات ', u' الإمارات '),
- (u' اكثر ', u' أكثر '),
- (u' افضل ', u' أفضل '),
- (u' اكبر ', u' أكبر '),
- (u' اشهر ', u' أشهر '),
- (u' ادارة ', u' إدارة '),
- (u' ابناء ', u' أبناء '),
- (u' الانصار ', u' الأنصار '),
- (u' اشارة ', u' إشارة '),
- (u' إقرأ ', u' اقرأ '),
- (u' إمتياز ', u' امتياز '),
- (u' ارق ', u' أرق '),
- (u' أرثوذوكس ', u' أرثوذكس '),
- (u' الأرثوذوكس ', u' الأرثوذكس '),
- (u' أرثوذوكسية ', u' أرثوذكسية '),
- (u' الأرثوذوكسية ', u' الأرثوذكسية '),
- (u' الأرثوذوكسي ', u' الأرثوذكسي '),
- (u' ارثوذوكس ', u' أرثوذكس '),
- (u' ارثوذوكسي ', u' أرثوذكسي '),
- (u' ارثوذوكسية ', u' أرثوذكسية '),
- (u' الارثوذوكسية ', u' الأرثوذكسية '),
- (u' اللة ', u' الله '),
- (u' إختبار ', u' اختبار '),
- (u'== روابط خارجية ==', u'== وصلات خارجية =='),
- (u'==روابط خارجية==', u'== وصلات خارجية =='),
- (u' ارسال ', u' إرسال '),
- (u' إتصالات ', u' اتصالات '),
- (u' اسامة ', u' أسامة '),
- (u' ابراهيم ', u' إبراهيم '),
- (u' اسماعيل ', u' إسماعيل '),
- (u' ايوب ', u' أيوب '),
- (u' ايمن ', u' أيمن '),
- (u' ابو ', u' أبو '),
- (u' ابا ', u' أبا '),
- (u' اخو ', u' أخو '),
- (u' اخا ', u' أخا '),
- (u' اخي ', u' أخي '),
- (u' احد ', u' أحد '),
- (u' اربعاء ', u' أربعاء '),
- (u' اهم ', u' أهم '),
- (u' اوزبكستان ', u' أوزبكستان '),
- (u' اذربيجان ', u' أذربيجان '),
- (u' افغانستان ', u' أفغانستان '),
- (u' امجد ', u' أمجد '),
- (u' اوسط ', u' أوسط '),
- (u' اشقر ', u' أشقر '),
- (u' انور ', u' أنور '),
- (u' اصعب ', u' أصعب '),
- (u' اسهل ', u' أسهل '),
- (u' اجمل ', u' أجمل '),
- (u' اقبح ', u' أقبح '),
- (u' اطول ', u' أطول '),
- (u' اقصر ', u' أقصر '),
- (u' اسمن ', u' أسمن '),
- (u' اذكى ', u' أذكى '),
- (u' اماني ', u' أماني '),
- (u' احلام ', u' أحلام '),
- (u' اسماء ', u' أسماء '),
- (u' ابطأ ', u' أبطأ '),
- (u' اوربا ', u' أوروبا '),
- (u' أوربا ', u' أوروبا '),
- (u' امريكي ', u' أمريكي '),
- (u' امريكية ', u' أمريكية '),
- (u' امريكيان ', u' أمريكيان '),
- (u' امريكيتان ', u' أمريكيتان '),
- (u' امريكيون ', u' أمريكيون '),
- (u' امريكيات ', u' أمريكيات '),
- (u' الامريكي ', u' الأمريكي '),
- (u' الامريكية ', u' الأمريكية '),
- (u' الامريكيان ', u' الأمريكيان '),
- (u' الامريكيتان ', u' الأمريكيتان '),
- (u' الامريكيون ', u' الأمريكيون '),
- (u' الامريكيات ', u' الأمريكيات '),
- (u' اوروبي ', u' أوروبي '),
- (u' اوروبية ', u' أوروبية '),
- (u' اوروبيان ', u' أوروبيان '),
- (u' اوروبيتان ', u' أوروبيتان '),
- (u' اوروبيون ', u' أوروبيون '),
- (u' اوروبيات ', u' أوروبيات '),
- (u' الاوروبي ', u' الأوروبي '),
- (u' الاوروبية ', u' الأوروبية '),
- (u' الاوروبيان ', u' الأوروبيان '),
- (u' الاوروبيتان ', u' الأوروبيتان '),
- (u' الاوروبيون ', u' الأوروبيون '),
- (u' الاوروبيات ', u' الأوروبيات '),
- (u' اسرائيلي ', u' إسرائيلي '),
- (u' اسرائيلية ', u' إسرائيلية '),
- (u' اسرائيليان ', u' إسرائيليان '),
- (u' اسرائيليتان ', u' إسرائيليتان '),
+ #(u' ,', u' ،'), #FIXME: Do not replace comma in non-Arabic text, interwiki, image links or <math> syntax.
+ (ur'\bإمرأة\b', u'امرأة'),
+ (ur'\bالى\b', ur'إلى'),
+ (ur'\bإسم\b', u'اسم'),
+ (ur'\bالأن\b', u'الآن'),
+ (ur'\bالة\b', u'آلة'),
+ (ur'\bفى\b', u'في'),
+ (ur'\bإبن\b', u'ابن'),
+ (ur'\bإبنة\b', u'ابنة'),
+ (ur'\bإقتصاد\b', u'اقتصاد'),
+ (ur'\bإجتماع\b', u'اجتماع'),
+ (ur'\bانجيل\b', u'إنجيل'),
+ (ur'\bاجماع\b', u'إجماع'),
+ (ur'\bاكتوبر\b', u'أكتوبر'),
+ (ur'\bإستخراج\b', u'استخراج'),
+ (ur'\bإستعمال\b', u'استعمال'),
+ (ur'\bإستبدال\b', u'استبدال'),
+ (ur'\bإشتراك\b', u'اشتراك'),
+ (ur'\bإستعادة\b', u'استعادة'),
+ (ur'\bإستقلال\b', u'استقلال'),
+ (ur'\bإنتقال\b', u'انتقال'),
+ (ur'\bإتحاد\b', u'اتحاد'),
+ (ur'\bاملاء\b', u'إملاء'),
+ (ur'\bإستخدام\b', u'استخدام'),
+ (ur'\bأحدى\b', u'إحدى'),
+ (ur'\bلاكن\b', u'لكن'),
+ (ur'\bإثنان\b', u'اثنان'),
+ (ur'\bشيئ\b', u'شيء'),
+ (ur'\bإحتياط\b', u'احتياط'),
+ (ur'\bإقتباس\b', u'اقتباس'),
+ (ur'\bادارة\b', u'إدارة'),
+ (ur'\bابناء\b', u'أبناء'),
+ (ur'\bالانصار\b', u'الأنصار'),
+ (ur'\bاشارة\b', u'إشارة'),
+ (ur'\bإقرأ\b', u'اقرأ'),
+ (ur'\bإمتياز\b', u'امتياز'),
+ (ur'\bارق\b', u'أرق'),
+ (ur'\bاللة\b', u'الله'),
+ (ur'\bإختبار\b', u'اختبار'),
+ (ur'==[ ]?روابط خارجية[ ]?==', u'== وصلات خارجية =='),
+ (ur'\bارسال\b', u'إرسال'),
+ (ur'\bإتصالات\b', u'اتصالات'),
+ (ur'\bابو\b', u'أبو'),
+ (ur'\bابا\b', u'أبا'),
+ (ur'\bاخو\b', u'أخو'),
+ (ur'\bاخا\b', u'أخا'),
+ (ur'\bاخي\b', u'أخي'),
+ (ur'\bاحد\b', u'أحد'),
+ (ur'\bاربعاء\b', u'أربعاء'),
+ #(ur'\bاول\b', u'أول'), #FIXME: Do not replace this (and all others) in interwiki links. This is an Arabic typo, but it is correct in Farsi.
+ (ur'\b(ال|)اهم\b', ur'\1أهم'),
+ (ur'\b(ال|)اثقل\b', ur'\1أثقل'),
+ (ur'\b(ال|)امجد\b', ur'\1أمجد'),
+ (ur'\b(ال|)اوسط\b', ur'\1أوسط'),
+ (ur'\b(ال|)اشقر\b', ur'\1أشقر'),
+ (ur'\b(ال|)انور\b', ur'\1أنور'),
+ (ur'\b(ال|)اصعب\b', ur'\1أصعب'),
+ (ur'\b(ال|)اسهل\b', ur'\1أسهل'),
+ (ur'\b(ال|)اجمل\b', ur'\1أجمل'),
+ (ur'\b(ال|)اقبح\b', ur'\1أقبح'),
+ (ur'\b(ال|)اطول\b', ur'\1أطول'),
+ (ur'\b(ال|)اقصر\b', ur'\1أقصر'),
+ (ur'\b(ال|)اسمن\b', ur'\1أسمن'),
+ (ur'\b(ال|)اذكى\b', ur'\1أذكى'),
+ (ur'\b(ال|)اكثر\b', ur'\1أكثر'),
+ (ur'\b(ال|)افضل\b', ur'\1أفضل'),
+ (ur'\b(ال|)اكبر\b', ur'\1أكبر'),
+ (ur'\b(ال|)اشهر\b', ur'\1أشهر'),
+ (ur'\b(ال|)ابطأ\b', ur'\1أبطأ'),
+ (ur'\b(ال|)اماني\b', ur'\1أماني'),
+ (ur'\b(ال|)احلام\b', ur'\1أحلام'),
+ (ur'\b(ال|)اسماء\b', ur'\1أسماء'),
+ (ur'\b(ال|)اسامة\b', ur'\1أسامة'),
+ (ur'\bابراهيم\b', u'إبراهيم'),
+ (ur'\bاسماعيل\b', u'إسماعيل'),
+ (ur'\bايوب\b', u'أيوب'),
+ (ur'\bايمن\b', u'أيمن'),
+ (ur'\bاوزبكستان\b', u'أوزبكستان'),
+ (ur'\bاذربيجان\b', u'أذربيجان'),
+ (ur'\bافغانستان\b', u'أفغانستان'),
+ (ur'\bانجلترا\b', u'إنجلترا'),
+ (ur'\bايطاليا\b', u'إيطاليا'),
+ (ur'\bاوربا\b', u'أوروبا'),
+ (ur'\bأوربا\b', u'أوروبا'),
+ (ur'\bاوغندة\b', u'أوغندة'),
+ (ur'\b(ال|)ا(لماني|فريقي|سترالي)(ا|ة|تان|ان|ين|ي|ون|و|ات|)\b', ur'\1أ\2\3'),
+ (ur'\b(ال|)ا(وروب|مريك)(ا|ي|ية|يتان|يان|يين|يي|يون|يو|يات|)\b', ur'\1أ\2\3'),
+ (ur'\b(ال|)ا(ردن|رجنتين|وغند|سبان|وكران|فغان)(ي|ية|يتان|يان|يين|يي|يون|يو|يات|)\b', ur'\1أ\2\3'),
+ (ur'\b(ال|)ا(سرائيل|يران|مارات|نكليز|نجليز)(ي|ية|يتان|يان|يين|يي|يون|يو|يات|)\b', ur'\1إ\2\3'),
+ (ur'\b(ال|)(ا|أ)(رثوذكس|رثوذوكس)(ي|ية|يتان|يان|يين|يي|يون|يو|يات|)\b', ur'\1أرثوذكس\4'),
+ (ur'\bإست(عمل|خدم|مر|مد|مال|عاض|قام|حال|جاب|قال|زاد|عان|طال)(ت|ا|وا|)\b', ur'است\1\2'),
+ (ur'\bإست(حال|قال|طال|زاد|عان|قام|راح|جاب|عاض|مال)ة\b', ur'است\1ة'),
]
},
'specialpages': {
@@ -560,7 +523,7 @@
(u'Special:Listgrouprights', u'Special:ListGroupRights'),
(u'Special:Listusers', u'Special:ListUsers'),
(u'Special:Newimages', u'Special:NewImages'),
- (u'Special:Prefixindex', u'Special:PrefixIndex'),
+ (u'Special:Prefixindex', u'Special:PrefixIndex'),
(u'Special:Protectedpages', u'Special:ProtectedPages'),
(u'Special:Recentchanges', u'Special:RecentChanges'),
(u'Special:Specialpages', u'Special:SpecialPages'),