Revision: 5942 Author: wikipedian Date: 2008-10-09 23:35:13 +0000 (Thu, 09 Oct 2008)
Log Message: ----------- applied patch [ 2155727 ] Fixes.py patch
This patch is for updating Arabic language corrections in fixes.py. Created by [[User:OsamaK]]
Modified Paths: -------------- trunk/pywikipedia/fixes.py
Modified: trunk/pywikipedia/fixes.py =================================================================== --- trunk/pywikipedia/fixes.py 2008-10-09 16:18:16 UTC (rev 5941) +++ trunk/pywikipedia/fixes.py 2008-10-09 23:35:13 UTC (rev 5942) @@ -21,7 +21,7 @@ 'HTML': { 'regex': True, 'msg': { - 'ar':u'روبوت: تحويل/تصليح HTML', + 'ar':u'روبوت: تحويل/تصليح HTML', 'en':u'Robot: converting/fixing HTML', 'de':u'Bot: konvertiere/korrigiere HTML', 'fr':u'Robot: convertit/fixe HTML', @@ -155,7 +155,7 @@ 'syntax': { 'regex': True, 'msg': { - 'ar':u'بوت: تصليح تهيئة الويكي', + 'ar':u'بوت: تصليح تهيئة الويكي', 'de':u'Bot: Korrigiere Wiki-Syntax', 'en':u'Bot: Fixing wiki syntax', 'fr':u'Bot: Corrige wiki-syntaxe', @@ -225,7 +225,7 @@ 'syntax-safe': { 'regex': True, 'msg': { - 'ar':u'بوت: تصليح تهيئة الويكي', + 'ar':u'بوت: تصليح تهيئة الويكي', 'de':u'Bot: Korrigiere Wiki-Syntax', 'en':u'Bot: Fixing wiki syntax', 'fr':u'Bot: Corrige wiki-syntaxe', @@ -375,7 +375,7 @@ 'isbn': { 'regex': True, 'msg': { - 'ar': u'روبوت: تصليح صيغة ISBN', + 'ar': u'روبوت: تصليح صيغة ISBN', 'de': u'Bot: Korrigiere ISBN-Format', 'en': u'Robot: Fixing ISBN format', 'es': u'Arreglando formato ISBN', @@ -405,143 +405,106 @@ },
#Corrections for Arabic Wikipedia and any Arabic wiki. - #python replace.py -always -start:! -fix:correct-ar + #python replace.py -always -start:! -fix:correct-ar
'correct-ar': { - 'regex': False, + 'regex': True, 'msg': { - 'ar':u'تدقيق إملائي. 128 كلمة مستهدفة حاليًا.', + 'ar':u'تدقيق إملائي. 528 كلمة مستهدفة حاليًا.', }, 'replacements': [ - (u' ,', u' ،'), - (u' إمرأة ', u' امرأة '), - (u' الى ', u' إلى '), - (u' إسم ', u' اسم '), - (u' الأن ', u' الآن '), - (u' اول ', u' أول '), - (u' الة ', u' آلة '), - (u' فى ', u' في '), - (u' اثقل ', u' أثقل '), - (u' إبن ', u' ابن '), - (u' إبنة ', u' ابنة '), - (u' إقتصاد ', u' اقتصاد '), - (u' إجتماع ', u' اجتماع '), - (u' انجيل ', u' إنجيل '), - (u' اجماع ', u' إجماع '), - (u' امريكا ', u' أمريكا '), - (u' اوروبا ', u' أوروبا '), - (u' انجلترا ', u' إنجلترا '), - (u' اكتوبر ', u' أكتوبر '), - (u' اسرائيل ', u' إسرائيل '), - (u' المانيا ', u' ألمانيا '), - (u' ايطاليا ', u' إيطاليا '), - (u' ايران ', u' إيران '), - (u' إستخراج ', u' استخراج '), - (u' إستعمال ', u' استعمال '), - (u' إستبدال ', u' استبدال '), - (u' إشتراك ', u' اشتراك '), - (u' إستعادة ', u' استعادة '), - (u' إستقلال ', u' استقلال '), - (u' إنتقال ', u' انتقال '), - (u' إتحاد ', u' اتحاد '), - (u' املاء ', u' إملاء '), - (u' إستخدام ', u' استخدام '), - (u' أحدى ', u' إحدى '), - (u' لاكن ', u' لكن '), - (u' الاردن ', u' الأردن '), - (u' إثنان ', u' اثنان '), - (u' شيئ ', u' شيء '), - (u' إحتياط ', u' احتياط '), - (u' إقتباس ', u' اقتباس '), - (u' الامارات ', u' الإمارات '), - (u' اكثر ', u' أكثر '), - (u' افضل ', u' أفضل '), - (u' اكبر ', u' أكبر '), - (u' اشهر ', u' أشهر '), - (u' ادارة ', u' إدارة '), - (u' ابناء ', u' أبناء '), - (u' الانصار ', u' الأنصار '), - (u' اشارة ', u' إشارة '), - (u' إقرأ ', u' اقرأ '), - (u' إمتياز ', u' امتياز '), - (u' ارق ', u' أرق '), - (u' أرثوذوكس ', u' أرثوذكس '), - (u' الأرثوذوكس ', u' الأرثوذكس '), - (u' أرثوذوكسية ', u' أرثوذكسية '), - (u' الأرثوذوكسية ', u' الأرثوذكسية '), - (u' الأرثوذوكسي ', u' الأرثوذكسي '), - (u' ارثوذوكس ', u' أرثوذكس '), - (u' ارثوذوكسي ', u' أرثوذكسي '), - (u' ارثوذوكسية ', u' أرثوذكسية '), - (u' الارثوذوكسية ', u' الأرثوذكسية '), - (u' اللة ', u' الله '), - (u' إختبار ', u' اختبار '), - (u'== روابط خارجية ==', u'== وصلات خارجية =='), - (u'==روابط خارجية==', u'== وصلات خارجية =='), - (u' ارسال ', u' إرسال '), - (u' إتصالات ', u' اتصالات '), - (u' اسامة ', u' أسامة '), - (u' ابراهيم ', u' إبراهيم '), - (u' اسماعيل ', u' إسماعيل '), - (u' ايوب ', u' أيوب '), - (u' ايمن ', u' أيمن '), - (u' ابو ', u' أبو '), - (u' ابا ', u' أبا '), - (u' اخو ', u' أخو '), - (u' اخا ', u' أخا '), - (u' اخي ', u' أخي '), - (u' احد ', u' أحد '), - (u' اربعاء ', u' أربعاء '), - (u' اهم ', u' أهم '), - (u' اوزبكستان ', u' أوزبكستان '), - (u' اذربيجان ', u' أذربيجان '), - (u' افغانستان ', u' أفغانستان '), - (u' امجد ', u' أمجد '), - (u' اوسط ', u' أوسط '), - (u' اشقر ', u' أشقر '), - (u' انور ', u' أنور '), - (u' اصعب ', u' أصعب '), - (u' اسهل ', u' أسهل '), - (u' اجمل ', u' أجمل '), - (u' اقبح ', u' أقبح '), - (u' اطول ', u' أطول '), - (u' اقصر ', u' أقصر '), - (u' اسمن ', u' أسمن '), - (u' اذكى ', u' أذكى '), - (u' اماني ', u' أماني '), - (u' احلام ', u' أحلام '), - (u' اسماء ', u' أسماء '), - (u' ابطأ ', u' أبطأ '), - (u' اوربا ', u' أوروبا '), - (u' أوربا ', u' أوروبا '), - (u' امريكي ', u' أمريكي '), - (u' امريكية ', u' أمريكية '), - (u' امريكيان ', u' أمريكيان '), - (u' امريكيتان ', u' أمريكيتان '), - (u' امريكيون ', u' أمريكيون '), - (u' امريكيات ', u' أمريكيات '), - (u' الامريكي ', u' الأمريكي '), - (u' الامريكية ', u' الأمريكية '), - (u' الامريكيان ', u' الأمريكيان '), - (u' الامريكيتان ', u' الأمريكيتان '), - (u' الامريكيون ', u' الأمريكيون '), - (u' الامريكيات ', u' الأمريكيات '), - (u' اوروبي ', u' أوروبي '), - (u' اوروبية ', u' أوروبية '), - (u' اوروبيان ', u' أوروبيان '), - (u' اوروبيتان ', u' أوروبيتان '), - (u' اوروبيون ', u' أوروبيون '), - (u' اوروبيات ', u' أوروبيات '), - (u' الاوروبي ', u' الأوروبي '), - (u' الاوروبية ', u' الأوروبية '), - (u' الاوروبيان ', u' الأوروبيان '), - (u' الاوروبيتان ', u' الأوروبيتان '), - (u' الاوروبيون ', u' الأوروبيون '), - (u' الاوروبيات ', u' الأوروبيات '), - (u' اسرائيلي ', u' إسرائيلي '), - (u' اسرائيلية ', u' إسرائيلية '), - (u' اسرائيليان ', u' إسرائيليان '), - (u' اسرائيليتان ', u' إسرائيليتان '), + #(u' ,', u' ،'), #FIXME: Do not replace comma in non-Arabic text, interwiki, image links or <math> syntax. + (ur'\bإمرأة\b', u'امرأة'), + (ur'\bالى\b', ur'إلى'), + (ur'\bإسم\b', u'اسم'), + (ur'\bالأن\b', u'الآن'), + (ur'\bالة\b', u'آلة'), + (ur'\bفى\b', u'في'), + (ur'\bإبن\b', u'ابن'), + (ur'\bإبنة\b', u'ابنة'), + (ur'\bإقتصاد\b', u'اقتصاد'), + (ur'\bإجتماع\b', u'اجتماع'), + (ur'\bانجيل\b', u'إنجيل'), + (ur'\bاجماع\b', u'إجماع'), + (ur'\bاكتوبر\b', u'أكتوبر'), + (ur'\bإستخراج\b', u'استخراج'), + (ur'\bإستعمال\b', u'استعمال'), + (ur'\bإستبدال\b', u'استبدال'), + (ur'\bإشتراك\b', u'اشتراك'), + (ur'\bإستعادة\b', u'استعادة'), + (ur'\bإستقلال\b', u'استقلال'), + (ur'\bإنتقال\b', u'انتقال'), + (ur'\bإتحاد\b', u'اتحاد'), + (ur'\bاملاء\b', u'إملاء'), + (ur'\bإستخدام\b', u'استخدام'), + (ur'\bأحدى\b', u'إحدى'), + (ur'\bلاكن\b', u'لكن'), + (ur'\bإثنان\b', u'اثنان'), + (ur'\bشيئ\b', u'شيء'), + (ur'\bإحتياط\b', u'احتياط'), + (ur'\bإقتباس\b', u'اقتباس'), + (ur'\bادارة\b', u'إدارة'), + (ur'\bابناء\b', u'أبناء'), + (ur'\bالانصار\b', u'الأنصار'), + (ur'\bاشارة\b', u'إشارة'), + (ur'\bإقرأ\b', u'اقرأ'), + (ur'\bإمتياز\b', u'امتياز'), + (ur'\bارق\b', u'أرق'), + (ur'\bاللة\b', u'الله'), + (ur'\bإختبار\b', u'اختبار'), + (ur'==[ ]?روابط خارجية[ ]?==', u'== وصلات خارجية =='), + (ur'\bارسال\b', u'إرسال'), + (ur'\bإتصالات\b', u'اتصالات'), + (ur'\bابو\b', u'أبو'), + (ur'\bابا\b', u'أبا'), + (ur'\bاخو\b', u'أخو'), + (ur'\bاخا\b', u'أخا'), + (ur'\bاخي\b', u'أخي'), + (ur'\bاحد\b', u'أحد'), + (ur'\bاربعاء\b', u'أربعاء'), + #(ur'\bاول\b', u'أول'), #FIXME: Do not replace this (and all others) in interwiki links. This is an Arabic typo, but it is correct in Farsi. + (ur'\b(ال|)اهم\b', ur'\1أهم'), + (ur'\b(ال|)اثقل\b', ur'\1أثقل'), + (ur'\b(ال|)امجد\b', ur'\1أمجد'), + (ur'\b(ال|)اوسط\b', ur'\1أوسط'), + (ur'\b(ال|)اشقر\b', ur'\1أشقر'), + (ur'\b(ال|)انور\b', ur'\1أنور'), + (ur'\b(ال|)اصعب\b', ur'\1أصعب'), + (ur'\b(ال|)اسهل\b', ur'\1أسهل'), + (ur'\b(ال|)اجمل\b', ur'\1أجمل'), + (ur'\b(ال|)اقبح\b', ur'\1أقبح'), + (ur'\b(ال|)اطول\b', ur'\1أطول'), + (ur'\b(ال|)اقصر\b', ur'\1أقصر'), + (ur'\b(ال|)اسمن\b', ur'\1أسمن'), + (ur'\b(ال|)اذكى\b', ur'\1أذكى'), + (ur'\b(ال|)اكثر\b', ur'\1أكثر'), + (ur'\b(ال|)افضل\b', ur'\1أفضل'), + (ur'\b(ال|)اكبر\b', ur'\1أكبر'), + (ur'\b(ال|)اشهر\b', ur'\1أشهر'), + (ur'\b(ال|)ابطأ\b', ur'\1أبطأ'), + (ur'\b(ال|)اماني\b', ur'\1أماني'), + (ur'\b(ال|)احلام\b', ur'\1أحلام'), + (ur'\b(ال|)اسماء\b', ur'\1أسماء'), + (ur'\b(ال|)اسامة\b', ur'\1أسامة'), + (ur'\bابراهيم\b', u'إبراهيم'), + (ur'\bاسماعيل\b', u'إسماعيل'), + (ur'\bايوب\b', u'أيوب'), + (ur'\bايمن\b', u'أيمن'), + (ur'\bاوزبكستان\b', u'أوزبكستان'), + (ur'\bاذربيجان\b', u'أذربيجان'), + (ur'\bافغانستان\b', u'أفغانستان'), + (ur'\bانجلترا\b', u'إنجلترا'), + (ur'\bايطاليا\b', u'إيطاليا'), + (ur'\bاوربا\b', u'أوروبا'), + (ur'\bأوربا\b', u'أوروبا'), + (ur'\bاوغندة\b', u'أوغندة'), + (ur'\b(ال|)ا(لماني|فريقي|سترالي)(ا|ة|تان|ان|ين|ي|ون|و|ات|)\b', ur'\1أ\2\3'), + (ur'\b(ال|)ا(وروب|مريك)(ا|ي|ية|يتان|يان|يين|يي|يون|يو|يات|)\b', ur'\1أ\2\3'), + (ur'\b(ال|)ا(ردن|رجنتين|وغند|سبان|وكران|فغان)(ي|ية|يتان|يان|يين|يي|يون|يو|يات|)\b', ur'\1أ\2\3'), + (ur'\b(ال|)ا(سرائيل|يران|مارات|نكليز|نجليز)(ي|ية|يتان|يان|يين|يي|يون|يو|يات|)\b', ur'\1إ\2\3'), + (ur'\b(ال|)(ا|أ)(رثوذكس|رثوذوكس)(ي|ية|يتان|يان|يين|يي|يون|يو|يات|)\b', ur'\1أرثوذكس\4'), + (ur'\bإست(عمل|خدم|مر|مد|مال|عاض|قام|حال|جاب|قال|زاد|عان|طال)(ت|ا|وا|)\b', ur'است\1\2'), + (ur'\bإست(حال|قال|طال|زاد|عان|قام|راح|جاب|عاض|مال)ة\b', ur'است\1ة'), ] }, 'specialpages': { @@ -560,7 +523,7 @@ (u'Special:Listgrouprights', u'Special:ListGroupRights'), (u'Special:Listusers', u'Special:ListUsers'), (u'Special:Newimages', u'Special:NewImages'), - (u'Special:Prefixindex', u'Special:PrefixIndex'), + (u'Special:Prefixindex', u'Special:PrefixIndex'), (u'Special:Protectedpages', u'Special:ProtectedPages'), (u'Special:Recentchanges', u'Special:RecentChanges'), (u'Special:Specialpages', u'Special:SpecialPages'),