Send Tawikisource mailing list submissions to
tawikisource@lists.wikimedia.org
To subscribe or unsubscribe via the World Wide Web, visit
https://lists.wikimedia.org/mailman/listinfo/tawikisource
or, via email, send a message with subject or body 'help' to
tawikisource-request@lists.wikimedia.org
You can reach the person managing the list at
tawikisource-owner@lists.wikimedia.org
When replying, please edit your Subject line so it is more specific
than "Re: Contents of Tawikisource digest..."
Today's Topics:
1. தமிழ் ஆங்கிலம் அல்லாத
எழுத்துக்கள் (balaji)
------------------------------------------------------------ ----------
Message: 1
Date: Tue, 27 Feb 2018 02:23:19 +0530
From: balaji <balajijagadesh@gmail.com>
To: tawikisource@lists.wikimedia.org
Subject: [Tawikisource] தமிழ் ஆங்கிலம்
அல்லாத எழுத்துக்கள்
Message-ID:
<CAE5qzKEyKHKQK9W4m_8Mn_y3-KihWhX7XwaUfJt31Lbk-yAwbQ@ >mail.gmail.com
Content-Type: text/plain; charset="utf-8"
விக்கிமூலத்தில் தமிழ் ஆங்கிலம் அல்லாத எழுத்துகள் அதிகமாக உள்ளது. அவைகளை
நீக்குவதற்கு தானியங்கி வழி ஒன்றை சோதித்துக்கொண்டிருக்கிறேன்.
தமிழ், ஆங்கிலம், கிரேக்கம், கணிதம், பொது குறியீடுகள், எண்கள் தவிர மற்றவைகளை
நீக்குமாறு regexஇல்
தேடு:
([^\u0B80-\u0BFF\x00-\x7F\u2000-\u206F\u2200-\u22FF\ u0370-\u03FF\ufeff\u2070-\ u209F])+
மாற்று:
முறையில் முயற்சி செய்கிறேன்.
இதில் ஏதாவது பிழை யிருக்கக் கூடுமா? வேறு முறை உள்ளதா? இந்த முறையில்
superscript அழிக்கப்படுகிறது. அதற்கு என்ன வழி?
நன்றி.
அன்புடன்
பாலாஜி
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <https://lists.wikimedia.org/pipermail/tawikisource/ >attachments/20180227/d31a4fd4/ attachment-0001.html
------------------------------
Subject: Digest Footer
_______________________________________________
Tawikisource mailing list
Tawikisource@lists.wikimedia.org
https://lists.wikimedia.org/mailman/listinfo/tawikisource
------------------------------
End of Tawikisource Digest, Vol 6, Issue 9
******************************************