Quantcast
Channel: प्रतिभास
Viewing all articles
Browse latest Browse all 103

अपने लिये फाण्ट परिवर्तक प्रोग्राम स्वयं लिखें

$
0
0

यूनिकोड के फायदे अब सब स्वीकारते हैं, सब जानते हैं। ऐतिहासिक रूप से कम्प्यूटर पर हिन्दी (और अन्य गैर-रोमन लिपीय भाषायें) बड़े टेढ़े-मेढ़े रास्ते तय करते हुए आयी। इसमें 'लिगेसी'फाण्ट का प्रयोग भी एक मुकाम था। शुशा, कृतिदेव, संस्कृत९९ और न जाने कितने फाण्ट प्रयोग होते थे। जितने लोग, उतने फाण्ट।


अच्छी बात ये है कि इन फाण्टों में ही बहुत सारी हिन्दी की उपयोगी सामग्री (कन्टेन्ट) सम्हालकर रखा हुआ है। जिनको यूनिकोड में बदकर अमर किया जा सकता है।



किसी भी हिन्दी फाण्ट परिवर्तक के मुख्यत: तीन भाग होते हैं -

१) पुराने (लिगेसी) संकेतों को संगत हिन्दी यूनिकोड संकेतों से प्रतिस्थापित करना

२) छोटी इ की मात्रा का स्थान बदलना

३) आधा र (अक्षरों के उपर लगने वाला र) का स्थान बदलना

कहने की जरूरत नहीं कि जो भी प्रोग्राम लिखा जायेगा, उसे इन तीनों कार्य करने पड़ेंगे।



पुराने संकेतों को यूनिकोड संकेतों से बदलना:

हर लिगेसी फाण्ट में हिन्दी के स्वरों, मात्राओं एवं ब्यंजनों के लिये कुछ कोड प्रयोग किया जाता है, जो अन्तत: एक संकेत के रूप में दिखता है। विभिन्न लिगेसी फाण्टों में ये संकेत कुछ समान होते हैं और ज्यादातर भिन्न। उदाहरण के लिये संस्कृत९९ मे लिगेसी फाण्ट के कुछ संकेत और यूनिकोड के संगत संकेत नीचे दिये गये हैं:

"k", "K", "Š", "o", "O", "g", "G", "¸"
"", "क्", "क्", "", "ख्", "", "ग्", ""



छोटी इ की मात्रा की समस्या :

लिगेसी फान्टों में अधिकतर छोटी इ की मात्रा को निम्नलिखित उदाहरण से समझा जा सकता है:

दिनके लिये संस्कृत९९ में idn लिखा गया होगा.

क्लिष्टको ikl;qलिखा गया होगा।

ध्यान दें कि छोटी इ की मात्रा के लिये i
का प्रयोग किया जा रहा है और यह जिस वर्ण पर लगनी है उसके ठीक पहले या उसके एक स्थान और पहले (दूसरे उदाहरण में) हो सकती है। जबकि यूनिकोड में छोटी इ की मात्रा के लिये आने वाला कोड , उस व्यंजन के कोड के बाद आता है।

दिन = द का कोड +
छोटीइ की मात्रा का कोड + न का कोड

स्थिति = स का कोड + हलन्त का कोड (स को आधा करने के लिये) + थ का कोड + छोटी इ की मात्रा का कोड + त का कोड + छोटी इ की मात्रा का कोड



आधे र की समस्या :
आधे र की समस्या, छोटी इ की समस्या के तरह ही, किन्तु इसके
ठीकउल्टा है।

उदाहरण :
तर्कका संस्कृत ९९ मे कोड tkRहै;
कर्ताका संकेत ktaRहै।

स्पष्ट है कि लिखने में जिस ब्यंजन के उपर आधा र लगाया जाता है, उसके बाद, या उस पर लगी मात्राओं के बाद आधे र का संकेत आता है।

किन्तु यूनिकोड में आधे र की स्थिति अलग है। उच्चारण की दृष्टि से आधा र, उस ब्यंजन के पहले आता है, जिसके उपर इसे लगाया जाता है। इसी लिये यूनिकोड में आधे र का कोड भी उस ब्यंजन के पहले आता है।

उदाहरण :

तर्क = त का यूनिकोड + आधे र का यूनिकोड + क का यूनिकोड

कर्ता = क का यूनिकोड + आधे र का यूनिकोड + त का यूनिकोड + आ की मात्रा का यूनिकोड


संस्कृत९९ को यूनिकोड में बदलने का प्रोग्राम का सोर्स कोड इस फाइलको वर्डपैड में खोलकर या किसी अन्य तरीके से देखा जा सकता है।


और भी कई मुद्दे हैं जैसे - लिगेसी में किस अक्षर के लिये कौन सा संकेत प्रयुक्त हुआ है, कैसे जानें ; एच टी एम एल और जावास्क्रिप्ट के किन कमाण्डों का प्रयोग किस काम के लिये करें; प्रोग्राम का फ्लोचार्ट कैसा होगा .. आदि मुद्दे अगली पोस्टों में विचारे जायेंगे।





Viewing all articles
Browse latest Browse all 103

Trending Articles



<script src="https://jsc.adskeeper.com/r/s/rssing.com.1596347.js" async> </script>