यूनिकोड के फायदे अब सब स्वीकारते हैं, सब जानते हैं। ऐतिहासिक रूप से कम्प्यूटर पर हिन्दी (और अन्य गैर-रोमन लिपीय भाषायें) बड़े टेढ़े-मेढ़े रास्ते तय करते हुए आयी। इसमें 'लिगेसी'फाण्ट का प्रयोग भी एक मुकाम था। शुशा, कृतिदेव, संस्कृत९९ और न जाने कितने फाण्ट प्रयोग होते थे। जितने लोग, उतने फाण्ट।
अच्छी बात ये है कि इन फाण्टों में ही बहुत सारी हिन्दी की उपयोगी सामग्री (कन्टेन्ट) सम्हालकर रखा हुआ है। जिनको यूनिकोड में बदकर अमर किया जा सकता है।
किसी भी हिन्दी फाण्ट परिवर्तक के मुख्यत: तीन भाग होते हैं -
१) पुराने (लिगेसी) संकेतों को संगत हिन्दी यूनिकोड संकेतों से प्रतिस्थापित करना
२) छोटी इ की मात्रा का स्थान बदलना
३) आधा र (अक्षरों के उपर लगने वाला र) का स्थान बदलना
कहने की जरूरत नहीं कि जो भी प्रोग्राम लिखा जायेगा, उसे इन तीनों कार्य करने पड़ेंगे।
पुराने संकेतों को यूनिकोड संकेतों से बदलना:
हर लिगेसी फाण्ट में हिन्दी के स्वरों, मात्राओं एवं ब्यंजनों के लिये कुछ कोड प्रयोग किया जाता है, जो अन्तत: एक संकेत के रूप में दिखता है। विभिन्न लिगेसी फाण्टों में ये संकेत कुछ समान होते हैं और ज्यादातर भिन्न। उदाहरण के लिये संस्कृत९९ मे लिगेसी फाण्ट के कुछ संकेत और यूनिकोड के संगत संकेत नीचे दिये गये हैं:
"k", "K", "Š", "o", "O", "g", "G", "¸"
"क", "क्", "क्", "ख", "ख्", "ग", "ग्", "घ"
छोटी इ की मात्रा की समस्या :
लिगेसी फान्टों में अधिकतर छोटी इ की मात्रा को निम्नलिखित उदाहरण से समझा जा सकता है:
दिनके लिये संस्कृत९९ में idn लिखा गया होगा.
क्लिष्टको ikl;qलिखा गया होगा।
ध्यान दें कि छोटी इ की मात्रा के लिये iका प्रयोग किया जा रहा है और यह जिस वर्ण पर लगनी है उसके ठीक पहले या उसके एक स्थान और पहले (दूसरे उदाहरण में) हो सकती है। जबकि यूनिकोड में छोटी इ की मात्रा के लिये आने वाला कोड , उस व्यंजन के कोड के बाद आता है।
दिन = द का कोड + छोटीइ की मात्रा का कोड + न का कोड
स्थिति = स का कोड + हलन्त का कोड (स को आधा करने के लिये) + थ का कोड + छोटी इ की मात्रा का कोड + त का कोड + छोटी इ की मात्रा का कोड
आधे र की समस्या :
आधे र की समस्या, छोटी इ की समस्या के तरह ही, किन्तु इसके ठीकउल्टा है।
उदाहरण :
तर्कका संस्कृत ९९ मे कोड tkRहै;
कर्ताका संकेत ktaRहै।
स्पष्ट है कि लिखने में जिस ब्यंजन के उपर आधा र लगाया जाता है, उसके बाद, या उस पर लगी मात्राओं के बाद आधे र का संकेत आता है।
किन्तु यूनिकोड में आधे र की स्थिति अलग है। उच्चारण की दृष्टि से आधा र, उस ब्यंजन के पहले आता है, जिसके उपर इसे लगाया जाता है। इसी लिये यूनिकोड में आधे र का कोड भी उस ब्यंजन के पहले आता है।
उदाहरण :
तर्क = त का यूनिकोड + आधे र का यूनिकोड + क का यूनिकोड
कर्ता = क का यूनिकोड + आधे र का यूनिकोड + त का यूनिकोड + आ की मात्रा का यूनिकोड
संस्कृत९९ को यूनिकोड में बदलने का प्रोग्राम का सोर्स कोड इस फाइलको वर्डपैड में खोलकर या किसी अन्य तरीके से देखा जा सकता है।
और भी कई मुद्दे हैं जैसे - लिगेसी में किस अक्षर के लिये कौन सा संकेत प्रयुक्त हुआ है, कैसे जानें ; एच टी एम एल और जावास्क्रिप्ट के किन कमाण्डों का प्रयोग किस काम के लिये करें; प्रोग्राम का फ्लोचार्ट कैसा होगा .. आदि मुद्दे अगली पोस्टों में विचारे जायेंगे।