இந்தியா பலதரப்பட்ட மொழிகளையும் கலாச்சாரங்களையும் கொண்ட ஒரு நாடு. ஏறக்குறைய 22 அங்கீகரிக்கப்பட்ட மொழிகள் இங்கு புழக்கத்தில் உள்ளன. இருப்பினும், இணையத்தில் உள்ள பெரும்பாலான தரவுகள், குறிப்பாக அதிநவீன செயற்கை நுண்ணறிவு (AI) கருவிகளான ChatGPT போன்றவற்றின் பயிற்சி தரவுகள், பெரும்பாலும் ஆங்கிலத்தை (English) மையமாகக் கொண்டே உள்ளன.
இந்தியாவின் அடுத்தகட்ட இணையப் புரட்சி, நகர்ப்புறங்களை விடுத்து, கிராமப்புறங்கள் மற்றும் சிறிய நகரங்களில் உள்ள அதிகரித்துவரும் இந்திய மொழிகளைப் பேசும் இணையப் பயனர்களைச் சார்ந்துள்ளது. இந்தக் கோடிக்கணக்கான பயனர்களுக்கு AI-இன் பயன்கள் முழுமையாகக் கிடைக்க வேண்டுமானால், அது அவர்களின் தாய்மொழியில் இயங்குவது கட்டாயமாகிறது.
🌟 ChatGPT மற்றும் LLM-களின் (Large Language Models) தமிழ் மற்றும் இந்திய மொழிப் பங்களிப்பு
OpenAI-இன் ChatGPT மற்றும் Google-இன் Gemini போன்ற பெரிய மொழி மாதிரிகள் (LLMs) பல மொழிகளில் பதிலளிக்கத் தொடங்கினாலும், ஆரம்பத்தில் இந்திய மொழிகளில் அதன் துல்லியமும் வேகமும் குறைவாகவே இருந்தது. ஆனால், சமீபத்திய தொழில்நுட்ப முன்னேற்றங்கள் இந்தப் போக்கினை மாற்றியுள்ளன:
- பயிற்சி தரவுகளில் விரிவாக்கம் (Expansion in Training Data): இந்திய மொழிகளில் உள்ள புத்தகங்கள், இணையப் பக்கங்கள், விக்கிப்பீடியா தரவுகள் மற்றும் இலக்கியங்களைச் சேகரித்து LLM-களுக்குப் பயிற்சி அளிப்பதன் மூலம், அந்த மொழிகளின் நுணுக்கங்கள், இலக்கணம் மற்றும் கலாச்சாரச் சூழலை (Cultural Context) AI புரிந்துகொள்ளத் தொடங்கியுள்ளது.
- Multilingual Embeddings: பல மொழிகளுக்குப் பொதுவான வார்த்தை அடையாளங்களைப் (Word Representations) பயன்படுத்துவதன் மூலம், ஒரு மொழியில் AI கற்றதை மற்ற மொழிகளிலும் பயன்படுத்த முடிகிறது. இது இந்திய மொழிகளுக்கிடையேயான பொதுவான வேர்ச்சொற்களைப் (Root Words) புரிந்துகொள்ள உதவுகிறது.
- மாற்றுச் சொற்கள் (Transliteration) மற்றும் குறியீட்டு மாற்றம் (Code-Switching): ஆங்கிலம் கலந்த தமிழ் அல்லது இந்தி போன்ற பேச்சுவழக்குகளை AI இனம் கண்டு, அதற்கேற்பப் பதிலளிக்கும் திறன் மேம்பட்டுள்ளது.
உதாரணம்: “IPL Score என்ன?” என்று கேட்டால், அது கிரிக்கெட் ஸ்கோரை தமிழில் வழங்கும்.
🎯 பிராந்திய AI நிறுவனங்களின் எழுச்சி
உலகளாவிய நிறுவனங்கள் தவிர, இந்திய மொழிகளில் பிரத்தியேகமாகச் செயல்படும் பல AI நிறுவனங்களும் முயற்சிகளை மேற்கொண்டுள்ளன.
இந்த பிராந்திய முயற்சிகள், வெறும் மொழிபெயர்ப்பை (Translation)த் தாண்டி, உள்ளூர் மக்களுக்குத் தேவையான நிதிச் சேவைகள் (Financial Services), சட்ட ஆலோசனைகள் (Legal Advice) மற்றும் அரசாங்கச் சேவைகளை (Government Services) அவர்களது தாய்மொழியில் வழங்குவதைக் குறிக்கோளாகக் கொண்டுள்ளன.
💡 பல்துறைப் பயன்பாடுகள் (Sectoral Applications)
உள்ளூர் மொழிகளில் AI இன் எழுச்சி பல துறைகளில் புரட்சியை ஏற்படுத்தி வருகிறது:
- கல்வி (Education): தமிழ் மற்றும் பிற மாநில மொழிகளில் பாடப்புத்தகங்களைச் சுருக்கம் செய்தல், மாணவர்களின் கேள்விகளுக்கு விளக்கமளித்தல், மற்றும் சந்தேகங்களைத் தாய்மொழியில் தீர்ப்பது.
- விவசாயம் (Agriculture): பிராந்திய தட்பவெப்பநிலை, மண் வகை மற்றும் பயிர்ச் சாகுபடி நுட்பங்கள் குறித்து உள்ளூர் விவசாயிகள் தங்கள் மொழியில் AI-இடம் ஆலோசனைகள் பெறுதல்.
- சுகாதாரம் (Healthcare): நோயாளியின் மருத்துவ அறிக்கைகளைத் தாய்மொழியில் சுருக்கி அளித்தல் மற்றும் சுகாதாரப் பராமரிப்பு குறித்த வழிகாட்டிகளை எளிமையாகப் புரிய வைத்தல்.
- இ-கவர்னன்ஸ் (e-Governance): அரசின் திட்டங்கள், விண்ணப்பப் படிவங்கள் மற்றும் சட்டதிட்டங்களை உள்ளூர் மொழிகளில் புரிந்துகொள்ள AI கருவிகள் உதவுவது.
⚠️ சவால்களும் முன் உள்ள தடைகளும்
இந்திய மொழிகளில் AI எழுச்சி பெறுவதில் பல சவால்கள் உள்ளன:
- தரவுப் பற்றாக்குறை (Data Scarcity): ஆங்கிலத்துடன் ஒப்பிடுகையில், தமிழ், தெலுங்கு போன்ற மொழிகளில் உயர்தர, சீரான இலக்கணத்துடன் கூடிய ஆன்லைன் பயிற்சி தரவுகள் மிகவும் குறைவாகவே உள்ளன.
- வட்டார வழக்குகள் (Dialects): ஒவ்வொரு மொழிக்கும் பேச்சுவழக்குகள் மற்றும் வட்டார மொழிகள் மாறுபடும். இந்த மாறுபாடுகளை AI மாதிரி புரிந்துகொள்வது கடினம்.
- நிதிச் சவால்கள்: ஒரு பிராந்திய மொழிக்காக ஒரு LLM-ஐப் பயிற்றுவிப்பதற்கு அதிக அளவில் கணினி வளம் (Computational Power) மற்றும் முதலீடு தேவைப்படுகிறது.
🚀 முடிவும் அடுத்த கட்டமும்
“உள்ளூர் மொழிகளில் ChatGPT: தமிழ் மற்றும் பிற இந்திய மொழிகளில் AI இன் எழுச்சி” என்பது வெறும் தொழில்நுட்ப முன்னேற்றம் அல்ல; இது இந்தியாவின் டிஜிட்டல் சமத்துவத்திற்கான (Digital Equity) ஒரு படி. AI, இந்தியாவின் மொழியியல் பன்முகத்தன்மையை அங்கீகரித்து, அதை மேம்படுத்துவதன் மூலம், கிராமப்புறப் பயனர்கள் உலகளாவிய தகவல்களையும் வாய்ப்புகளையும் அணுக முடியும்.
வரும் ஆண்டுகளில், உள்ளூர் மொழிகளில் AI-இன் துல்லியம் மற்றும் பயன்பாட்டுத் தரம் மேலும் உயர, இது இந்தியாவில் தொழில்நுட்பத்தை அனைவரும் அணுகக்கூடியதாக மாற்றுவதில் ஒரு முக்கிய திருப்புமுனையாக அமையும் என்பதில் சந்தேகமில்லை.

Related Posts
ஏஐ உலகை வியக்க வைத்த பாரத மண்டபம்: இந்தியா ஏஐ தாக்கம் உச்சிமாநாடு!
ஏ ஐ துறையில் உலக குருவாகும் இந்தியா: டெல்லி உச்சிமாநாட்டின் சிறப்பம்சங்கள்.
இந்தியா & AI: 2035-க்குள் $607 பில்லியன் பொருளாதார இலக்கு