May 30, 2026

Namma Multimedia

The gold mine of tomorrow's world

🤖 “உள்ளூர் மொழிகளில் ChatGPT: தமிழ் மற்றும் பிற இந்திய மொழிகளில் AI இன் எழுச்சி”

ந்தியா பலதரப்பட்ட மொழிகளையும் கலாச்சாரங்களையும் கொண்ட ஒரு நாடு. ஏறக்குறைய 22 அங்கீகரிக்கப்பட்ட மொழிகள் இங்கு புழக்கத்தில் உள்ளன. இருப்பினும், இணையத்தில் உள்ள பெரும்பாலான தரவுகள், குறிப்பாக அதிநவீன செயற்கை நுண்ணறிவு (AI) கருவிகளான ChatGPT போன்றவற்றின் பயிற்சி தரவுகள், பெரும்பாலும் ஆங்கிலத்தை (English) மையமாகக் கொண்டே உள்ளன.

இந்தியாவின் அடுத்தகட்ட இணையப் புரட்சி, நகர்ப்புறங்களை விடுத்து, கிராமப்புறங்கள் மற்றும் சிறிய நகரங்களில் உள்ள அதிகரித்துவரும் இந்திய மொழிகளைப் பேசும் இணையப் பயனர்களைச் சார்ந்துள்ளது. இந்தக் கோடிக்கணக்கான பயனர்களுக்கு AI-இன் பயன்கள் முழுமையாகக் கிடைக்க வேண்டுமானால், அது அவர்களின் தாய்மொழியில் இயங்குவது கட்டாயமாகிறது.

🌟 ChatGPT மற்றும் LLM-களின் (Large Language Models) தமிழ் மற்றும் இந்திய மொழிப் பங்களிப்பு

OpenAI-இன் ChatGPT மற்றும் Google-இன் Gemini போன்ற பெரிய மொழி மாதிரிகள் (LLMs) பல மொழிகளில் பதிலளிக்கத் தொடங்கினாலும், ஆரம்பத்தில் இந்திய மொழிகளில் அதன் துல்லியமும் வேகமும் குறைவாகவே இருந்தது. ஆனால், சமீபத்திய தொழில்நுட்ப முன்னேற்றங்கள் இந்தப் போக்கினை மாற்றியுள்ளன:

  1. பயிற்சி தரவுகளில் விரிவாக்கம் (Expansion in Training Data): இந்திய மொழிகளில் உள்ள புத்தகங்கள், இணையப் பக்கங்கள், விக்கிப்பீடியா தரவுகள் மற்றும் இலக்கியங்களைச் சேகரித்து LLM-களுக்குப் பயிற்சி அளிப்பதன் மூலம், அந்த மொழிகளின் நுணுக்கங்கள், இலக்கணம் மற்றும் கலாச்சாரச் சூழலை (Cultural Context) AI புரிந்துகொள்ளத் தொடங்கியுள்ளது.
  2. Multilingual Embeddings: பல மொழிகளுக்குப் பொதுவான வார்த்தை அடையாளங்களைப் (Word Representations) பயன்படுத்துவதன் மூலம், ஒரு மொழியில் AI கற்றதை மற்ற மொழிகளிலும் பயன்படுத்த முடிகிறது. இது இந்திய மொழிகளுக்கிடையேயான பொதுவான வேர்ச்சொற்களைப் (Root Words) புரிந்துகொள்ள உதவுகிறது.
  3. மாற்றுச் சொற்கள் (Transliteration) மற்றும் குறியீட்டு மாற்றம் (Code-Switching): ஆங்கிலம் கலந்த தமிழ் அல்லது இந்தி போன்ற பேச்சுவழக்குகளை AI இனம் கண்டு, அதற்கேற்பப் பதிலளிக்கும் திறன் மேம்பட்டுள்ளது.

    உதாரணம்: “IPL Score என்ன?” என்று கேட்டால், அது கிரிக்கெட் ஸ்கோரை தமிழில் வழங்கும்.

🎯 பிராந்திய AI நிறுவனங்களின் எழுச்சி

உலகளாவிய நிறுவனங்கள் தவிர, இந்திய மொழிகளில் பிரத்தியேகமாகச் செயல்படும் பல AI நிறுவனங்களும் முயற்சிகளை மேற்கொண்டுள்ளன.

நிறுவனம்/முயற்சி முக்கியத்துவம் மொழிப் பங்களிப்பு
Bhashini (பாஷிணி) மத்திய அரசின் தேசிய AI மொழி இயங்குதளம். பல இந்திய மொழிகளுக்கு இடையேயான மொழிபெயர்ப்பு மற்றும் உள்ளூர்மயமாக்கலை எளிதாக்குகிறது. இந்தி, தமிழ், தெலுங்கு, கன்னடம், பெங்காலி உள்ளிட்ட 10+ மொழிகள்.
Sarvam AI (சர்வம AI) இந்திய மொழிகளில் கவனம் செலுத்தும் ஒரு ஸ்டார்ட்அப். குறிப்பாக இந்தியாவில் உள்ள வணிகங்கள் மற்றும் பயன்பாடுகளுக்காக இந்திய LLM-களை உருவாக்கி வருகிறது. முக்கியமாக இந்தி, மராத்தி மற்றும் தமிழ்.
TamilGPT / Thamizhi தமிழின் தனித்துவமான இலக்கண மற்றும் இலக்கியச் செழுமையைப் புரிந்துகொள்ளப் பயிற்சி அளிக்கப்பட்ட மாதிரி முயற்சிகள். தமிழ்.

இந்த பிராந்திய முயற்சிகள், வெறும் மொழிபெயர்ப்பை (Translation)த் தாண்டி, உள்ளூர் மக்களுக்குத் தேவையான நிதிச் சேவைகள் (Financial Services), சட்ட ஆலோசனைகள் (Legal Advice) மற்றும் அரசாங்கச் சேவைகளை (Government Services) அவர்களது தாய்மொழியில் வழங்குவதைக் குறிக்கோளாகக் கொண்டுள்ளன.

💡 பல்துறைப் பயன்பாடுகள் (Sectoral Applications)

உள்ளூர் மொழிகளில் AI இன் எழுச்சி பல துறைகளில் புரட்சியை ஏற்படுத்தி வருகிறது:

  1. கல்வி (Education): தமிழ் மற்றும் பிற மாநில மொழிகளில் பாடப்புத்தகங்களைச் சுருக்கம் செய்தல், மாணவர்களின் கேள்விகளுக்கு விளக்கமளித்தல், மற்றும் சந்தேகங்களைத் தாய்மொழியில் தீர்ப்பது.
  2. விவசாயம் (Agriculture): பிராந்திய தட்பவெப்பநிலை, மண் வகை மற்றும் பயிர்ச் சாகுபடி நுட்பங்கள் குறித்து உள்ளூர் விவசாயிகள் தங்கள் மொழியில் AI-இடம் ஆலோசனைகள் பெறுதல்.
  3. சுகாதாரம் (Healthcare): நோயாளியின் மருத்துவ அறிக்கைகளைத் தாய்மொழியில் சுருக்கி அளித்தல் மற்றும் சுகாதாரப் பராமரிப்பு குறித்த வழிகாட்டிகளை எளிமையாகப் புரிய வைத்தல்.
  4. இ-கவர்னன்ஸ் (e-Governance): அரசின் திட்டங்கள், விண்ணப்பப் படிவங்கள் மற்றும் சட்டதிட்டங்களை உள்ளூர் மொழிகளில் புரிந்துகொள்ள AI கருவிகள் உதவுவது.

⚠️ சவால்களும் முன் உள்ள தடைகளும்

இந்திய மொழிகளில் AI எழுச்சி பெறுவதில் பல சவால்கள் உள்ளன:

  • தரவுப் பற்றாக்குறை (Data Scarcity): ஆங்கிலத்துடன் ஒப்பிடுகையில், தமிழ், தெலுங்கு போன்ற மொழிகளில் உயர்தர, சீரான இலக்கணத்துடன் கூடிய ஆன்லைன் பயிற்சி தரவுகள் மிகவும் குறைவாகவே உள்ளன.
  • வட்டார வழக்குகள் (Dialects): ஒவ்வொரு மொழிக்கும் பேச்சுவழக்குகள் மற்றும் வட்டார மொழிகள் மாறுபடும். இந்த மாறுபாடுகளை AI மாதிரி புரிந்துகொள்வது கடினம்.
  • நிதிச் சவால்கள்: ஒரு பிராந்திய மொழிக்காக ஒரு LLM-ஐப் பயிற்றுவிப்பதற்கு அதிக அளவில் கணினி வளம் (Computational Power) மற்றும் முதலீடு தேவைப்படுகிறது.

🚀 முடிவும் அடுத்த கட்டமும்

“உள்ளூர் மொழிகளில் ChatGPT: தமிழ் மற்றும் பிற இந்திய மொழிகளில் AI இன் எழுச்சி” என்பது வெறும் தொழில்நுட்ப முன்னேற்றம் அல்ல; இது இந்தியாவின் டிஜிட்டல் சமத்துவத்திற்கான (Digital Equity) ஒரு படி. AI, இந்தியாவின் மொழியியல் பன்முகத்தன்மையை அங்கீகரித்து, அதை மேம்படுத்துவதன் மூலம், கிராமப்புறப் பயனர்கள் உலகளாவிய தகவல்களையும் வாய்ப்புகளையும் அணுக முடியும்.

வரும் ஆண்டுகளில், உள்ளூர் மொழிகளில் AI-இன் துல்லியம் மற்றும் பயன்பாட்டுத் தரம் மேலும் உயர, இது இந்தியாவில் தொழில்நுட்பத்தை அனைவரும் அணுகக்கூடியதாக மாற்றுவதில் ஒரு முக்கிய திருப்புமுனையாக அமையும் என்பதில் சந்தேகமில்லை.

Spread the love
error: Content is protected !!