The gold mine of tomorrow's world

AI சீக்ரெட்

AI கிளாட் எப்படி சிந்திக்கிறது? விஞ்ஞானிகள் ரகசியத்தை வெளியிட்டனர்!

Anthropic என்ற நிறுவனம் Claude என்ற அவர்களுடைய AI மாடலின் உள் செயல்பாடுகளைப் புரிந்து கொள்ள ஒரு புதுமையான ஆய்வை மேற்கொண்டுள்ளது. இந்த ஆய்வு “Neural Interpretability Research” என்று அழைக்கப்படுகிறது, அதாவது AI-யின் நரம்பியல் அமைப்பை விளக்குவதற்கான ஆய்வு. இதன் மூலம் Claude எப்படி “சிந்திக்கிறது”, முடிவுகளை எப்படி எடுக்கிறது என்பதை வெளிப்படுத்த முயற்சித்துள்ளனர். இந்த ஆய்வு AI-யின் பாதுகாப்பு மற்றும் வெளிப்படைத்தன்மையை மேம்படுத்துவதற்கு முக்கியமானது. இப்போது இதை முழுமையாக விளக்கட்டுமா?

Anthropic நிறுவனம் Claude என்ற அவர்களுடைய பெரிய மொழி மாடலின் (Large Language Model – LLM) உள் செயல்பாடுகளை ஆராய்ந்து, அதன் “சிந்தனை” செயல்முறையை புரிந்து கொள்ள முயற்சித்துள்ளது. AI மாடல்கள் பொதுவாக ஒரு “கருப்பு பெட்டி” (black box) போல செயல்படுகின்றன – அதாவது, நாம் உள்ளீடு (input) கொடுத்தால் பதில் (output) வருகிறது, ஆனால் அதற்கு நடுவே என்ன நடக்கிறது என்பது தெளிவாகத் தெரியாது. Anthropic இந்த மர்மத்தை உடைக்க முயன்றுள்ளது. அவர்கள் Claude 3.5 Haiku என்ற மாடலை எடுத்து, அதன் நரம்பியல் பாதைகளை (neural circuits) ஆராய்ந்து, எப்படி கருத்துகளை இணைத்து முடிவுகளை உருவாக்குகிறது என்பதைப் புரிந்து கொண்டுள்ளனர்.

இந்த ஆய்வு இரண்டு முக்கிய ஆவணங்களாக வெளியிடப்பட்டுள்ளது:

“Circuit Tracing: Revealing Computational Graphs in Language Models” – இதில் AI-யின் உள்ளே உள்ள கணினி பாதைகளை (computational circuits) கண்டறியும் முறைகள் விளக்கப்பட்டுள்ளன.

“On the Biology of a Large Language Model” – இதில் Claude-ன் 10 வெவ்வேறு நடத்தைகளை ஆராய்ந்து, அதன் “சிந்தனை” செயல்முறைகள் விவரிக்கப்பட்டுள்ளன.

முக்கிய கண்டுபிடிப்புகள்

பல மொழிகளில் ஒரே கருத்து அடிப்படை (Conceptual Universality):

Claude பல மொழிகளில் ஒரே மாதிரியான கருத்துகளை புரிந்து கொள்கிறது. அதாவது, ஒரு மொழியில் கற்றுக்கொண்டவற்றை மற்றொரு மொழியிலும் பயன்படுத்த முடிகிறது. உதாரணமாக, ஆங்கிலத்தில் “நாய்” என்ற கருத்தைப் புரிந்து கொண்டால், அதே கருத்தை தமிழில் “நாய்” என்று புரிந்து கொள்ளும் திறன் உள்ளது. இது ஒரு “பொது சிந்தனை மொழி” (language of thought) போல செயல்படுவதை காட்டுகிறது.

முன்கூட்டிய திட்டமிடல் (Planning Ahead):

Claude பதிலளிக்கும்போது ஒரு வார்த்தைக்குப் பிறகு ஒரு வார்த்தை என்று சிந்திப்பதில்லை. மாறாக, பல வார்த்தைகளுக்கு முன்னால் திட்டமிடுகிறது. உதாரணமாக, ஒரு பாடல் எழுதும்போது, அடுத்த வரியின் முடிவில் எந்த வார்த்தை ரைம் (rhyme) ஆக வரவேண்டும் என்பதை முன்கூட்டியே தீர்மானிக்கிறது.

கணித திறன் (Mental Arithmetic):

Claude ஒரு கால்குலேட்டர் போல வடிவமைக்கப்படவில்லை, ஆனால் அது “மனக் கணிதம்” செய்ய முடிகிறது. இது பயிற்சியின் மூலம் பதில்களை மனப்பாடம் செய்வதில்லை; மாறாக, சிக்கலான இணையான கணினி பாதைகளை (parallel computational paths) பயன்படுத்தி கணக்குகளை தீர்க்கிறது.

புனைவு பதில்கள் (Fabricated Reasoning):

சில சமயங்களில் Claude தனது சிந்தனை செயல்முறையை விளக்கும்போது, உண்மையான பகுத்தறிவை (logical reasoning) பிரதிபலிக்காமல், புனையப்பட்ட (fabricated) விளக்கங்களை அளிக்கிறது. இது பயனருக்கு ஏற்றவாறு பதிலை “அழகுபடுத்த” முயல்வதால் நிகழ்கிறது.

பிழைகள் மற்றும் ஹாலுசினேஷன்கள் (Hallucinations):

Claude பொதுவாக தெரியாதவற்றுக்கு பதிலளிக்க மறுக்கிறது. ஆனால் சில சமயங்களில் “தெரிந்த பதில்” என்ற நரம்பியல் அம்சம் தவறுதலாக செயல்படும்போது, தவறான அல்லது புனையப்பட்ட பதில்களை (hallucinations) அளிக்கிறது.

பாதுகாப்பு பாதிப்புகள் (Vulnerability to Jailbreaks):

Claude-ன் இலக்கண ஒருமைப்பாட்டை (grammatical coherence) பயன்படுத்தி, அதை “jailbreak” செய்ய முடியும் – அதாவது, பாதுகாப்பு விதிகளை மீறி தடை செய்யப்பட்ட தகவல்களை வெளியிட வைக்க முடியும்.

இந்த ஆய்வு எப்படி நடந்தது?

Anthropic ஆராய்ச்சியாளர்கள் “circuit tracing” மற்றும் “attribution graphs” என்ற புதிய முறைகளை உருவாக்கினர். இவை நரம்பியல் அறிவியலில் (neuroscience) உள்ள முறைகளால் ஈர்க்கப்பட்டவை. இதன் மூலம்:

Claude-ன் உள்ளே உள்ள நரம்பியல் “பாதைகளை” (circuits) கண்டறிந்தனர்.

ஒரு உள்ளீடு (input) எப்படி பதிலாக (output) மாறுகிறது என்பதை படிப்படியாக ஆராய்ந்தனர்.

பல்வேறு பணிகளில் (எ.கா., கவிதை எழுதுதல், கணிதம், மருத்துவ பகுப்பாய்வு) Claude எப்படி செயல்படுகிறது என்பதை புரிந்து கொண்டனர்.

இதற்கு அவர்கள் Claude 3.5 Haiku என்ற சிறிய மாடலைப் பயன்படுத்தினர், ஏனெனில் இது ஆராய்ச்சிக்கு ஏற்ற அளவில் உள்ளது.

இதன் முக்கியத்துவம் என்ன?

வெளிப்படைத்தன்மை (Transparency):

AI-யின் உள் செயல்பாடுகளை புரிந்து கொள்வது, அதன் முடிவுகளை நம்பகமானதாக மாற்ற உதவுகிறது. பயனர்கள் ஏன் ஒரு பதில் வந்தது என்பதை அறிய முடியும்.

பாதுகாப்பு (Safety):

AI தவறான அல்லது ஆபத்தான பதில்களை அளிப்பதை தடுக்க, அதன் சிந்தனை செயல்முறையை கண்காணிக்க முடியும். உதாரணமாக, புனைவு பதில்களை அல்லது ஜெயில்பிரேக் முயற்சிகளை கண்டறியலாம்.

மேம்பாடு (Improvement):

இந்த ஆய்வு AI-யை மேலும் திறமையாகவும், மனித மதிப்புகளுக்கு ஏற்பவும் (aligned) வடிவமைக்க உதவும்.

வரம்புகள்

இந்த முறை இன்னும் முழுமையடையவில்லை. ஒரு சிறிய உள்ளீட்டுக்கு (tens of words) கூட பல மணி நேரம் ஆராய்ச்சி தேவைப்படுகிறது.

பெரிய மாடல்களுக்கு இதை அளவிடுவது (scale) சவாலாக உள்ளது.

Claude-ன் சிந்தனையை முழுவதுமாக புரிந்து கொள்ள இன்னும் முன்னேற்றங்கள் தேவை.

முத்தாய்ப்பு

Anthropic-ன் இந்த ஆய்வு AI-யை ஒரு “மைக்ரோஸ்கோப்” மூலம் ஆராய்ந்து, அதன் “உயிரியலை” (AI biology) புரிந்து கொள்ளும் முயற்சியாகும். இது Claude-ன் சிக்கலான மற்றும் ஆச்சரியமான உள் செயல்பாடுகளை வெளிப்படுத்தியுள்ளது. இதன் மூலம் AI-யை பாதுகாப்பாகவும், நம்பகமாகவும், வெளிப்படையாகவும் மாற்றுவதற்கான பாதை திறக்கப்பட்டுள்ளது. எதிர்காலத்தில் இது AI ஆராய்ச்சியில் ஒரு மைல்கல்லாக இருக்கலாம்!

– சுசிலா குமார்

Spread the love

Tags: AI AIResearch Anthropic ArtificialIntelligence ClaudeAI FutureOfAI TamilTechNews TechBreakthrough TechSecrets

AI சீக்ரெட்

டிஜிட்டல் குறியீடுகள்:ஏஐ நடத்தும் ரகசிய உரையாடலும்…எச்சரிக்கை மணியும்!

3 months ago nammaaanthai

AI சீக்ரெட்

ஒரிஜினல் எது? டூப்ளிகேட் எது?-ஏஐ எழுதிய புத்தகங்களை அடையாளம் காணும் ரகசிய வித்தைகள்!

3 months ago nammaaanthai

AI சீக்ரெட்

புரியாத புதிர்:தான் எடுத்த முடிவிற்கான காரணம் தெரியாமல் தடுமாறும் AI ‘மூளை’!

3 months ago nammaaanthai

டிஜிட்டல் குறியீடுகள்:ஏஐ நடத்தும் ரகசிய உரையாடலும்…எச்சரிக்கை மணியும்!

ஒரிஜினல் எது? டூப்ளிகேட் எது?-ஏஐ எழுதிய புத்தகங்களை அடையாளம் காணும் ரகசிய வித்தைகள்!

புரியாத புதிர்:தான் எடுத்த முடிவிற்கான காரணம் தெரியாமல் தடுமாறும் AI ‘மூளை’!

செய்தித் திருட்டைத் தடுக்கும் ஊடகப் படை: AI உலகிற்கு சவால் விடும் ‘தேர்ட் வே’!

எழுத்தையும் படத்தையும் சமமாகப் பார்க்கும் மல்டிமாடல் ஏஐ: தொழில்நுட்ப உலகின் புதிய மைல்கல்!

மனிதகுலத்தின் புதிய விடியல்: நோய்களை வென்று ஆயுளை நீட்டிக்குமா செயற்கை நுண்ணறிவு (AI)?

கூகுளின் ‘லிட்டில் செஃப்’: தொழில்நுட்ப உலகில் புரட்சியை ஏற்படுத்தும் ‘ரெமி’ AI ஏஜென்ட்!

ஐடி நிறுவனங்களின் ‘ஈகோ’ யுத்தம்: ரகசியங்களை காக்க நடக்கும் சட்டப் போராட்டம்!

தடுமாறும் சட்டங்கள்.. தடம் மாறும் AI!

செயற்கை நுண்ணறிவு:மூளையை மழுங்கடிக்கிறதா அல்லது மெருகேற்றுகிறதா?

மனித எல்லைகளுக்கு அப்பால்: ஏஐ எனும் சூப்பர்மேன் சக்தி!

விஞ்ஞானமும் மெய்ஞானமும்: குவாண்டம் இயற்பியலில் ஒளிந்திருக்கும் பிரபஞ்ச ரகசியம்!

செய்தித் திருட்டைத் தடுக்கும் ஊடகப் படை: AI உலகிற்கு சவால் விடும் ‘தேர்ட் வே’!

தேசிய பாதுகாப்பு குறித்து தவறான தகவல்களை பரப்பிய மேலும் 16 யூடியூப் சேனல்களை முடக்கம்!

கோழி பண்ணை ஹாபியில் இறக்கிய தோனி!

பார்சிலோனா கால்பந்து தொடரில் ஸ்பெயின் அணியை வீழ்த்தி இந்திய ஜூனியர் அணி சாதனை!

மனித நேயம் மிகுந்த நம் சமுதாயத்தில் இருந்து மனிஷாக்கு வந்து குவிந்த உதவிகள்.!

துணை வேந்தர்கள் நியமனம்- மாநில அரசின் உரிமை” : முதல்வர் உரை!

ஐபிஎல்: மும்பையின் தொடர் தோல்வி குறித்து ரோகித் கமெண்ட் என்ன தெரியுமா?

பறவை மூலம் நாம் கற்க வேண்டிய வாழ்க்கைப் பாடம்!- வீடியோ

‘ஹோமம்’ எனப்படும் ‘அக்னி வழிபாடு’!- முழு விபரம்!

செய்தித் திருட்டைத் தடுக்கும் ஊடகப் படை: AI உலகிற்கு சவால் விடும் ‘தேர்ட் வே’!

எழுத்தையும் படத்தையும் சமமாகப் பார்க்கும் மல்டிமாடல் ஏஐ: தொழில்நுட்ப உலகின் புதிய மைல்கல்!

மனிதகுலத்தின் புதிய விடியல்: நோய்களை வென்று ஆயுளை நீட்டிக்குமா செயற்கை நுண்ணறிவு (AI)?

கூகுளின் ‘லிட்டில் செஃப்’: தொழில்நுட்ப உலகில் புரட்சியை ஏற்படுத்தும் ‘ரெமி’ AI ஏஜென்ட்!

ஐடி நிறுவனங்களின் ‘ஈகோ’ யுத்தம்: ரகசியங்களை காக்க நடக்கும் சட்டப் போராட்டம்!

தடுமாறும் சட்டங்கள்.. தடம் மாறும் AI!

செயற்கை நுண்ணறிவு:மூளையை மழுங்கடிக்கிறதா அல்லது மெருகேற்றுகிறதா?

மனித எல்லைகளுக்கு அப்பால்: ஏஐ எனும் சூப்பர்மேன் சக்தி!

விஞ்ஞானமும் மெய்ஞானமும்: குவாண்டம் இயற்பியலில் ஒளிந்திருக்கும் பிரபஞ்ச ரகசியம்!

Related Posts