Laude Institute ஆனது, Databricks மற்றும் Perplexity-இன் இணை நிறுவனர் ஆண்டி கொன்வின்ஸ்கியுடன் இணைந்து, K Prize என்ற ஒரு புதிய AI கோடிங் சவாலைத் தொடங்கியுள்ளது. இது, நிஜ உலகப் பிரச்சனைகளைத் தீர்க்கும் AI மாதிரிகளின் திறனைச் சோதிக்கும் நோக்கில் வடிவமைக்கப்பட்டுள்ளது.
K Prize-இன் முக்கியத்துவம் என்ன?
இந்த K Prize சவாலின் முதல் சுற்றில், பிரேசில் நாட்டைச் சேர்ந்த ப்ராம்ப்ட் இன்ஜினியர் Eduardo Rocha de Andrade வெறும் 7.5% மதிப்பெண் பெற்றும், $50,000 பரிசுத் தொகையை வென்றிருக்கிறார். இது எப்படி சாத்தியம்?
கொன்வின்ஸ்கியின் கூற்றுப்படி, இது ஒரு நல்ல செய்தி. ஏனென்றால், இந்த K Prize-இன் பெஞ்ச்மார்க் (தரநிலை) மிகவும் தெளிவாகவும், கடினமாகவும், ஏமாற்றுவதைத் தடுக்கும் வகையிலும் வடிவமைக்கப்பட்டுள்ளது.
ஏன் K Prize தேவைப்படுகிறது?
முன்னர் இதே போன்ற சோதனைகளுக்காகப் பயன்படுத்தப்பட்ட SWE-Bench போன்ற பெஞ்ச்மார்க்குகளில் சில சிக்கல்கள் இருந்தன. அதாவது, மாடல்கள் பயிற்சியின்போது ஏற்கெனவே உள்ள தரவுகளிலிருந்து (pretraining contamination) அதிக தகவல்களை உள்வாங்கி, “ஏமாற்றக்கூடிய” வகையில் செயல்படும் வாய்ப்பு இருந்தது. ஆனால் K Prize அத்தகைய குறைபாடுகள் இல்லாமல், AI மாதிரிகளின் உண்மையான, நிஜ உலகப் பிரச்சனைகளைத் தீர்க்கும் திறனை மட்டுமே சோதிக்கும் வகையில் உருவாக்கப்பட்டுள்ளது.
இதன் மூலம், AI மாடல்கள் எவ்வளவு சிறப்பாகக் கோடிங் செய்ய முடியும் என்பதையும், எவ்வளவு யதார்த்தமாகப் பிரச்சனைகளைத் தீர்க்க முடியும் என்பதையும், எந்தவித போலியான மேம்பாடுகளும் இல்லாமல் அளவிட முடியும் என்று ஆண்டி கொன்வின்ஸ்கி நம்புகிறார். இது AI கோடிங் திறனை அளவிடுவதில் ஒரு புதிய, நம்பகமான தரநிலையை உருவாக்கும் ஒரு முக்கியமான படியாகும்.
Related Posts
AI-ஆல் உருவாக்கப்பட்ட ‘காட்சி அனகிராம்கள்’ – மூளை பார்வையை உணரும் விதம் குறித்த புதிய ஆய்வு!
சாட்ஜிபிடியிடம் சிகிச்சையா? “உங்கள் ரகசியங்கள் வெளியே வரலாம்!”
Meta AI: இன்ஸ்டா, வாட்ஸ்அப், மெசஞ்சரில் தானாகப் பேசும் சாட்பாட்கள்!