AI என்பது சில நேரங்களில் ஒரு மாயாஜால தந்திரம் போல உணர்கிறது. நீங்கள் ஒரு சீரற்ற கேள்வியை தட்டச்சு செய்கிறீர்கள், பாம் - ஒரு நேர்த்தியான, மெருகூட்டப்பட்ட பதில் சில நொடிகளில் தோன்றும். ஆனால் இங்கே ஒரு வளைவு பந்து உள்ளது: ஒவ்வொரு "மேதை" இயந்திரத்திற்கும் பின்னால், அதை நகர்த்தி, சரிசெய்து, வடிவமைக்கும் உண்மையான நபர்கள் இருக்கிறார்கள். அந்த நபர்கள் AI பயிற்சியாளர்கள் , மேலும் அவர்கள் செய்யும் வேலை பெரும்பாலான மக்கள் கருதுவதை விட விசித்திரமானது, வேடிக்கையானது மற்றும் நேர்மையாக மிகவும் மனிதாபிமானமானது.
இந்தப் பயிற்சியாளர்கள் ஏன் முக்கியம், அவர்களின் அன்றாட வாழ்க்கை எப்படி இருக்கிறது, இந்தப் பாத்திரம் ஏன் யாரும் கணித்ததை விட வேகமாக வளர்கிறது என்பதைப் பற்றிப் பார்ப்போம்.
இதற்குப் பிறகு நீங்கள் படிக்க விரும்பக்கூடிய கட்டுரைகள்:
🔗 AI ஆர்பிட்ரேஜ் என்றால் என்ன: இந்த பிரபலமான வார்த்தைக்குப் பின்னால் உள்ள உண்மை
AI ஆர்பிட்ரேஜ், அதன் அபாயங்கள், நன்மைகள் மற்றும் பொதுவான தவறான கருத்துக்களை விளக்குகிறது.
🔗 AI-க்கான தரவு சேமிப்புத் தேவைகள்: நீங்கள் உண்மையில் தெரிந்து கொள்ள வேண்டியது
AI அமைப்புகளுக்கான சேமிப்புத் தேவைகள், அளவிடுதல் மற்றும் செயல்திறன் ஆகியவற்றை உள்ளடக்கியது.
🔗 AI இன் தந்தை யார்?
AI இன் முன்னோடிகளையும் செயற்கை நுண்ணறிவின் தோற்றத்தையும் ஆராய்கிறது.
ஒரு திடமான AI பயிற்சியாளரை உருவாக்குவது எது? 🏆
இது பட்டன்களை பிசைந்து விளையாடும் வேலை அல்ல. சிறந்த பயிற்சியாளர்கள் வித்தியாசமான திறமைகளின் கலவையை நம்பியிருக்கிறார்கள்:
-
பொறுமை (நிறைய) - மாடல்கள் ஒரே ஷாட்டில் கற்றுக்கொள்வதில்லை. பயிற்சியாளர்கள் அதே திருத்தங்களை அது ஒட்டிக்கொள்ளும் வரை தொடர்ந்து செய்து கொண்டே இருப்பார்கள்.
-
நுணுக்கத்தைக் கண்டறிதல் - கிண்டல், கலாச்சார சூழல் அல்லது சார்பு ஆகியவற்றைப் புரிந்துகொள்வது மனித கருத்துக்களுக்கு அதன் நன்மையைத் தருகிறது [1].
-
நேரடியான தொடர்பு - AI தவறாகப் புரிந்துகொள்ள முடியாத தெளிவான வழிமுறைகளை எழுதுவதே பாதி வேலை.
-
ஆர்வம் + நெறிமுறைகள் - ஒரு நல்ல பயிற்சியாளர் ஒரு பதில் "உண்மையில் சரியானதா" ஆனால் சமூக ரீதியாக செவிடாக இருக்கிறதா என்று கேள்வி எழுப்புகிறார் - இது AI மேற்பார்வையில் ஒரு முக்கிய கருப்பொருள் [2].
எளிமையாகச் சொன்னால்: ஒரு பயிற்சியாளர் பகுதி ஆசிரியர், பகுதி ஆசிரியர் மற்றும் ஒரு குறிப்பிட்ட நெறிமுறையாளர்.
AI பயிற்சியாளர் பாத்திரங்கள் பற்றிய ஒரு பார்வை (சில வினோதங்களுடன் 😉)
| பணி வகை | யாருக்கு மிகவும் பொருத்தமானது | வழக்கமான ஊதியம் | இது ஏன் வேலை செய்கிறது (அல்லது வேலை செய்யவில்லை) |
|---|---|---|---|
| தரவு லேபிளர் | நுணுக்கமான விவரங்களை விரும்பும் மக்கள் | குறைந்த–நடுத்தர $$ | மிகவும் முக்கியமானது; லேபிள்கள் ஒழுங்கற்றதாக இருந்தால், முழு மாதிரியும் பாதிக்கப்படுகிறது [3] 📊 |
| RLHF நிபுணர் | எழுத்தாளர்கள், ஆசிரியர்கள், ஆய்வாளர்கள் | நடுத்தரம்–உயர் $$ | மனித எதிர்பார்ப்புகளுடன் தொனியையும் தெளிவையும் சீரமைக்க பதில்களை தரவரிசைப்படுத்தி மீண்டும் எழுதுகிறது [1] |
| டொமைன் பயிற்சியாளர் | வழக்கறிஞர்கள், மருத்துவர்கள், நிபுணர்கள் | வரைபடம் முழுவதும் 💼 | தொழில் சார்ந்த அமைப்புகளுக்கான முக்கிய வாசகங்கள் மற்றும் விளிம்பு வழக்குகளைக் கையாளுகிறது. |
| பாதுகாப்பு மதிப்பாய்வாளர் | நெறிமுறை மனப்பான்மை கொண்டவர்கள் | நடுத்தர $$ | தீங்கு விளைவிக்கும் உள்ளடக்கத்தைத் தவிர்க்க AI வழிகாட்டுதல்களைப் பயன்படுத்துகிறது [2][5] |
| படைப்பு பயிற்சியாளர் | கலைஞர்கள், கதைசொல்லிகள் | கணிக்க முடியாதது 💡 | பாதுகாப்பான வரம்புகளுக்குள் இருக்கும்போது AI கற்பனையை எதிரொலிக்க உதவுகிறது [5] |
(ஆமாம், வடிவமைப்பு கொஞ்சம் குழப்பமாக இருக்கிறது - வேலையைப் போலவே இருக்கிறது.)
ஒரு AI பயிற்சியாளரின் வாழ்க்கையில் ஒரு நாள்
சரி, உண்மையான வேலை எப்படி இருக்கும்? கவர்ச்சியான கோடிங்கைக் குறைத்து, இன்னும் பலவற்றைச் சிந்தியுங்கள்:
-
AI-எழுதப்பட்ட பதில்களை மோசமானதில் இருந்து சிறந்தது வரை தரவரிசைப்படுத்துதல் (கிளாசிக் RLHF படி) [1].
-
குழப்பங்களை சரிசெய்தல் (மாடல் வீனஸ் செவ்வாய் அல்ல என்பதை மறந்துவிடுவது போல).
-
சாட்பாட் பதில்களை மிகவும் இயல்பாக ஒலிக்க மீண்டும் எழுதுதல்.
-
உரை, படங்கள் அல்லது ஆடியோவின் மலைகளை லேபிளிடுதல் - துல்லியம் உண்மையில் முக்கியமான இடத்தில் [3].
-
"தொழில்நுட்ப ரீதியாக சரியானது" என்பது போதுமானதா அல்லது பாதுகாப்பு வழிகாட்டுதல்கள் மீறப்பட வேண்டுமா என்பது குறித்து விவாதம் [2].
இது ஓரளவுக்கு குழப்பம், ஓரளவுக்கு புதிர். உண்மையைச் சொன்னால், ஒரு கிளிக்கு பேச மட்டும் கற்றுக்கொடுப்பதில்லை, வார்த்தைகளைத் தவறாகப் பயன்படுத்துவதை நிறுத்தவும் கற்றுக்கொடுப்பதை கற்பனை செய்து பாருங்கள் - அதுதான் நிலைமை. 🦜
பயிற்சியாளர்கள் நீங்கள் நினைப்பதை விட ஏன் மிகவும் முக்கியம்
மனிதர்கள் வழிநடத்தாமல், AI:
-
சத்தம் விறைப்பாகவும், ரோபோவாகவும் இருக்கிறது.
-
பரவலான சார்பு கட்டுப்படுத்தப்படாமல் (பயங்கரமான சிந்தனை).
-
நகைச்சுவை அல்லது பச்சாதாபத்தை முற்றிலும் இழக்கிறேன்.
-
முக்கியமான சூழல்களில் குறைவான பாதுகாப்பாக இருங்கள்.
பயிற்சியாளர்கள்தான் "குழப்பமான மனித விஷயங்களை" - பேச்சுவழக்கு, அரவணைப்பு, அவ்வப்போது வரும் மோசமான உருவகம் - உள்ளே பதுங்கிச் செல்கிறார்கள், அதே நேரத்தில் பொருட்களைப் பாதுகாப்பாக வைத்திருக்க பாதுகாப்புத் தடுப்புகளையும் பயன்படுத்துகிறார்கள் [2][5].
உண்மையில் கணக்கிட வேண்டிய திறன்கள்
உங்களுக்கு முனைவர் பட்டம் தேவை என்ற கட்டுக்கதையை மறந்துவிடுங்கள். மிகவும் உதவுவது:
-
எழுதுதல் + சாப்ஸ்களைத் திருத்துதல் - மெருகூட்டப்பட்ட ஆனால் இயற்கையாக ஒலிக்கும் உரை [1].
-
பகுப்பாய்வு சிந்தனை - மீண்டும் மீண்டும் மாதிரி தவறுகளைக் கண்டறிந்து சரிசெய்தல்.
-
கலாச்சார விழிப்புணர்வு - சொற்றொடர் தவறாகப் போகும்போது தெரிந்துகொள்வது [2].
-
பொறுமை - ஏனென்றால் AI உடனடியாகப் புரிந்து கொள்ளாது.
பன்மொழி திறன்கள் அல்லது சிறப்பு நிபுணத்துவத்திற்கான போனஸ் புள்ளிகள்.
பயிற்சியாளர்கள் வரும் இடம் 🌍
இந்த வேலை வெறும் சாட்பாட்களைப் பற்றியது மட்டுமல்ல - இது ஒவ்வொரு துறையிலும் ஊடுருவி வருகிறது:
-
சுகாதாரப் பராமரிப்பு - எல்லைக்கோட்டு நிகழ்வுகளுக்கான குறிப்பு விதிகளை எழுதுதல் (சுகாதார AI வழிகாட்டுதலில் எதிரொலித்தது) [2].
-
நிதி - மக்களை தவறான எச்சரிக்கைகளில் மூழ்கடிக்காமல் மோசடி-கண்டறிதல் அமைப்புகளுக்கு பயிற்சி அளித்தல் [2].
-
சில்லறை விற்பனை - பிராண்ட் தொனியில் ஒட்டிக்கொண்டு, கடைக்காரர்களின் பேச்சுவழக்கு மொழியைப் பெற கற்பித்தல் உதவியாளர்கள் [5].
-
கல்வி - ஆதரவளிப்பதற்குப் பதிலாக ஊக்கமளிக்கும் வகையில் பயிற்சிப் பாட்களை வடிவமைத்தல் [5].
அடிப்படையில்: AI க்கு மேஜையில் இருக்கை இருந்தால், பின்னணியில் ஒரு பயிற்சியாளர் மறைந்திருப்பார்.
நெறிமுறைகள் பகுதி (இதைத் தவிர்க்க முடியாது)
இங்கேதான் அது முக்கியத்துவம் பெறுகிறது. சரிபார்க்கப்படாமல் விட்டால், AI மீண்டும் மீண்டும் ஒரே மாதிரியான கருத்துக்களை, தவறான தகவல்களை அல்லது மோசமான தகவல்களைப் பரப்புகிறது. பயிற்சியாளர்கள் RLHF அல்லது அரசியலமைப்பு விதிகள் போன்ற முறைகளைப் பயன்படுத்தி மாதிரிகளை பயனுள்ள, பாதிப்பில்லாத பதில்களை நோக்கி வழிநடத்துவதன் மூலம் அதைத் தடுக்கிறார்கள் [1][5].
உதாரணம்: ஒரு பாட் சார்புடைய வேலை பரிந்துரைகளை முன்வைத்தால், ஒரு பயிற்சியாளர் அதைக் கொடியிடுவார், விதிப்புத்தகத்தை மீண்டும் எழுதுவார், மேலும் அது மீண்டும் நடக்காமல் பார்த்துக் கொள்வார். அது செயல்பாட்டில் மேற்பார்வை [2].
அவ்வளவு வேடிக்கையாக இல்லாத பக்கம்
இது எல்லாம் பளபளப்பாக இல்லை. பயிற்சியாளர்கள் இவற்றைக் கையாளுகிறார்கள்:
-
ஏகபோகம் - முடிவில்லா லேபிளிங் பழையதாகிவிடுகிறது.
-
உணர்ச்சி சோர்வு - தீங்கு விளைவிக்கும் அல்லது தொந்தரவான உள்ளடக்கத்தை மதிப்பாய்வு செய்வது ஒரு பாதிப்பை ஏற்படுத்தும்; ஆதரவு அமைப்புகள் மிக முக்கியமானவை [4].
-
அங்கீகாரம் இல்லாமை - பயனர்கள் பயிற்சியாளர்கள் இருப்பதை அரிதாகவே உணர்கிறார்கள்.
-
நிலையான மாற்றம் - கருவிகள் இடைவிடாமல் உருவாகின்றன, அதாவது பயிற்சியாளர்கள் தொடர்ந்து முன்னேற வேண்டும்.
இருப்பினும், பலருக்கு, தொழில்நுட்பத்தின் "மூளையை" வடிவமைப்பதில் உள்ள சிலிர்ப்பு அவர்களை அதில் ஈர்த்து வைத்திருக்கிறது.
AI இன் மறைக்கப்பட்ட MVPகள்
வேலை செய்யும் அமைப்புகளுக்கும் இடையிலான பாலம் . அவர்கள் இல்லாமல், AI என்பது நூலகர்கள் இல்லாத நூலகம் போல இருக்கும் - ஏராளமான தகவல்கள், ஆனால் பயன்படுத்த கிட்டத்தட்ட சாத்தியமற்றது.
அடுத்த முறை ஒரு சாட்பாட் உங்களை சிரிக்க வைக்கும்போதோ அல்லது ஆச்சரியப்படும் விதமாக "இசையுடன்" உணரும்போதோ, ஒரு பயிற்சியாளருக்கு நன்றி சொல்லுங்கள். அவை அமைதியான உருவங்கள், அவை இயந்திரங்களை கணக்கிடுவதை மட்டுமல்லாமல், இணைக்கவும் செய்கின்றன [1][2][5].
குறிப்புகள்
[1] ஓயாங், எல். மற்றும் பலர். (2022). மனித கருத்துகளுடன் வழிமுறைகளைப் பின்பற்ற மொழி மாதிரிகளைப் பயிற்றுவித்தல் (InstructGPT). நியூரிஐபிஎஸ். இணைப்பு
[2] NIST (2023). செயற்கை நுண்ணறிவு இடர் மேலாண்மை கட்டமைப்பு (AI RMF 1.0). இணைப்பு
[3] நார்த்கட், சி. மற்றும் பலர். (2021). சோதனைத் தொகுப்புகளில் பரவலான லேபிள் பிழைகள் இயந்திர கற்றல் வரையறைகளை சீர்குலைக்கின்றன. நியூரிஐபிஎஸ் தரவுத்தொகுப்புகள் & வரையறைகள். இணைப்பு
[4] WHO/ILO (2022). வேலையில் மன ஆரோக்கியம் குறித்த வழிகாட்டுதல்கள். இணைப்பு
[5] பாய், ஒய். மற்றும் பலர். (2022). அரசியலமைப்பு AI: AI இலிருந்து பாதிப்பில்லாத தன்மை கருத்து. arXiv. இணைப்பு