AI பயிற்சியாளர் என்றால் என்ன?

AI என்பது சில நேரங்களில் ஒரு மாயாஜால தந்திரம் போல உணர்கிறது. நீங்கள் ஒரு சீரற்ற கேள்வியை தட்டச்சு செய்கிறீர்கள், பாம் - ஒரு நேர்த்தியான, மெருகூட்டப்பட்ட பதில் சில நொடிகளில் தோன்றும். ஆனால் இங்கே ஒரு வளைவு பந்து உள்ளது: ஒவ்வொரு "மேதை" இயந்திரத்திற்கும் பின்னால், அதை நகர்த்தி, சரிசெய்து, வடிவமைக்கும் உண்மையான நபர்கள் இருக்கிறார்கள். அந்த நபர்கள் AI பயிற்சியாளர்கள் , மேலும் அவர்கள் செய்யும் வேலை பெரும்பாலான மக்கள் கருதுவதை விட விசித்திரமானது, வேடிக்கையானது மற்றும் நேர்மையாக மிகவும் மனிதாபிமானமானது.

இந்தப் பயிற்சியாளர்கள் ஏன் முக்கியம், அவர்களின் அன்றாட வாழ்க்கை எப்படி இருக்கிறது, இந்தப் பாத்திரம் ஏன் யாரும் கணித்ததை விட வேகமாக வளர்கிறது என்பதைப் பற்றிப் பார்ப்போம்.

இதற்குப் பிறகு நீங்கள் படிக்க விரும்பக்கூடிய கட்டுரைகள்:

🔗 AI ஆர்பிட்ரேஜ் என்றால் என்ன: இந்த பிரபலமான வார்த்தைக்குப் பின்னால் உள்ள உண்மை
AI ஆர்பிட்ரேஜ், அதன் அபாயங்கள், நன்மைகள் மற்றும் பொதுவான தவறான கருத்துக்களை விளக்குகிறது.

🔗 AI-க்கான தரவு சேமிப்புத் தேவைகள்: நீங்கள் உண்மையில் தெரிந்து கொள்ள வேண்டியது
AI அமைப்புகளுக்கான சேமிப்புத் தேவைகள், அளவிடுதல் மற்றும் செயல்திறன் ஆகியவற்றை உள்ளடக்கியது.

🔗 AI இன் தந்தை யார்?
AI இன் முன்னோடிகளையும் செயற்கை நுண்ணறிவின் தோற்றத்தையும் ஆராய்கிறது.

ஒரு திடமான AI பயிற்சியாளரை உருவாக்குவது எது? 🏆

இது பட்டன்களை பிசைந்து விளையாடும் வேலை அல்ல. சிறந்த பயிற்சியாளர்கள் வித்தியாசமான திறமைகளின் கலவையை நம்பியிருக்கிறார்கள்:

பொறுமை (நிறைய) - மாடல்கள் ஒரே ஷாட்டில் கற்றுக்கொள்வதில்லை. பயிற்சியாளர்கள் அதே திருத்தங்களை அது ஒட்டிக்கொள்ளும் வரை தொடர்ந்து செய்து கொண்டே இருப்பார்கள்.
நுணுக்கத்தைக் கண்டறிதல் - கிண்டல், கலாச்சார சூழல் அல்லது சார்பு ஆகியவற்றைப் புரிந்துகொள்வது மனித கருத்துக்களுக்கு அதன் நன்மையைத் தருகிறது [1].
நேரடியான தொடர்பு - AI தவறாகப் புரிந்துகொள்ள முடியாத தெளிவான வழிமுறைகளை எழுதுவதே பாதி வேலை.
ஆர்வம் + நெறிமுறைகள் - ஒரு நல்ல பயிற்சியாளர் ஒரு பதில் "உண்மையில் சரியானதா" ஆனால் சமூக ரீதியாக செவிடாக இருக்கிறதா என்று கேள்வி எழுப்புகிறார் - இது AI மேற்பார்வையில் ஒரு முக்கிய கருப்பொருள் [2].

எளிமையாகச் சொன்னால்: ஒரு பயிற்சியாளர் பகுதி ஆசிரியர், பகுதி ஆசிரியர் மற்றும் ஒரு குறிப்பிட்ட நெறிமுறையாளர்.

AI பயிற்சியாளர் பாத்திரங்கள் பற்றிய ஒரு பார்வை (சில வினோதங்களுடன் 😉)

பணி வகை	யாருக்கு மிகவும் பொருத்தமானது	வழக்கமான ஊதியம்	இது ஏன் வேலை செய்கிறது (அல்லது வேலை செய்யவில்லை)
தரவு லேபிளர்	நுணுக்கமான விவரங்களை விரும்பும் மக்கள்	குறைந்த–நடுத்தர $$	மிகவும் முக்கியமானது; லேபிள்கள் ஒழுங்கற்றதாக இருந்தால், முழு மாதிரியும் பாதிக்கப்படுகிறது [3] 📊
RLHF நிபுணர்	எழுத்தாளர்கள், ஆசிரியர்கள், ஆய்வாளர்கள்	நடுத்தரம்–உயர் $$	மனித எதிர்பார்ப்புகளுடன் தொனியையும் தெளிவையும் சீரமைக்க பதில்களை தரவரிசைப்படுத்தி மீண்டும் எழுதுகிறது [1]
டொமைன் பயிற்சியாளர்	வழக்கறிஞர்கள், மருத்துவர்கள், நிபுணர்கள்	வரைபடம் முழுவதும் 💼	தொழில் சார்ந்த அமைப்புகளுக்கான முக்கிய வாசகங்கள் மற்றும் விளிம்பு வழக்குகளைக் கையாளுகிறது
பாதுகாப்பு மதிப்பாய்வாளர்	நெறிமுறை மனப்பான்மை கொண்டவர்கள்	நடுத்தர $$	தீங்கு விளைவிக்கும் உள்ளடக்கத்தைத் தவிர்க்க AI வழிகாட்டுதல்களைப் பயன்படுத்துகிறது [2][5]
படைப்பு பயிற்சியாளர்	கலைஞர்கள், கதைசொல்லிகள்	கணிக்க முடியாதது 💡	பாதுகாப்பான வரம்புகளுக்குள் இருக்கும்போது AI கற்பனையை எதிரொலிக்க உதவுகிறது [5]

(ஆமாம், வடிவமைப்பு கொஞ்சம் குழப்பமாக இருக்கிறது - வேலையைப் போலவே இருக்கிறது.)

ஒரு AI பயிற்சியாளரின் வாழ்க்கையில் ஒரு நாள்

சரி, உண்மையான வேலை எப்படி இருக்கும்? கவர்ச்சியான கோடிங்கைக் குறைத்து, இன்னும் பலவற்றைச் சிந்தியுங்கள்:

AI-எழுதப்பட்ட பதில்களை மோசமானதில் இருந்து சிறந்தது வரை தரவரிசைப்படுத்துதல் (கிளாசிக் RLHF படி) [1].
குழப்பங்களை சரிசெய்தல் (மாடல் வீனஸ் செவ்வாய் அல்ல என்பதை மறந்துவிடுவது போல).
சாட்பாட் பதில்களை மிகவும் இயல்பாக ஒலிக்க மீண்டும் எழுதுதல்.
உரை, படங்கள் அல்லது ஆடியோவின் மலைகளை லேபிளிடுதல் - துல்லியம் உண்மையில் முக்கியமான இடத்தில் [3].
"தொழில்நுட்ப ரீதியாக சரியானது" என்பது போதுமானதா அல்லது பாதுகாப்பு வழிகாட்டுதல்கள் மீறப்பட வேண்டுமா என்பது குறித்து விவாதம் [2].

இது ஓரளவுக்கு குழப்பம், ஓரளவுக்கு புதிர். உண்மையைச் சொன்னால், ஒரு கிளிக்கு பேச மட்டும் கற்றுக்கொடுப்பதில்லை, வார்த்தைகளைத் தவறாகப் பயன்படுத்துவதை நிறுத்தவும் கற்றுக்கொடுப்பதை கற்பனை செய்து பாருங்கள் - அதுதான் நிலைமை. 🦜

பயிற்சியாளர்கள் நீங்கள் நினைப்பதை விட ஏன் மிகவும் முக்கியம்

மனிதர்கள் வழிநடத்தாமல், AI:

சத்தம் விறைப்பாகவும், ரோபோவாகவும் இருக்கிறது.
பரவலான சார்பு கட்டுப்படுத்தப்படாமல் (பயங்கரமான சிந்தனை).
நகைச்சுவை அல்லது பச்சாதாபத்தை முற்றிலும் இழக்கிறேன்.
முக்கியமான சூழல்களில் குறைவான பாதுகாப்பாக இருங்கள்.

பயிற்சியாளர்கள்தான் "குழப்பமான மனித விஷயங்களை" - பேச்சுவழக்கு, அரவணைப்பு, அவ்வப்போது வரும் மோசமான உருவகம் - உள்ளே பதுங்கிச் செல்கிறார்கள், அதே நேரத்தில் பொருட்களைப் பாதுகாப்பாக வைத்திருக்க பாதுகாப்புத் தடுப்புகளையும் பயன்படுத்துகிறார்கள் [2][5].

உண்மையில் கணக்கிட வேண்டிய திறன்கள்

உங்களுக்கு முனைவர் பட்டம் தேவை என்ற கட்டுக்கதையை மறந்துவிடுங்கள். மிகவும் உதவுவது:

எழுதுதல் + சாப்ஸ்களைத் திருத்துதல் - மெருகூட்டப்பட்ட ஆனால் இயற்கையாக ஒலிக்கும் உரை [1].
பகுப்பாய்வு சிந்தனை - மீண்டும் மீண்டும் மாதிரி தவறுகளைக் கண்டறிந்து சரிசெய்தல்.
கலாச்சார விழிப்புணர்வு - சொற்றொடர் தவறாகப் போகும்போது தெரிந்துகொள்வது [2].
பொறுமை - ஏனென்றால் AI உடனடியாகப் புரிந்து கொள்ளாது.

பன்மொழி திறன்கள் அல்லது சிறப்பு நிபுணத்துவத்திற்கான போனஸ் புள்ளிகள்.

பயிற்சியாளர்கள் வரும் இடம் 🌍

இந்த வேலை வெறும் சாட்பாட்களைப் பற்றியது மட்டுமல்ல - இது ஒவ்வொரு துறையிலும் ஊடுருவி வருகிறது:

சுகாதாரப் பராமரிப்பு - எல்லைக்கோட்டு நிகழ்வுகளுக்கான குறிப்பு விதிகளை எழுதுதல் (சுகாதார AI வழிகாட்டுதலில் எதிரொலித்தது) [2].
நிதி - மக்களை தவறான எச்சரிக்கைகளில் மூழ்கடிக்காமல் மோசடி-கண்டறிதல் அமைப்புகளுக்கு பயிற்சி அளித்தல் [2].
சில்லறை விற்பனை - பிராண்ட் தொனியில் ஒட்டிக்கொண்டு, கடைக்காரர்களின் பேச்சுவழக்கு மொழியைப் பெற கற்பித்தல் உதவியாளர்கள் [5].
கல்வி - ஆதரவளிப்பதற்குப் பதிலாக ஊக்கமளிக்கும் வகையில் பயிற்சிப் பாட்களை வடிவமைத்தல் [5].

அடிப்படையில்: AI க்கு மேஜையில் இருக்கை இருந்தால், பின்னணியில் ஒரு பயிற்சியாளர் மறைந்திருப்பார்.

நெறிமுறைகள் பகுதி (இதைத் தவிர்க்க முடியாது)

இங்கேதான் அது முக்கியத்துவம் பெறுகிறது. சரிபார்க்கப்படாமல் விட்டால், AI மீண்டும் மீண்டும் ஒரே மாதிரியான கருத்துக்களை, தவறான தகவல்களை அல்லது மோசமான தகவல்களைப் பரப்புகிறது. பயிற்சியாளர்கள் RLHF அல்லது அரசியலமைப்பு விதிகள் போன்ற முறைகளைப் பயன்படுத்தி மாதிரிகளை பயனுள்ள, பாதிப்பில்லாத பதில்களை நோக்கி வழிநடத்துவதன் மூலம் அதைத் தடுக்கிறார்கள் [1][5].

உதாரணம்: ஒரு பாட் சார்புடைய வேலை பரிந்துரைகளை முன்வைத்தால், ஒரு பயிற்சியாளர் அதைக் கொடியிடுவார், விதிப்புத்தகத்தை மீண்டும் எழுதுவார், மேலும் அது மீண்டும் நடக்காமல் பார்த்துக் கொள்வார். அது செயல்பாட்டில் மேற்பார்வை [2].

அவ்வளவு வேடிக்கையாக இல்லாத பக்கம்

இது எல்லாம் பளபளப்பாக இல்லை. பயிற்சியாளர்கள் இவற்றைக் கையாளுகிறார்கள்:

ஏகபோகம் - முடிவில்லா லேபிளிங் பழையதாகிவிடுகிறது.
உணர்ச்சி சோர்வு - தீங்கு விளைவிக்கும் அல்லது தொந்தரவான உள்ளடக்கத்தை மதிப்பாய்வு செய்வது ஒரு பாதிப்பை ஏற்படுத்தும்; ஆதரவு அமைப்புகள் மிக முக்கியமானவை [4].
அங்கீகாரம் இல்லாமை - பயனர்கள் பயிற்சியாளர்கள் இருப்பதை அரிதாகவே உணர்கிறார்கள்.
நிலையான மாற்றம் - கருவிகள் இடைவிடாமல் உருவாகின்றன, அதாவது பயிற்சியாளர்கள் தொடர்ந்து முன்னேற வேண்டும்.

இருப்பினும், பலருக்கு, தொழில்நுட்பத்தின் "மூளையை" வடிவமைப்பதில் உள்ள சிலிர்ப்பு அவர்களை அதில் ஈர்த்து வைத்திருக்கிறது.

AI இன் மறைக்கப்பட்ட MVPகள்

வேலை செய்யும் அமைப்புகளுக்கும் இடையிலான பாலம் . அவர்கள் இல்லாமல், AI என்பது நூலகர்கள் இல்லாத நூலகம் போல இருக்கும் - ஏராளமான தகவல்கள், ஆனால் பயன்படுத்த கிட்டத்தட்ட சாத்தியமற்றது.

அடுத்த முறை ஒரு சாட்பாட் உங்களை சிரிக்க வைக்கும்போதோ அல்லது ஆச்சரியப்படும் விதமாக "இசையுடன்" உணரும்போதோ, ஒரு பயிற்சியாளருக்கு நன்றி சொல்லுங்கள். அவை அமைதியான உருவங்கள், அவை இயந்திரங்களை கணக்கிடுவதை மட்டுமல்லாமல், இணைக்கவும் செய்கின்றன [1][2][5].

குறிப்புகள்

[1] ஓயாங், எல். மற்றும் பலர். (2022). மனித கருத்துகளுடன் வழிமுறைகளைப் பின்பற்ற மொழி மாதிரிகளைப் பயிற்றுவித்தல் (InstructGPT). நியூரிஐபிஎஸ். இணைப்பு

[2] NIST (2023). செயற்கை நுண்ணறிவு இடர் மேலாண்மை கட்டமைப்பு (AI RMF 1.0). இணைப்பு

[3] நார்த்கட், சி. மற்றும் பலர். (2021). சோதனைத் தொகுப்புகளில் பரவலான லேபிள் பிழைகள் இயந்திர கற்றல் வரையறைகளை சீர்குலைக்கின்றன. நியூரிஐபிஎஸ் தரவுத்தொகுப்புகள் & வரையறைகள். இணைப்பு

[4] WHO/ILO (2022). வேலையில் மன ஆரோக்கியம் குறித்த வழிகாட்டுதல்கள். இணைப்பு

[5] பாய், ஒய். மற்றும் பலர். (2022). அரசியலமைப்பு AI: AI இலிருந்து பாதிப்பில்லாத தன்மை கருத்து. arXiv. இணைப்பு

அதிகாரப்பூர்வ AI உதவியாளர் கடையில் சமீபத்திய AI ஐக் கண்டறியவும்

எங்களை பற்றி

வலைப்பதிவிற்குத் திரும்பு

நாடு/பிராந்தியம்