திறந்த மூல AI என்றால் என்ன?

திறந்த மூல AI என்பது எல்லாவற்றையும் திறக்கும் ஒரு மாய விசை போல பேசப்படுகிறது. அது இல்லை. ஆனால் இது AI அமைப்புகளை உருவாக்குவதற்கான ஒரு நடைமுறை, அனுமதி இல்லாத வழி, நீங்கள் புரிந்து கொள்ளலாம், மேம்படுத்தலாம் மற்றும் ஒரு விற்பனையாளரிடம் சுவிட்சை மாற்றும்படி கெஞ்சாமல் அனுப்பலாம். "திறந்த" என்று எதைக் கணக்கிடுவது, மார்க்கெட்டிங் என்றால் என்ன, அதை உண்மையில் வேலையில் எவ்வாறு பயன்படுத்துவது என்று நீங்கள் யோசித்திருந்தால், நீங்கள் சரியான இடத்தில் இருக்கிறீர்கள். ஒரு காபி குடித்துவிட்டு வாருங்கள் - இது பயனுள்ளதாக இருக்கும், மேலும் கொஞ்சம் கருத்துடையதாகவும் இருக்கலாம் ☕🙂.

இதற்குப் பிறகு நீங்கள் படிக்க விரும்பக்கூடிய கட்டுரைகள்:

🔗 உங்கள் வணிகத்தில் AI ஐ எவ்வாறு இணைப்பது
சிறந்த வணிக வளர்ச்சிக்கு AI கருவிகளை ஒருங்கிணைப்பதற்கான நடைமுறை படிகள்.

🔗 அதிக உற்பத்தித் திறன் பெற AI-ஐ எவ்வாறு பயன்படுத்துவது
நேரத்தை மிச்சப்படுத்தும் மற்றும் செயல்திறனை அதிகரிக்கும் பயனுள்ள AI பணிப்பாய்வுகளைக் கண்டறியவும்.

🔗 AI திறன்கள் என்றால் என்ன?
எதிர்காலத்திற்குத் தயாராக உள்ள நிபுணர்களுக்குத் தேவையான முக்கிய AI திறன்களைக் கற்றுக்கொள்ளுங்கள்.

🔗 கூகிள் வெர்டெக்ஸ் AI என்றால் என்ன?
கூகிளின் வெர்டெக்ஸ் AI மற்றும் அது இயந்திர கற்றலை எவ்வாறு நெறிப்படுத்துகிறது என்பதைப் புரிந்து கொள்ளுங்கள்.

திறந்த மூல AI என்றால் என்ன? 🤖🔓

மிக எளிமையாகச் சொன்னால், திறந்த மூல AI என்பது ஒரு AI அமைப்பின் கூறுகள் - குறியீடு, மாதிரி எடைகள், தரவு குழாய்வழிகள், பயிற்சி ஸ்கிரிப்டுகள் மற்றும் ஆவணங்கள் - நியாயமான விதிமுறைகளுக்கு உட்பட்டு, எவரும் அவற்றைப் பயன்படுத்த, படிக்க, மாற்றியமைக்க மற்றும் பகிர அனுமதிக்கும் உரிமங்களின் கீழ் வெளியிடப்படுகின்றன. அந்த மைய சுதந்திர மொழி திறந்த மூல வரையறை மற்றும் அதன் நீண்டகால பயனர் சுதந்திரக் கொள்கைகளிலிருந்து வருகிறது [1]. AI இன் திருப்பம் என்னவென்றால், குறியீட்டை விட அதிகமான பொருட்கள் உள்ளன.

சில திட்டங்கள் குறியீடு, பயிற்சி தரவு மூலங்கள், சமையல் குறிப்புகள் மற்றும் பயிற்சி பெற்ற மாதிரி என அனைத்தையும் வெளியிடுகின்றன. மற்றவை எடைகளை . சுற்றுச்சூழல் அமைப்பு சில நேரங்களில் ஒழுங்கற்ற சுருக்கெழுத்தைப் பயன்படுத்துகிறது, எனவே அடுத்த பகுதியில் அதை ஒழுங்கமைப்போம்.

திறந்த மூல AI vs திறந்த எடைகள் vs திறந்த அணுகல் 😅

இங்குதான் மக்கள் ஒருவரையொருவர் கடந்து பேசுகிறார்கள்.

திறந்த மூல AI — இந்தத் திட்டம் அதன் அடுக்கு முழுவதும் திறந்த மூலக் கொள்கைகளைப் பின்பற்றுகிறது. குறியீடு OSI-அங்கீகரிக்கப்பட்ட உரிமத்தின் கீழ் உள்ளது, மேலும் விநியோக விதிமுறைகள் பரந்த பயன்பாடு, மாற்றம் மற்றும் பகிர்வை அனுமதிக்கின்றன. இங்குள்ள உணர்வு OSI விவரிக்கும் பொருளைப் பிரதிபலிக்கிறது: பயனரின் சுதந்திரம் முதலில் வருகிறது [1][2].
திறந்த எடைகள் — பயிற்சி பெற்ற மாதிரி எடைகள் பதிவிறக்கம் செய்யக்கூடியவை (பெரும்பாலும் இலவசம்) ஆனால் தனிப்பயனாக்கப்பட்ட விதிமுறைகளின் கீழ். பயன்பாட்டு நிபந்தனைகள், மறுபகிர்வு வரம்புகள் அல்லது அறிக்கையிடல் விதிகளை நீங்கள் காண்பீர்கள். மெட்டாவின் லாமா குடும்பம் இதை விளக்குகிறது: குறியீட்டு சுற்றுச்சூழல் அமைப்பு திறந்த-இஷ், ஆனால் மாதிரி எடைகள் பயன்பாட்டு அடிப்படையிலான நிபந்தனைகளுடன் ஒரு குறிப்பிட்ட உரிமத்தின் கீழ் அனுப்பப்படுகின்றன [4].
திறந்த அணுகல் — நீங்கள் ஒரு API ஐத் திறக்கலாம், ஒருவேளை இலவசமாக இருக்கலாம், ஆனால் உங்களுக்கு எடைகள் கிடைக்காது. பரிசோதனைக்கு உதவியாக இருக்கும், ஆனால் திறந்த மூலத்திற்கு அல்ல.

இது வெறும் சொற்பொருள் மட்டுமல்ல. இந்த வகைகளில் உங்கள் உரிமைகளும் அபாயங்களும் மாறுபடும். AI மற்றும் வெளிப்படைத்தன்மை குறித்த OSI இன் தற்போதைய பணி இந்த நுணுக்கங்களை எளிய மொழியில் வெளிப்படுத்துகிறது [2].

திறந்த மூல AI ஐ உண்மையில் சிறந்ததாக்குவது எது ✅

விரைவாகவும் நேர்மையாகவும் இருப்போம்.

தணிக்கைத்திறன் — நீங்கள் குறியீட்டைப் படிக்கலாம், தரவு சமையல் குறிப்புகளை ஆய்வு செய்யலாம் மற்றும் பயிற்சி படிகளைக் கண்டறியலாம். இது இணக்கம், பாதுகாப்பு மதிப்புரைகள் மற்றும் பழங்கால ஆர்வத்திற்கு உதவுகிறது. NIST AI இடர் மேலாண்மை கட்டமைப்பு ஆவணங்கள் மற்றும் வெளிப்படைத்தன்மை நடைமுறைகளை ஊக்குவிக்கிறது, அவை திறந்த திட்டங்கள் மிகவும் எளிதாக திருப்திப்படுத்த முடியும் [3].
தகவமைப்பு — நீங்கள் ஒரு விற்பனையாளரின் திட்ட வரைபடத்தில் சிக்கவில்லை. அதை ஃபோர்க் செய்யவும். ஒட்டு போடவும். அனுப்பவும். லெகோ, ஒட்டப்பட்ட பிளாஸ்டிக் அல்ல.
செலவு கட்டுப்பாடு — மலிவாக இருக்கும்போது சுயமாக ஹோஸ்ட் செய்யுங்கள். மலிவாக இல்லாதபோது மேகத்திற்கு மாறுங்கள். வன்பொருளை கலந்து பொருத்துங்கள்.
சமூக வேகம் — பிழைகள் சரி செய்யப்படும், அம்சங்கள் சரியாகிவிடும், மேலும் நீங்கள் சகாக்களிடமிருந்து கற்றுக்கொள்வீர்கள். குழப்பமாக இருக்கிறதா? சில நேரங்களில். உற்பத்தித் திறன் உள்ளதா? அடிக்கடி.
நிர்வாக தெளிவு — உண்மையான திறந்த உரிமங்கள் கணிக்கக்கூடியவை. செவ்வாய்க்கிழமை அமைதியாக மாறும் API சேவை விதிமுறைகளுடன் அதை ஒப்பிடுக.

இது சரியானதா? இல்லை. ஆனால் சமரசங்கள் தெளிவாக உள்ளன - பல கருப்புப் பெட்டி சேவைகளிலிருந்து நீங்கள் பெறுவதை விட அதிகம்.

திறந்த மூல AI அடுக்கு: குறியீடு, எடைகள், தரவு மற்றும் பசை 🧩

ஒரு வித்தியாசமான லாசக்னா போன்ற ஒரு AI திட்டத்தை நினைத்துப் பாருங்கள். எல்லா இடங்களிலும் அடுக்குகள் உள்ளன.

கட்டமைப்புகள் மற்றும் இயக்க நேரங்கள் — மாதிரிகளை வரையறுக்க, பயிற்சி அளிக்க மற்றும் சேவை செய்ய கருவி (எ.கா., PyTorch, TensorFlow). ஆரோக்கியமான சமூகங்கள் மற்றும் ஆவணங்கள் பிராண்ட் பெயர்களை விட முக்கியம்.
மாதிரி கட்டமைப்புகள் — வரைபடம்: மின்மாற்றிகள், பரவல் மாதிரிகள், மீட்டெடுப்பு-வளர்ச்சியடைந்த அமைப்புகள்.
எடைகள் — பயிற்சியின் போது கற்றுக்கொண்ட அளவுருக்கள். இங்கே "திறந்தவை" என்பது பதிவிறக்கத்தை மட்டுமல்ல, மறுபகிர்வு மற்றும் வணிக-பயன்பாட்டு உரிமைகளையும் சார்ந்துள்ளது.
தரவு மற்றும் சமையல் குறிப்புகள் — க்யூரேஷன் ஸ்கிரிப்டுகள், வடிப்பான்கள், பெருக்குதல்கள், பயிற்சி அட்டவணைகள். இங்கு வெளிப்படைத்தன்மை என்பது மறுஉருவாக்கத்திற்கு தங்கம் போன்றது.
கருவி மற்றும் இசைக்குழு - அனுமான சேவையகங்கள், திசையன் தரவுத்தளங்கள், மதிப்பீட்டு ஹார்னஸ்கள், கவனிக்கத்தக்க தன்மை, CI/CD.
உரிமம் வழங்குதல் — நீங்கள் உண்மையில் என்ன செய்ய முடியும் என்பதைத் தீர்மானிக்கும் அமைதியான முதுகெலும்பு. மேலும் கீழே.

திறந்த மூல AI-க்கு 101 உரிமம் வழங்குதல் 📜

நீங்கள் ஒரு வழக்கறிஞராக இருக்க வேண்டிய அவசியமில்லை. நீங்கள் வடிவங்களைக் கண்டுபிடிக்க வேண்டும்.

அனுமதி குறியீடு உரிமங்கள் — MIT, BSD, Apache-2.0. Apache பல அணிகள் பாராட்டும் வெளிப்படையான காப்புரிமை மானியத்தை உள்ளடக்கியது [1].
காப்பிலெஃப்ட் — GPL குடும்பம் வழித்தோன்றல்கள் அதே உரிமத்தின் கீழ் திறந்திருக்க வேண்டும் என்று கோருகிறது. சக்திவாய்ந்தது, ஆனால் உங்கள் கட்டமைப்பில் அதற்காகத் திட்டமிடுங்கள்.
மாதிரி-குறிப்பிட்ட உரிமங்கள் — எடைகள் மற்றும் தரவுத்தொகுப்புகளுக்கு, பொறுப்பான AI உரிமக் குடும்பம் (OpenRAIL) போன்ற தனிப்பயன் உரிமங்களை நீங்கள் காண்பீர்கள். இவை பயன்பாட்டு அடிப்படையிலான அனுமதிகள் மற்றும் கட்டுப்பாடுகளை குறியாக்குகின்றன; சில வணிக பயன்பாட்டை பரவலாக அனுமதிக்கின்றன, மற்றவை தவறான பயன்பாட்டைச் சுற்றி பாதுகாப்புத் தடுப்புகளைச் சேர்க்கின்றன [5].
தரவுகளுக்கான கிரியேட்டிவ் காமன்ஸ் — தரவுத்தொகுப்புகள் மற்றும் ஆவணங்களுக்கு CC-BY அல்லது CC0 பொதுவானவை. பண்புக்கூறை சிறிய அளவில் நிர்வகிக்க முடியும்; ஆரம்பத்தில் ஒரு வடிவத்தை உருவாக்குங்கள்.

உதவிக்குறிப்பு: ஒவ்வொரு சார்புநிலை, அதன் உரிமம் மற்றும் வணிக மறுபகிர்வு அனுமதிக்கப்படுகிறதா என்பதைப் பட்டியலிடும் ஒரு பக்க பக்கத்தை வைத்திருங்கள். சலிப்பாக இருக்கிறதா? ஆம். அவசியமா? ஆம்.

ஒப்பீட்டு அட்டவணை: பிரபலமான திறந்த மூல AI திட்டங்கள் மற்றும் அவை எங்கு பிரகாசிக்கின்றன 📊

வேண்டுமென்றே சற்று குழப்பமாக இருக்கிறது - உண்மையான குறிப்புகள் அப்படித்தான் இருக்கும்

கருவி / திட்டம்	இது யாருக்கானது?	விலை அதிகம்	இது ஏன் நன்றாக வேலை செய்கிறது?
பைடார்ச்	ஆராய்ச்சியாளர்கள், பொறியாளர்கள்	இலவசம்	டைனமிக் வரைபடங்கள், மிகப்பெரிய சமூகம், வலுவான ஆவணங்கள். தயாரிப்பில் போர்-சோதனை செய்யப்பட்டது.
டென்சர்ஃப்ளோ	நிறுவன குழுக்கள், ML செயல்பாடுகள்	இலவசம்	வரைபட முறை, TF-சேவை, சுற்றுச்சூழல் அமைப்பு ஆழம். சிலருக்கு கூர்மையான கற்றல், இன்னும் உறுதியானது.
கட்டிப்பிடிக்கும் முக மின்மாற்றிகள்	காலக்கெடு கொண்ட பில்டர்கள்	இலவசம்	முன்கூட்டியே பயிற்சி பெற்ற மாதிரிகள், குழாய்வழிகள், தரவுத்தொகுப்புகள், எளிதான ஃபைன்-ட்யூனிங். உண்மையிலேயே ஒரு குறுக்குவழி.
விஎல்எல்எம்	உள்நோக்கமுள்ள அணிகள்	இலவசம்	வேகமான LLM சேவை, திறமையான KV கேச், பொதுவான GPUகளில் வலுவான செயல்திறன்.
ல்லாமா.சிபிபி	டிங்கரர்கள், விளிம்பு சாதனங்கள்	இலவசம்	மடிக்கணினிகள் மற்றும் தொலைபேசிகளில் மாதிரிகளை அளவீட்டுடன் உள்ளூரில் இயக்கவும்.
லாங்செயின்	பயன்பாட்டு டெவலப்பர்கள், முன்மாதிரிகள்	இலவசம்	தொகுக்கக்கூடிய சங்கிலிகள், இணைப்பிகள், முகவர்கள். எளிமையாக வைத்திருந்தால் விரைவான வெற்றிகள்.
நிலையான பரவல்	படைப்பாற்றல், தயாரிப்பு குழுக்கள்	இலவச எடைகள்	உள்ளூர் அல்லது மேகக்கணியில் பட உருவாக்கம்; அதைச் சுற்றியுள்ள மிகப்பெரிய பணிப்பாய்வுகள் மற்றும் UIகள்.
ஒல்லாமா	உள்ளூர் CLI-களை விரும்பும் டெவலப்பர்கள்	இலவசம்	உள்ளூர் மாடல்களை இழுத்து இயக்கவும். மாடல் கார்டைப் பொறுத்து உரிமங்கள் மாறுபடும் - அதைப் பாருங்கள்.

ஆம், நிறைய “இலவசம்.” ஹோஸ்டிங், GPUகள், சேமிப்பு மற்றும் மக்கள் நேரங்கள் இலவசம் அல்ல.

நிறுவனங்கள் உண்மையில் வேலையில் திறந்த மூல AI ஐ எவ்வாறு பயன்படுத்துகின்றன 🏢⚙️

நீங்கள் இரண்டு உச்சநிலைகளைக் கேட்பீர்கள்: ஒன்று எல்லோரும் எல்லாவற்றையும் தாங்களாகவே ஏற்றுக்கொள்ள வேண்டும், அல்லது யாரும் ஏற்றுக்கொள்ளக் கூடாது. நிஜ வாழ்க்கை மிகவும் மென்மையானது.

விரைவாக முன்மாதிரி செய்தல் — UX மற்றும் தாக்கத்தை சரிபார்க்க அனுமதிக்கப்பட்ட திறந்த மாதிரிகளுடன் தொடங்கவும். பின்னர் மறுசீரமைப்பு செய்யவும்.
கலப்பின சேவை — தனியுரிமை உணர்திறன் அழைப்புகளுக்கு VPC-ஹோஸ்ட் செய்யப்பட்ட அல்லது ஆன்-பிரேம் மாதிரியை வைத்திருங்கள். நீண்ட டெயில் அல்லது கூர்மையான சுமைக்கு ஹோஸ்ட் செய்யப்பட்ட APIக்குத் திரும்புக. மிகவும் இயல்பானது.
குறுகிய பணிகளுக்கு நேர்த்தியாகச் சரிசெய்தல் — களத் தழுவல் பெரும்பாலும் மூல அளவை விட அதிகமாக இருக்கும்.
எல்லா இடங்களிலும் RAG — மீட்டெடுப்பு-வளர்ச்சியடைந்த தலைமுறை உங்கள் தரவில் உள்ள பதில்களை அடிப்படையாக்குவதன் மூலம் மாயத்தோற்றங்களைக் குறைக்கிறது. திறந்த வெக்டர் DBகள் மற்றும் அடாப்டர்கள் இதை அணுகக்கூடியதாக ஆக்குகின்றன.
எட்ஜ் மற்றும் ஆஃப்லைன் — மடிக்கணினிகள், தொலைபேசிகள் அல்லது உலாவிகளுக்காக தொகுக்கப்பட்ட இலகுரக மாதிரிகள் தயாரிப்பு மேற்பரப்புகளை விரிவுபடுத்துகின்றன.
இணக்கம் மற்றும் தணிக்கை — நீங்கள் தைரியத்தை ஆய்வு செய்ய முடியும் என்பதால், தணிக்கையாளர்களுக்கு மதிப்பாய்வு செய்ய உறுதியான ஒன்று உள்ளது. NIST இன் RMF வகைகள் மற்றும் ஆவண வழிகாட்டுதலுடன் [3] வரைபடமாக்கும் பொறுப்பான AI கொள்கையுடன் அதை இணைக்கவும்.

சிறிய புலக் குறிப்பு: நான் பார்த்த தனியுரிமை சார்ந்த SaaS குழு (நடுத்தர சந்தை, EU பயனர்கள்) ஒரு கலப்பின அமைப்பை ஏற்றுக்கொண்டது: 80% கோரிக்கைகளுக்கு VPC இல் சிறிய திறந்த மாதிரி; அரிதான, நீண்ட-சூழல் தூண்டுதல்களுக்கு ஹோஸ்ட் செய்யப்பட்ட API க்கு விரைவாகச் சென்றது. அவர்கள் பொதுவான பாதைக்கான தாமதத்தைக் குறைத்து, கடலை கொதிக்காமல் DPIA ஆவணங்களை எளிதாக்கினர்.

நீங்கள் திட்டமிட வேண்டிய அபாயங்கள் மற்றும் வாய்ப்புகள் 🧨

இதைப் பற்றி பெரியவர்களாக இருப்போம்.

உரிம மாற்றம் — ஒரு ரெப்போ MIT-ஐத் தொடங்குகிறது, பின்னர் எடைகள் தனிப்பயன் உரிமத்திற்கு நகரும். உங்கள் உள் பதிவேட்டைப் புதுப்பித்த நிலையில் வைத்திருங்கள் அல்லது நீங்கள் ஒரு இணக்க ஆச்சரியத்தை அனுப்புவீர்கள் [2][4][5].
தரவு ஆதாரம் — தெளிவற்ற உரிமைகளுடன் பயிற்சித் தரவு மாதிரிகளில் பாயலாம். மூலங்களைக் கண்காணித்து தரவுத்தொகுப்பு உரிமங்களைப் பின்பற்றுங்கள், அதிர்வுகளை அல்ல [5].
பாதுகாப்பு — மாதிரி கலைப்பொருட்களை வேறு எந்த விநியோகச் சங்கிலியைப் போலவே நடத்துங்கள்: செக்சம்கள், கையொப்பமிடப்பட்ட வெளியீடுகள், SBOMகள். குறைந்தபட்ச SECURITY.md கூட அமைதியை வெல்லும்.
தர மாறுபாடு — திறந்த மாதிரிகள் பரவலாக வேறுபடுகின்றன. லீடர்போர்டுகளை மட்டும் கொண்டு அல்லாமல், உங்கள் பணிகளைக் கொண்டு மதிப்பீடு செய்யுங்கள்.
மறைக்கப்பட்ட உள்கட்டமைப்பு செலவு — வேகமான அனுமானத்திற்கு GPUகள், அளவீடு, தொகுதிப்படுத்தல், தற்காலிக சேமிப்பு தேவை. திறந்த கருவிகள் உதவுகின்றன; நீங்கள் இன்னும் கணக்கீட்டில் பணம் செலுத்துகிறீர்கள்.
நிர்வாகக் கடன் — மாதிரி வாழ்க்கைச் சுழற்சி யாருக்கும் சொந்தமில்லை என்றால், உங்களுக்கு உள்ளமைவு ஸ்பாகெட்டி கிடைக்கும். இலகுரக MLOps சரிபார்ப்புப் பட்டியல் தங்கம்.

உங்கள் பயன்பாட்டு சூழ்நிலைக்கு ஏற்ற திறந்த நிலை நிலையைத் தேர்ந்தெடுப்பது 🧭

சற்று கோணலான முடிவெடுக்கும் பாதை:

ஒளி இணக்கத் தேவைகளுடன் விரைவாக அனுப்ப வேண்டுமா
கடுமையான தனியுரிமை அல்லது ஆஃப்லைன் தேவையா ? நன்கு ஆதரிக்கப்படும் திறந்த அடுக்கு, சுய-ஹோஸ்ட் அனுமானத்தைத் தேர்ந்தெடுத்து, உரிமங்களை கவனமாக மதிப்பாய்வு செய்யவும்.
பரந்த வணிக உரிமைகள் தேவையா ? வணிக பயன்பாடு மற்றும் மறுபகிர்வை வெளிப்படையாக அனுமதிக்கும் OSI-சீரமைக்கப்பட்ட குறியீடு மற்றும் மாதிரி உரிமங்களை விரும்புங்கள் [1][5].
ஆராய்ச்சி நெகிழ்வுத்தன்மை தேவையா ? மறுஉருவாக்கம் மற்றும் பகிர்வுத்திறனுக்காக தரவு உட்பட, இறுதி முதல் இறுதி வரை அனுமதியுடன் செல்லுங்கள்.
சரியா தெரியலயா? ரெண்டும் பைலட் பண்ணுங்க. ஒரு வாரத்துல ஒரு பாதை நல்லா இருக்கும்.

ஒரு தொழில்முறை நிபுணரைப் போல திறந்த மூல AI திட்டத்தை எவ்வாறு மதிப்பிடுவது 🔍

நான் வைத்திருக்கும் ஒரு விரைவான சரிபார்ப்புப் பட்டியல், சில நேரங்களில் ஒரு நாப்கினில்.

உரிமத் தெளிவு — குறியீட்டிற்கு OSI-அங்கீகாரம்? எடைகள் மற்றும் தரவு பற்றி என்ன? உங்கள் வணிக மாதிரியைப் பாதிக்கும் ஏதேனும் பயன்பாட்டுக் கட்டுப்பாடுகள் [1][2][5] உள்ளதா?
ஆவணப்படுத்தல் — நிறுவல், விரைவுத் தொடக்கம், உதாரணங்கள், சரிசெய்தல். ஆவணங்கள் ஒரு கலாச்சாரச் சொல்.
வெளியீட்டு ஏற்றம் — குறிச்சொற்கள் வெளியீடுகள் மற்றும் மாற்றப் பதிவுகள் நிலைத்தன்மையைக் குறிக்கின்றன; அவ்வப்போது ஏற்படும் உந்துதல்கள் வீரச் செயல்களைக் குறிக்கின்றன.
வரையறைகள் மற்றும் மதிப்பீடுகள் — பணிகள் யதார்த்தமானவையா? Evals இயக்க முடியுமா?
பராமரிப்பு மற்றும் நிர்வாகம் — தெளிவான குறியீடு உரிமையாளர்கள், வெளியீட்டு வகைப்படுத்தல், PR மறுமொழி.
சுற்றுச்சூழல் அமைப்பு பொருத்தம் — உங்கள் வன்பொருள், தரவு கடைகள், பதிவு செய்தல், அங்கீகாரம் ஆகியவற்றுடன் நன்றாக வேலை செய்கிறது.
பாதுகாப்பு நிலை - கையொப்பமிடப்பட்ட கலைப்பொருட்கள், சார்பு ஸ்கேனிங், CVE கையாளுதல்.
சமூக சமிக்ஞை — விவாதங்கள், மன்ற பதில்கள், எடுத்துக்காட்டு களஞ்சியங்கள்.

நம்பகமான நடைமுறைகளுடன் பரந்த சீரமைப்புக்கு, உங்கள் செயல்முறையை NIST AI RMF வகைகள் மற்றும் ஆவணக் கலைப்பொருட்களுடன் வரைபடமாக்குங்கள் [3].

ஆழமான ஆய்வு 1: மாதிரி உரிமங்களின் குழப்பமான நடுப்பகுதி 🧪

மிகவும் திறமையான சில மாதிரிகள் "நிபந்தனைகளுடன் திறந்த எடைகள்" வாளியில் வாழ்கின்றன. அவை அணுகக்கூடியவை, ஆனால் பயன்பாட்டு வரம்புகள் அல்லது மறுபகிர்வு விதிகளுடன். உங்கள் தயாரிப்பு மாதிரியை மீண்டும் பேக்கேஜ் செய்வதையோ அல்லது வாடிக்கையாளர் சூழல்களுக்கு அனுப்புவதையோ சார்ந்து இல்லாவிட்டால் அது நன்றாக இருக்கும். உங்களுக்கு தேவைப்பட்டால் வலைப்பதிவு இடுகைக்கு அல்லாமல், உண்மையான உங்கள் கீழ்நிலைத் திட்டங்களை வரைபடமாக்குவது முக்கியம்

OpenRAIL பாணி உரிமங்கள் சமநிலையை ஏற்படுத்த முயற்சிக்கின்றன: திறந்த ஆராய்ச்சி மற்றும் பகிர்வை ஊக்குவிக்கவும், அதே நேரத்தில் தவறான பயன்பாட்டை ஊக்கப்படுத்தவும். நோக்கம் நல்லது; கடமைகள் இன்னும் உங்களுடையவை. விதிமுறைகளைப் படித்து, நிபந்தனைகள் உங்கள் ஆபத்து விருப்பத்திற்கு பொருந்துமா என்பதை முடிவு செய்யுங்கள் [5].

ஆழமான ஆய்வு 2: தரவு வெளிப்படைத்தன்மை மற்றும் மறுஉருவாக்கம் பற்றிய கட்டுக்கதை 🧬

“முழுமையான தரவு டம்ப்கள் இல்லாமல், திறந்த மூல AI போலியானது.” முழுமையாக இல்லை. சில மூல தரவுத்தொகுப்புகள் கட்டுப்படுத்தப்பட்டிருந்தாலும் கூட தரவு ஆதாரம் மற்றும் சமையல் குறிப்புகள் அர்த்தமுள்ள வெளிப்படைத்தன்மையை வழங்க முடியும். மற்றொரு குழு முடிவுகளை தோராயமாகப் பெறுவதற்கு வடிப்பான்கள், மாதிரி விகிதங்கள் மற்றும் சுத்தம் செய்யும் ஹூரிஸ்டிக்ஸை நீங்கள் போதுமான அளவு ஆவணப்படுத்தலாம். சரியான மறுஉருவாக்கம் நல்லது. செயல்படக்கூடிய வெளிப்படைத்தன்மை பெரும்பாலும் போதுமானது [3][5].

தரவுத்தொகுப்புகள் திறந்திருக்கும் போது, CC-BY அல்லது CC0 போன்ற கிரியேட்டிவ் காமன்ஸ் சுவைகள் பொதுவானவை. அளவில் பண்புக்கூறு செய்வது சிரமமாக இருக்கலாம், எனவே நீங்கள் அதை எவ்வாறு கையாளுகிறீர்கள் என்பதை முன்கூட்டியே தரப்படுத்தவும்.

ஆழமான டைவ் 3: திறந்த மாதிரிகளுக்கான நடைமுறை MLOps 🚢

திறந்த மாதிரியை அனுப்புவது என்பது எந்தவொரு சேவையையும் அனுப்புவது போன்றது, அதோடு சில நுணுக்கங்களும் கூட.

சேவை அடுக்கு — சிறப்பு அனுமான சேவையகங்கள் தொகுதிப்படுத்தல், KV-கேச் மேலாண்மை மற்றும் டோக்கன் ஸ்ட்ரீமிங்கை மேம்படுத்துகின்றன.
அளவு நிர்ணயம் — சிறிய எடைகள் → மலிவான அனுமானம் மற்றும் எளிதான விளிம்பு வரிசைப்படுத்தல். தரமான சமரசங்கள் மாறுபடும்; உங்கள் பணிகளுடன் அளவிடவும்.
கவனிக்கத்தக்க தன்மை — தனியுரிமையை மனதில் கொண்டு பதிவு அறிவிப்புகள்/வெளியீடுகள். மதிப்பீட்டிற்கான மாதிரி. பாரம்பரிய ML-க்கு நீங்கள் செய்வது போன்ற சறுக்கல் சரிபார்ப்புகளைச் சேர்க்கவும்.
புதுப்பிப்புகள் — மாதிரிகள் நடத்தையை நுட்பமாக மாற்றலாம்; கேனரிகளைப் பயன்படுத்தி, பின்வாங்கல் மற்றும் தணிக்கைகளுக்காக ஒரு காப்பகத்தை வைத்திருங்கள்.
Eval harness — பொதுவான அளவுகோல்களை மட்டுமல்லாமல், பணி சார்ந்த eval தொகுப்பைப் பராமரிக்கவும். எதிர்மறையான தூண்டுதல்கள் மற்றும் தாமத பட்ஜெட்டுகளைச் சேர்க்கவும்.

ஒரு மினி ப்ளூபிரிண்ட்: பூஜ்ஜியத்திலிருந்து பயன்படுத்தக்கூடிய பைலட் வரை 10 படிகளில் 🗺️

ஒரு குறுகிய பணி மற்றும் அளவீட்டை வரையறுக்கவும். இன்னும் பிரமாண்டமான தளங்கள் இல்லை.
பரவலாகப் பயன்படுத்தப்படும் மற்றும் நன்கு ஆவணப்படுத்தப்பட்ட ஒரு அனுமதிக்கப்பட்ட அடிப்படை மாதிரியைத் தேர்ந்தெடுக்கவும்.
உள்ளூர் அனுமானத்தையும் மெல்லிய ரேப்பர் API-யையும் உருவாக்குங்கள். அதை சலிப்படையச் செய்யுங்கள்.
உங்கள் தரவில் தரை வெளியீடுகளில் மீட்டெடுப்பைச் சேர்க்கவும்.
உங்கள் பயனர்கள், மருக்கள் மற்றும் அனைத்தையும் பிரதிபலிக்கும் ஒரு சிறிய லேபிளிடப்பட்ட eval தொகுப்பைத் தயாரிக்கவும்.
மதிப்பீடு நீங்கள் வேண்டும் என்று சொன்னால் மட்டுமே ஃபைன்-ட்யூன் அல்லது ப்ராம்ட்-ட்யூன் செய்யவும்.
தாமதம் அல்லது செலவு அதிகமாக இருந்தால் அளவிடவும். தரத்தை மீண்டும் அளவிடவும்.
பதிவு செய்தல், ரெட்-டீமிங் தூண்டுதல்கள் மற்றும் துஷ்பிரயோகக் கொள்கையைச் சேர்க்கவும்.
ஒரு சிறிய குழுவிற்கு ஒரு அம்சக் கொடி மற்றும் வெளியீட்டைக் கொண்ட வாயில்.
திரும்பத் திரும்பச் சொல்லுங்கள். வாரந்தோறும் சிறிய மேம்பாடுகளை அனுப்புங்கள்... அல்லது அது உண்மையிலேயே சிறப்பாக இருக்கும்போது.

திறந்த மூல AI பற்றிய பொதுவான கட்டுக்கதைகள், கொஞ்சம் நீக்கப்பட்டது 🧱

கட்டுக்கதை: திறந்த மாதிரிகள் எப்போதும் மோசமானவை. யதார்த்தம்: சரியான தரவுகளுடன் இலக்கு வைக்கப்பட்ட பணிகளுக்கு, நன்றாகச் சரிசெய்யப்பட்ட திறந்த மாதிரிகள் பெரிய ஹோஸ்ட் செய்யப்பட்டவற்றை விட சிறப்பாகச் செயல்படும்.
கட்டுக்கதை: திறந்த தன்மை என்பது பாதுகாப்பற்ற தன்மையைக் குறிக்கிறது. யதார்த்தம்: திறந்த தன்மை ஆய்வை மேம்படுத்தும். பாதுகாப்பு ரகசியத்தை அல்ல, நடைமுறைகளைப் பொறுத்தது [3].
கட்டுக்கதை: உரிமம் இலவசமா என்பது முக்கியமல்ல. அது இலவசமாக இருக்கும்போது மிகவும் முக்கியமானது

திறந்த மூல AI 🧠✨

திறந்த மூல AI என்பது ஒரு மதம் அல்ல. இது அதிக கட்டுப்பாடு, தெளிவான நிர்வாகம் மற்றும் வேகமான மறு செய்கை மூலம் உங்களை உருவாக்க அனுமதிக்கும் நடைமுறை சுதந்திரங்களின் தொகுப்பாகும். யாராவது ஒரு மாதிரி "திறந்திருக்கும்" என்று கூறும்போது, எந்த அடுக்குகள் திறந்திருக்கும் என்று கேளுங்கள்: குறியீடு, எடைகள், தரவு அல்லது அணுகல். உரிமத்தைப் படியுங்கள். அதை உங்கள் பயன்பாட்டு வழக்குடன் ஒப்பிடுங்கள். பின்னர், முக்கியமாக, அதை உங்கள் உண்மையான பணிச்சுமையுடன் சோதிக்கவும்.

விந்தையாக, சிறந்த பகுதி கலாச்சாரமானது: திறந்த திட்டங்கள் பங்களிப்புகளையும் ஆய்வுகளையும் அழைக்கின்றன, இது மென்பொருளையும் மக்களையும் சிறந்ததாக்குகிறது. வெற்றிபெறும் நடவடிக்கை மிகப்பெரிய மாதிரி அல்லது மிகவும் பிரகாசமான அளவுகோல் அல்ல என்பதை நீங்கள் கண்டறியலாம், ஆனால் அடுத்த வாரம் நீங்கள் உண்மையில் புரிந்துகொண்டு, சரிசெய்து, மேம்படுத்தக்கூடிய ஒன்று. அதுதான் திறந்த மூல AI இன் அமைதியான சக்தி - ஒரு வெள்ளி தோட்டா அல்ல, நாளைக் காப்பாற்றும் ஒரு நன்கு அணிந்த பல கருவி போன்றது.

ரொம்ப நேரம் ஆச்சு படிக்கவே முடியல 📝

திறந்த மூல AI என்பது AI அமைப்புகளைப் பயன்படுத்த, படிக்க, மாற்ற மற்றும் பகிர அர்த்தமுள்ள சுதந்திரத்தைப் பற்றியது. இது கட்டமைப்புகள், மாதிரிகள், தரவு மற்றும் கருவி போன்ற அடுக்குகளில் தோன்றும். திறந்த மூலத்தை திறந்த எடைகள் அல்லது திறந்த அணுகலுடன் குழப்ப வேண்டாம். உரிமத்தைச் சரிபார்க்கவும், உங்கள் உண்மையான பணிகளுடன் மதிப்பீடு செய்யவும், முதல் நாளிலிருந்தே பாதுகாப்பு மற்றும் நிர்வாகத்திற்கான வடிவமைப்பைச் செய்யவும். அதைச் செய்யுங்கள், நீங்கள் வேகம், கட்டுப்பாடு மற்றும் அமைதியான பாதை வரைபடத்தைப் பெறுவீர்கள். ஆச்சரியப்படும் விதமாக அரிதானது, நேர்மையாக விலைமதிப்பற்றது 🙃.

குறிப்புகள்

[1] திறந்த மூல முன்முயற்சி - திறந்த மூல வரையறை (OSD): மேலும் படிக்க
[2] OSI - AI & திறந்த தன்மை பற்றிய ஆழமான ஆய்வு: மேலும் படிக்க
[3] NIST - AI இடர் மேலாண்மை கட்டமைப்பு: மேலும் படிக்க
[4] மெட்டா - லாமா மாதிரி உரிமம்: மேலும் படிக்க
[5] பொறுப்பான AI உரிமங்கள் (OpenRAIL): மேலும் படிக்க

அதிகாரப்பூர்வ AI உதவியாளர் கடையில் சமீபத்திய AI ஐக் கண்டறியவும்

எங்களை பற்றி

வலைப்பதிவிற்குத் திரும்பு

நாடு/பிராந்தியம்