ஓப்பன் சோர்ஸ் ஏஐ என்பது எல்லாவற்றையும் திறக்கும் ஒரு மந்திரச் சாவி போலப் பேசப்படுகிறது. அது அப்படியல்ல. ஆனால், ஒரு விற்பனையாளரிடம் ஒரு சுவிட்சை அழுத்தச் சொல்லிக் கெஞ்சாமலேயே, நீங்கள் புரிந்துகொள்ளவும், மேம்படுத்தவும், வெளியிடவும் கூடிய ஏஐ அமைப்புகளை உருவாக்குவதற்கான ஒரு நடைமுறைக்கு உகந்த, குறைந்த அனுமதிகள் தேவைப்படும் வழி இது . எது "ஓப்பன்" என்று கருதப்படும், எது வெறும் சந்தைப்படுத்தல், மற்றும் அதை உண்மையில் பணியிடத்தில் எப்படிப் பயன்படுத்துவது என்று நீங்கள் யோசித்திருந்தால், நீங்கள் சரியான இடத்தில்தான் இருக்கிறீர்கள். ஒரு காபி எடுத்துக்கொள்ளுங்கள் - இது பயனுள்ளதாக இருக்கும், ஒருவேளை சற்று கருத்துச் சார்புடையதாகவும் இருக்கலாம் ☕🙂.
இதற்குப் பிறகு நீங்கள் படிக்க விரும்பக்கூடிய கட்டுரைகள்:
🔗 உங்கள் வணிகத்தில் AI ஐ எவ்வாறு இணைப்பது
சிறந்த வணிக வளர்ச்சிக்கு AI கருவிகளை ஒருங்கிணைப்பதற்கான நடைமுறை படிகள்.
🔗 அதிக உற்பத்தித் திறன் பெற AI-ஐ எவ்வாறு பயன்படுத்துவது
நேரத்தை மிச்சப்படுத்தும் மற்றும் செயல்திறனை அதிகரிக்கும் பயனுள்ள AI பணிப்பாய்வுகளைக் கண்டறியவும்.
🔗 AI திறன்கள் என்றால் என்ன?
எதிர்காலத்திற்குத் தயாராக உள்ள நிபுணர்களுக்குத் தேவையான முக்கிய AI திறன்களைக் கற்றுக்கொள்ளுங்கள்.
🔗 கூகிள் வெர்டெக்ஸ் AI என்றால் என்ன?
கூகிளின் வெர்டெக்ஸ் AI மற்றும் அது இயந்திர கற்றலை எவ்வாறு நெறிப்படுத்துகிறது என்பதைப் புரிந்து கொள்ளுங்கள்.
திறந்த மூல AI என்றால் என்ன? 🤖🔓
மிக எளிமையாகச் சொன்னால், திறந்த மூல AI என்பது ஒரு AI அமைப்பின் கூறுகள் - குறியீடு, மாதிரி எடைகள், தரவு குழாய்வழிகள், பயிற்சி ஸ்கிரிப்டுகள் மற்றும் ஆவணங்கள் - நியாயமான விதிமுறைகளுக்கு உட்பட்டு, எவரும் அவற்றைப் பயன்படுத்த, படிக்க, மாற்றியமைக்க மற்றும் பகிர அனுமதிக்கும் உரிமங்களின் கீழ் வெளியிடப்படுகின்றன. அந்த மைய சுதந்திர மொழி திறந்த மூல வரையறை மற்றும் அதன் நீண்டகால பயனர் சுதந்திரக் கொள்கைகளிலிருந்து வருகிறது [1]. AI இன் திருப்பம் என்னவென்றால், குறியீட்டை விட அதிகமான பொருட்கள் உள்ளன.
சில திட்டங்கள் குறியீடு, பயிற்சித் தரவு மூலங்கள், செய்முறைகள் மற்றும் பயிற்சி பெற்ற மாதிரி என அனைத்தையும் வெளியிடுகின்றன. மற்றவை எடைகளை . இந்தச் சூழலமைப்பு சில சமயங்களில் ஒழுங்கற்ற சுருக்கெழுத்துக்களைப் பயன்படுத்துகிறது, எனவே அடுத்த பகுதியில் அதைச் சரிசெய்வோம்.
திறந்த மூல AI vs திறந்த எடைகள் vs திறந்த அணுகல் 😅
இங்குதான் மக்கள் ஒருவரையொருவர் கடந்து பேசுகிறார்கள்.
-
திறந்த மூல செயற்கை நுண்ணறிவு — இந்தத் திட்டம் அதன் அடுக்கு முழுவதும் திறந்த மூலக் கொள்கைகளைப் பின்பற்றுகிறது. குறியீடு OSI-அங்கீகரிக்கப்பட்ட உரிமத்தின் கீழ் உள்ளது, மேலும் விநியோக விதிமுறைகள் பரந்த பயன்பாடு, மாற்றம் மற்றும் பகிர்வை அனுமதிக்கின்றன. இங்குள்ள நோக்கம் OSI விவரிப்பதைப் பிரதிபலிக்கிறது: பயனரின் சுதந்திரமே முதன்மையானது [1][2].
-
திறந்த எடைகள் — பயிற்சி பெற்ற மாதிரி எடைகள் பதிவிறக்கம் செய்யக்கூடியவை (பெரும்பாலும் இலவசம்) ஆனால் தனிப்பயனாக்கப்பட்ட விதிமுறைகளின் கீழ். பயன்பாட்டு நிபந்தனைகள், மறுவிநியோக வரம்புகள் அல்லது அறிக்கையிடல் விதிகளை நீங்கள் காண்பீர்கள். மெட்டாவின் லாமா குடும்பம் இதை விளக்குகிறது: குறியீடு சுற்றுச்சூழல் அமைப்பு ஓரளவு திறந்ததாக உள்ளது, ஆனால் மாதிரி எடைகள் பயன்பாடு சார்ந்த நிபந்தனைகளுடன் [4] ஒரு குறிப்பிட்ட உரிமத்தின் கீழ் அனுப்பப்படுகின்றன.
-
திறந்த அணுகல் — நீங்கள் ஒரு API-ஐ, ஒருவேளை இலவசமாக அணுகலாம், ஆனால் அதன் தரவு மதிப்புகள் உங்களுக்குக் கிடைக்காது. இது சோதனைகளுக்கு உதவியானது, ஆனால் திறந்த மூல மென்பொருள் அல்ல.
இது வெறும் சொற்பொருள் மட்டுமல்ல. இந்த வகைகளில் உங்கள் உரிமைகளும் அபாயங்களும் மாறுபடும். AI மற்றும் வெளிப்படைத்தன்மை குறித்த OSI இன் தற்போதைய பணி இந்த நுணுக்கங்களை எளிய மொழியில் வெளிப்படுத்துகிறது [2].
திறந்த மூல AI ஐ உண்மையில் சிறந்ததாக்குவது எது ✅
விரைவாகவும் நேர்மையாகவும் இருப்போம்.
-
தணிக்கைத்தன்மை — நீங்கள் குறியீட்டைப் படிக்கலாம், தரவு செய்முறைகளை ஆய்வு செய்யலாம் மற்றும் பயிற்சி படிகளைக் கண்டறியலாம். அது இணக்கம், பாதுகாப்பு மதிப்பாய்வுகள் மற்றும் பழைய பாணியிலான ஆர்வத்திற்கு உதவுகிறது. NIST AI இடர் மேலாண்மை கட்டமைப்பு ஆவணப்படுத்தல் மற்றும் வெளிப்படைத்தன்மை நடைமுறைகளை ஊக்குவிக்கிறது, அதை திறந்த திட்டங்கள் மிகவும் எளிதாக பூர்த்தி செய்ய முடியும் [3].
-
தகவமைத்துக் கொள்ளும் திறன் — நீங்கள் ஒரு விற்பனையாளரின் செயல் திட்டத்திற்குள் கட்டுப்பட்டவர் அல்ல. அதைப் பிரித்துப் பாருங்கள். பிழைதிருத்தம் செய்யுங்கள். வெளியிடுங்கள். இது லெகோ, ஒட்டப்பட்ட பிளாஸ்டிக் அல்ல.
-
செலவுக் கட்டுப்பாடு — விலை குறைவாக இருக்கும்போது சுயமாக ஹோஸ்ட் செய்யுங்கள். விலை குறைவாக இருக்கும்போது கிளவுடுக்கு மாறுங்கள். வன்பொருட்களைக் கலந்து பயன்படுத்துங்கள்.
-
சமூக வேகம் — பிழைகள் சரிசெய்யப்படுகின்றன, புதிய அம்சங்கள் சேர்க்கப்படுகின்றன, மேலும் சக உறுப்பினர்களிடமிருந்து கற்றுக்கொள்கிறீர்கள். குழப்பமானதா? சில நேரங்களில். பயனுள்ளதா? பெரும்பாலும்.
-
ஆளுகைத் தெளிவு — உண்மையான திறந்த உரிமங்கள் கணிக்கக்கூடியவை. செவ்வாய்க்கிழமை அன்று யாருக்கும் தெரியாமல் மாறும் API சேவை விதிமுறைகளுடன் இதை ஒப்பிட்டுப் பாருங்கள்.
இது சரியானதா? இல்லை. ஆனால் சமரசங்கள் தெளிவாக உள்ளன - பல கருப்புப் பெட்டி சேவைகளிலிருந்து நீங்கள் பெறுவதை விட அதிகம்.
திறந்த மூல AI அடுக்கு: குறியீடு, எடைகள், தரவு மற்றும் பசை 🧩
ஒரு வித்தியாசமான லாசக்னா போன்ற ஒரு AI திட்டத்தை நினைத்துப் பாருங்கள். எல்லா இடங்களிலும் அடுக்குகள் உள்ளன.
-
கட்டமைப்புகளும் இயக்க நேரங்களும் — மாதிரிகளை வரையறுக்கவும், பயிற்சி அளிக்கவும், வழங்கவும் பயன்படும் கருவிகள் (எ.கா., பைடார்ச், டென்சர்ஃப்ளோ). வர்த்தகப் பெயர்களை விட ஆரோக்கியமான சமூகங்களும் ஆவணங்களுமே அதிக முக்கியத்துவம் வாய்ந்தவை.
-
மாதிரி கட்டமைப்புகள் — செயல்திட்டம்: உருமாற்றிகள், பரவல் மாதிரிகள், மீட்டெடுப்பு-மேம்படுத்தப்பட்ட அமைப்புகள்.
-
எடைகள் — பயிற்சியின் போது கற்றுக்கொள்ளப்பட்ட அளவுருக்கள். இங்கு “திறந்தநிலை” என்பது பதிவிறக்கம் செய்யும் உரிமையை மட்டும் சார்ந்தது அல்ல, மாறாக மறுவிநியோகம் மற்றும் வணிகப் பயன்பாட்டு உரிமைகளையும் சார்ந்தது.
-
தரவு மற்றும் செய்முறைகள் — தொகுப்பு ஸ்கிரிப்டுகள், வடிகட்டிகள், மேம்படுத்தல்கள், பயிற்சி அட்டவணைகள். இங்கு வெளிப்படைத்தன்மை என்பது, மீண்டும் மீண்டும் அதே முடிவுகளைப் பெறுவதற்கு மிகவும் அவசியமானதாகும்.
-
கருவியமைப்பு மற்றும் ஒருங்கிணைப்பு — அனுமான சேவையகங்கள், திசையன் தரவுத்தளங்கள், மதிப்பீட்டுக் கட்டமைப்புகள், கண்காணிப்புத்தன்மை, தொடர் மேம்பாட்டு/தொடர் தொழில்நுட்ப மேம்பாடு.
-
உரிமம் வழங்குதல் — நீங்கள் உண்மையில் என்ன செய்ய முடியும் என்பதைத் தீர்மானிக்கும் அமைதியான முதுகெலும்பு. மேலும் விவரங்கள் கீழே.
திறந்த மூல AI-க்கு 101 உரிமம் வழங்குதல் 📜
நீங்கள் ஒரு வழக்கறிஞராக இருக்க வேண்டிய அவசியமில்லை. நீங்கள் வடிவங்களைக் கண்டுபிடிக்க வேண்டும்.
-
தாராளமான குறியீடு உரிமங்கள் — MIT, BSD, Apache-2.0. Apache பல குழுக்கள் பாராட்டும் ஒரு வெளிப்படையான காப்புரிமை மானியத்தை உள்ளடக்கியுள்ளது [1].
-
காப்பிரைட் — GPL குடும்பத்தின்படி, வழித்தோன்றல்கள் அதே உரிமத்தின் கீழ் திறந்த நிலையில் இருக்க வேண்டும். இது சக்தி வாய்ந்தது, ஆனால் உங்கள் கட்டமைப்புத் திட்டத்தில் அதற்கேற்பத் திட்டமிடுங்கள்.
-
மாதிரி-குறிப்பிட்ட உரிமங்கள் — எடைகள் மற்றும் தரவுத்தொகுப்புகளுக்கு, பொறுப்பான AI உரிமக் குடும்பம் (OpenRAIL) போன்ற தனிப்பயன் உரிமங்களை நீங்கள் காண்பீர்கள். இவை பயன்பாடு சார்ந்த அனுமதிகள் மற்றும் கட்டுப்பாடுகளைக் குறியாக்கம் செய்கின்றன; சில வணிகப் பயன்பாட்டை பரவலாக அனுமதிக்கின்றன, மற்றவை தவறான பயன்பாட்டைச் சுற்றி பாதுகாப்பு அரண்களைச் சேர்க்கின்றன [5].
-
தரவுகளுக்கான கிரியேட்டிவ் காமன்ஸ் — தரவுத்தொகுப்புகள் மற்றும் ஆவணங்களுக்கு CC-BY அல்லது CC0 பொதுவானவை. சிறிய அளவில் மூலத்தைக் குறிப்பிடுவது சாத்தியமானதே; ஆரம்பத்திலேயே ஒரு முறையை உருவாக்குங்கள்.
உதவிக்குறிப்பு: ஒவ்வொரு சார்புநிலை, அதன் உரிமம் மற்றும் வணிக மறுபகிர்வு அனுமதிக்கப்படுகிறதா என்பதைப் பட்டியலிடும் ஒரு பக்க பக்கத்தை வைத்திருங்கள். சலிப்பாக இருக்கிறதா? ஆம். அவசியமா? ஆம்.
ஒப்பீட்டு அட்டவணை: பிரபலமான திறந்த மூல AI திட்டங்கள் மற்றும் அவை எங்கு பிரகாசிக்கின்றன 📊
வேண்டுமென்றே சற்று குழப்பமாக இருக்கிறது - உண்மையான குறிப்புகள் அப்படித்தான் இருக்கும்
| கருவி / திட்டம் | இது யாருக்கானது? | விலை அதிகம் | இது ஏன் நன்றாக வேலை செய்கிறது? |
|---|---|---|---|
| பைடார்ச் | ஆராய்ச்சியாளர்கள், பொறியாளர்கள் | இலவசம் | டைனமிக் வரைபடங்கள், மிகப்பெரிய சமூகம், வலுவான ஆவணங்கள். தயாரிப்பில் போர்-சோதனை செய்யப்பட்டது. |
| டென்சர்ஃப்ளோ | நிறுவன குழுக்கள், ML செயல்பாடுகள் | இலவசம் | வரைபட முறை, TF-சேவை, சுற்றுச்சூழல் அமைப்பு ஆழம். சிலருக்கு கூர்மையான கற்றல், இன்னும் உறுதியானது. |
| கட்டிப்பிடிக்கும் முக மின்மாற்றிகள் | காலக்கெடு கொண்ட பில்டர்கள் | இலவசம் | முன்கூட்டியே பயிற்சி பெற்ற மாதிரிகள், குழாய்வழிகள், தரவுத்தொகுப்புகள், எளிதான ஃபைன்-ட்யூனிங். உண்மையிலேயே ஒரு குறுக்குவழி. |
| விஎல்எல்எம் | உள்நோக்கமுள்ள அணிகள் | இலவசம் | வேகமான LLM சேவை, திறமையான KV கேச், பொதுவான GPUகளில் வலுவான செயல்திறன். |
| ல்லாமா.சிபிபி | டிங்கரர்கள், விளிம்பு சாதனங்கள் | இலவசம் | மடிக்கணினிகள் மற்றும் தொலைபேசிகளில் மாதிரிகளை அளவீட்டுடன் உள்ளூரில் இயக்கவும். |
| லாங்செயின் | பயன்பாட்டு டெவலப்பர்கள், முன்மாதிரிகள் | இலவசம் | தொகுக்கக்கூடிய சங்கிலிகள், இணைப்பிகள், முகவர்கள். எளிமையாக வைத்திருந்தால் விரைவான வெற்றிகள். |
| நிலையான பரவல் | படைப்பாற்றல், தயாரிப்பு குழுக்கள் | இலவச எடைகள் | உள்ளூர் அல்லது மேகக்கணியில் பட உருவாக்கம்; அதைச் சுற்றியுள்ள மிகப்பெரிய பணிப்பாய்வுகள் மற்றும் UIகள். |
| ஒல்லாமா | உள்ளூர் CLI-களை விரும்பும் டெவலப்பர்கள் | இலவசம் | உள்ளூர் மாடல்களை இழுத்து இயக்கவும். மாடல் கார்டைப் பொறுத்து உரிமங்கள் மாறுபடும் - அதைப் பாருங்கள். |
ஆம், நிறைய “இலவசம்.” ஹோஸ்டிங், GPUகள், சேமிப்பு மற்றும் மக்கள் நேரங்கள் இலவசம் அல்ல.
நிறுவனங்கள் உண்மையில் வேலையில் திறந்த மூல AI ஐ எவ்வாறு பயன்படுத்துகின்றன 🏢⚙️
நீங்கள் இரண்டு உச்சநிலைகளைக் கேட்பீர்கள்: ஒன்று எல்லோரும் எல்லாவற்றையும் தாங்களாகவே ஏற்றுக்கொள்ள வேண்டும், அல்லது யாரும் ஏற்றுக்கொள்ளக் கூடாது. நிஜ வாழ்க்கை மிகவும் மென்மையானது.
-
விரைவாக முன்மாதிரி உருவாக்குதல் — பயனர் அனுபவத்தையும் தாக்கத்தையும் சரிபார்க்க, தாராளமான திறந்த மாதிரிகளுடன் தொடங்குங்கள். பின்னர் மறுசீரமைக்கவும்.
-
கலப்புச் சேவை — தனியுரிமை சார்ந்த அழைப்புகளுக்கு, VPC-இல் ஹோஸ்ட் செய்யப்பட்ட அல்லது உள்ளக மாதிரியைப் பயன்படுத்தவும். நீண்ட நேர அல்லது திடீர் சுமை ஏற்படும்போது, ஹோஸ்ட் செய்யப்பட்ட API-க்கு மாறவும். இது மிகவும் இயல்பானது.
-
குறுகிய பணிகளுக்காக நுட்பமாகச் சரிசெய்யவும் — களத் தழுவல் பெரும்பாலும் வெறும் அளவை விடச் சிறந்தது.
-
எங்கும் RAG — மீட்டெடுப்பு-மேம்படுத்தப்பட்ட உருவாக்கம், உங்கள் தரவுகளில் பதில்களை நிலைநிறுத்துவதன் மூலம் மாயத்தோற்றங்களைக் குறைக்கிறது. திறந்த வெக்டர் தரவுத்தளங்களும் அடாப்டர்களும் இதை அணுகக்கூடியதாக ஆக்குகின்றன.
-
எட்ஜ் மற்றும் ஆஃப்லைன் — மடிக்கணினிகள், தொலைபேசிகள் அல்லது உலாவிகளுக்காகத் தொகுக்கப்பட்ட இலகுரக மாடல்கள், தயாரிப்பின் பரப்பளவை விரிவுபடுத்துகின்றன.
-
இணக்கம் மற்றும் தணிக்கை — நீங்கள் உள்ளமைப்பை ஆய்வு செய்ய முடிவதால், தணிக்கையாளர்கள் மதிப்பாய்வு செய்ய உறுதியான ஒன்று உள்ளது. அதை NIST இன் RMF வகைகள் மற்றும் ஆவண வழிகாட்டுதலுடன் [3] பொருந்தக்கூடிய ஒரு பொறுப்பான AI கொள்கையுடன் இணைக்கவும்.
ஒரு சிறு களக் குறிப்பு: நான் பார்த்த, தனியுரிமையில் அக்கறை கொண்ட ஒரு SaaS குழு (நடுத்தர சந்தை, ஐரோப்பிய ஒன்றியப் பயனர்கள்) ஒரு கலப்பின அமைப்பைக் கையாண்டது: 80% கோரிக்கைகளுக்கு VPC-க்குள் ஒரு சிறிய திறந்த மாதிரி; அரிதான, நீண்ட சூழல் தேவைப்படும் அறிவிப்புகளுக்கு ஒரு ஹோஸ்ட் செய்யப்பட்ட API-க்கு விரைவாக அனுப்புதல். அவர்கள் பெரிய அளவில் செலவு செய்யாமலேயே, பொதுவான பாதையின் தாமதத்தைக் குறைத்து, DPIA ஆவணப் பணிகளை எளிதாக்கினர்.
நீங்கள் திட்டமிட வேண்டிய அபாயங்கள் மற்றும் வாய்ப்புகள் 🧨
இதைப் பற்றி பெரியவர்களாக இருப்போம்.
-
உரிம மாற்றம் — ஒரு ரெப்போ MIT-ஐத் தொடங்குகிறது, பின்னர் வெயிட்டுகள் ஒரு தனிப்பயன் உரிமத்திற்கு நகர்கின்றன. உங்கள் உள் பதிவேட்டைப் புதுப்பித்த நிலையில் வைத்திருங்கள் இல்லையெனில் நீங்கள் ஒரு இணக்க ஆச்சரியத்தை அனுப்புவீர்கள் [2][4][5].
-
தரவு தோற்றம் — தெளிவற்ற உரிமைகளைக் கொண்ட பயிற்சித் தரவு மாதிரிகளில் பாயலாம். மூலங்களைக் கண்காணித்து, தரவுத்தொகுப்பு உரிமங்களைப் பின்பற்றவும், உணர்வுகளை அல்ல [5].
-
பாதுகாப்பு — மாதிரி ஆவணங்களை மற்ற விநியோகச் சங்கிலி ஆவணங்களைப் போலவே கையாளுங்கள்: சரிபார்ப்புத் தொகைகள், கையொப்பமிடப்பட்ட வெளியீடுகள், SBOM-கள். ஒரு குறைந்தபட்ச SECURITY.md ஆவணம் கூட மௌனத்தை வெல்லும்.
-
தர வேறுபாடு — திறந்த மாதிரிகள் பரவலாக வேறுபடுகின்றன. வெறும் தரவரிசைப் பட்டியல்களை மட்டும் பார்க்காமல், உங்கள் பணிகளைக் கொண்டும் மதிப்பீடு செய்யுங்கள்.
-
மறைமுக உள்கட்டமைப்புச் செலவு — வேகமான அனுமானத்திற்கு GPU-கள், அளவாக்கம், தொகுப்பாக்கம், தற்காலிகச் சேமிப்பு ஆகியவை தேவைப்படுகின்றன. திறந்த கருவிகள் உதவுகின்றன; ஆனாலும், கணக்கீட்டுத் திறனில் நீங்கள் அதற்கான விலையைச் செலுத்துகிறீர்கள்.
-
ஆளுகைக் கடன் — மாதிரி வாழ்க்கைச் சுழற்சிக்கு யாரும் பொறுப்பேற்கவில்லை என்றால், சிக்கலான உள்ளமைவுகள் உருவாகிவிடும். ஒரு எளிமையான MLOps சரிபார்ப்புப் பட்டியல் மிகவும் மதிப்பு வாய்ந்தது.
உங்கள் பயன்பாட்டு சூழ்நிலைக்கு ஏற்ற திறந்த நிலை நிலையைத் தேர்ந்தெடுப்பது 🧭
சற்று கோணலான முடிவெடுக்கும் பாதை:
-
வேண்டுமா விரைவாக அனுப்ப ஒளி இணக்கத் தேவைகளுடன்
-
தேவையா கடுமையான தனியுரிமை அல்லது ஆஃப்லைன் ? நன்கு ஆதரிக்கப்படும் திறந்த அடுக்கு, சுய-ஹோஸ்ட் அனுமானத்தைத் தேர்ந்தெடுத்து, உரிமங்களை கவனமாக மதிப்பாய்வு செய்யவும்.
-
தேவையா பரந்த வணிக உரிமைகள் ? வணிக பயன்பாடு மற்றும் மறுபகிர்வை வெளிப்படையாக அனுமதிக்கும் OSI-சீரமைக்கப்பட்ட குறியீடு மற்றும் மாதிரி உரிமங்களை விரும்புங்கள் [1][5].
-
தேவையா ஆராய்ச்சி நெகிழ்வுத்தன்மை? மறுஉருவாக்கம் மற்றும் பகிர்வுத்திறனுக்காக தரவு உட்பட, இறுதி முதல் இறுதி வரை அனுமதியுடன் செல்லுங்கள்.
-
சரியா தெரியலயா? ரெண்டும் பைலட் பண்ணுங்க. ஒரு வாரத்துல ஒரு பாதை நல்லா இருக்கும்.
ஒரு தொழில்முறை நிபுணரைப் போல திறந்த மூல AI திட்டத்தை எவ்வாறு மதிப்பிடுவது 🔍
நான் வைத்திருக்கும் ஒரு விரைவான சரிபார்ப்புப் பட்டியல், சில நேரங்களில் ஒரு நாப்கினில்.
-
உரிமத் தெளிவு — குறியீட்டிற்கு OSI-ஆல் அங்கீகரிக்கப்பட்டதா? எடைகள் மற்றும் தரவு பற்றி என்ன? உங்கள் வணிக மாதிரியைத் தூண்டும் ஏதேனும் பயன்பாட்டுக் கட்டுப்பாடுகள் உள்ளதா [1][2][5]?
-
ஆவணங்கள் — நிறுவுதல், விரைவுத் தொடக்கம், எடுத்துக்காட்டுகள், பழுது நீக்குதல். ஆவணங்கள் ஒரு கலாச்சாரத்தை வெளிப்படுத்துகின்றன.
-
வெளியீட்டு வரிசைமுறை — குறியிடப்பட்ட வெளியீடுகளும் மாற்றப் பதிவுகளும் நிலைத்தன்மையைக் குறிக்கின்றன; அவ்வப்போதைய வெளியீடுகள் மாபெரும் சாதனைகளைக் குறிக்கின்றன.
-
அளவீடுகள் மற்றும் மதிப்பீடுகள் — பணிகள் யதார்த்தமானவையா? மதிப்பீடுகளை இயக்க முடியுமா?
-
பராமரிப்பு மற்றும் நிர்வாகம் — தெளிவான குறியீட்டு உரிமையாளர்கள், சிக்கல் வகைப்படுத்தல், பிழைத்திருத்தங்களுக்கு விரைவாகப் பதிலளித்தல்.
-
சூழல் அமைப்புப் பொருத்தம் — உங்கள் வன்பொருள், தரவுச் சேமிப்பகங்கள், தரவுப் பதிவு, அங்கீகாரம் ஆகியவற்றுடன் நன்கு இணக்கமாகச் செயல்படுகிறது.
-
பாதுகாப்பு நிலை — கையொப்பமிடப்பட்ட ஆவணங்கள், சார்புநிலை ஆய்வு, CVE கையாளுதல்.
-
சமூக சமிக்ஞை — கலந்துரையாடல்கள், மன்றப் பதில்கள், எடுத்துக்காட்டுக் களஞ்சியங்கள்.
நம்பகமான நடைமுறைகளுடன் பரந்த சீரமைப்புக்கு, உங்கள் செயல்முறையை NIST AI RMF வகைகள் மற்றும் ஆவணக் கலைப்பொருட்களுடன் வரைபடமாக்குங்கள் [3].
ஆழமான ஆய்வு 1: மாதிரி உரிமங்களின் குழப்பமான நடுப்பகுதி 🧪
சில மிகவும் திறமையான மாதிரிகள் "நிபந்தனைகளுடன் கூடிய திறந்த எடைகள்" பிரிவில் உள்ளன. அவை அணுகக்கூடியவை, ஆனால் பயன்பாட்டுக் கட்டுப்பாடுகள் அல்லது மறுவிநியோக விதிகளுடன் உள்ளன. உங்கள் தயாரிப்பு மாதிரியை மறுபேக்கேஜிங் செய்வதையோ அல்லது வாடிக்கையாளர் சூழல்களுக்கு அனுப்புவதையோ சார்ந்திருக்கவில்லை என்றால் அது சரியாக இருக்கலாம். உங்களுக்கு தேவைப்பட்டால் வரைபடமாக்குவதே முக்கியமாகும் உங்கள் பின்தொடர் திட்டங்களை உண்மையான வலைப்பதிவு இடுகையுடன் [4][5] அல்லாமல்,
OpenRAIL பாணி உரிமங்கள் சமநிலையை ஏற்படுத்த முயற்சிக்கின்றன: திறந்த ஆராய்ச்சி மற்றும் பகிர்வை ஊக்குவிக்கவும், அதே நேரத்தில் தவறான பயன்பாட்டை ஊக்கப்படுத்தவும். நோக்கம் நல்லது; கடமைகள் இன்னும் உங்களுடையவை. விதிமுறைகளைப் படித்து, நிபந்தனைகள் உங்கள் ஆபத்து விருப்பத்திற்கு பொருந்துமா என்பதை முடிவு செய்யுங்கள் [5].
ஆழமான ஆய்வு 2: தரவு வெளிப்படைத்தன்மை மற்றும் மறுஉருவாக்கம் பற்றிய கட்டுக்கதை 🧬
"முழுமையான தரவுத் தொகுப்புகள் இல்லாமல், திறந்த மூல AI போலியானது." முற்றிலும் சரியல்ல. சில மூலத் தரவுத்தொகுப்புகள் கட்டுப்படுத்தப்பட்டிருந்தாலும், தரவு தோற்றம் மற்றும் செய்முறைகள் அர்த்தமுள்ள வெளிப்படைத்தன்மையை வழங்க முடியும். மற்றொரு குழு முடிவுகளை தோராயமாக மதிப்பிடுவதற்கு, வடிப்பான்கள், மாதிரி விகிதங்கள் மற்றும் சுத்திகரிப்பு வழிமுறைகளை நீங்கள் போதுமான அளவு ஆவணப்படுத்தலாம். சரியான மறுஉருவாக்கம் நல்லது. செயல்படுத்தக்கூடிய வெளிப்படைத்தன்மை பெரும்பாலும் போதுமானது [3][5].
தரவுத்தொகுப்புகள் திறந்திருக்கும் போது, CC-BY அல்லது CC0 போன்ற கிரியேட்டிவ் காமன்ஸ் சுவைகள் பொதுவானவை. அளவில் பண்புக்கூறு செய்வது சிரமமாக இருக்கலாம், எனவே நீங்கள் அதை எவ்வாறு கையாளுகிறீர்கள் என்பதை முன்கூட்டியே தரப்படுத்தவும்.
ஆழமான டைவ் 3: திறந்த மாதிரிகளுக்கான நடைமுறை MLOps 🚢
திறந்த மாதிரியை அனுப்புவது என்பது எந்தவொரு சேவையையும் அனுப்புவது போன்றது, அதோடு சில நுணுக்கங்களும் கூட.
-
சேவை அடுக்கு — சிறப்பு அனுமான சேவையகங்கள் தொகுத்தல், KV-தற்காலிக நினைவக மேலாண்மை மற்றும் டோக்கன் தொடர் ஓட்டம் ஆகியவற்றை மேம்படுத்துகின்றன.
-
அளவாக்கம் — சிறிய எடைகள் → மலிவான அனுமானம் மற்றும் எளிதான எட்ஜ் வரிசைப்படுத்தல். தர சமரசங்கள் மாறுபடும்; உங்கள் பணிகளைக் கொண்டு அளவிடுங்கள்.
-
கண்காணிப்புத்தன்மை — தனியுரிமையைக் கருத்தில் கொண்டு தூண்டுதல்கள்/வெளியீடுகளைப் பதிவு செய்யவும். மதிப்பீட்டிற்காக மாதிரியை எடுக்கவும். பாரம்பரிய இயந்திரக் கற்றலில் (ML) செய்வது போல, விலகல் சரிபார்ப்புகளைச் சேர்க்கவும்.
-
புதுப்பிப்புகள் — மாதிரிகளின் நடத்தை நுட்பமாக மாறக்கூடும்; பழைய நிலைக்குத் திரும்புவதற்கும் தணிக்கைகளுக்கும் கேனரி சமிக்ஞைகளைப் பயன்படுத்தி ஒரு காப்பகத்தைப் பராமரிக்கவும்.
-
மதிப்பீட்டுக் கட்டமைப்பு — பொதுவான அளவுகோல்களை மட்டும் அல்லாமல், ஒரு பணி சார்ந்த மதிப்பீட்டுத் தொகுப்பைப் பராமரிக்கவும். பாதகமான தூண்டுதல்கள் மற்றும் தாமத வரவுசெலவுத் திட்டங்களை உள்ளடக்கவும்.
ஒரு மினி ப்ளூபிரிண்ட்: பூஜ்ஜியத்திலிருந்து பயன்படுத்தக்கூடிய பைலட் வரை 10 படிகளில் 🗺️
-
ஒரு குறுகிய பணி மற்றும் அளவீட்டை வரையறுக்கவும். இன்னும் பிரமாண்டமான தளங்கள் இல்லை.
-
பரவலாகப் பயன்படுத்தப்படும் மற்றும் நன்கு ஆவணப்படுத்தப்பட்ட ஒரு அனுமதிக்கப்பட்ட அடிப்படை மாதிரியைத் தேர்ந்தெடுக்கவும்.
-
உள்ளூர் அனுமானத்தையும் மெல்லிய ரேப்பர் API-யையும் உருவாக்குங்கள். அதை சலிப்படையச் செய்யுங்கள்.
-
உங்கள் தரவில் தரை வெளியீடுகளில் மீட்டெடுப்பைச் சேர்க்கவும்.
-
உங்கள் பயனர்கள், மருக்கள் மற்றும் அனைத்தையும் பிரதிபலிக்கும் ஒரு சிறிய லேபிளிடப்பட்ட eval தொகுப்பைத் தயாரிக்கவும்.
-
மதிப்பீடு நீங்கள் வேண்டும் என்று சொன்னால் மட்டுமே ஃபைன்-ட்யூன் அல்லது ப்ராம்ட்-ட்யூன் செய்யவும்.
-
தாமதம் அல்லது செலவு அதிகமாக இருந்தால் அளவிடவும். தரத்தை மீண்டும் அளவிடவும்.
-
பதிவு செய்தல், ரெட்-டீமிங் தூண்டுதல்கள் மற்றும் துஷ்பிரயோகக் கொள்கையைச் சேர்க்கவும்.
-
ஒரு சிறிய குழுவிற்கு ஒரு அம்சக் கொடி மற்றும் வெளியீட்டைக் கொண்ட வாயில்.
-
திரும்பத் திரும்பச் சொல்லுங்கள். வாரந்தோறும் சிறிய மேம்பாடுகளை அனுப்புங்கள்... அல்லது அது உண்மையிலேயே சிறப்பாக இருக்கும்போது.
திறந்த மூல AI பற்றிய பொதுவான கட்டுக்கதைகள், கொஞ்சம் நீக்கப்பட்டது 🧱
-
கட்டுக்கதை: திறந்த மாதிரிகள் எப்போதும் மோசமானவை. யதார்த்தம்: சரியான தரவுகளுடன் இலக்கு வைக்கப்பட்ட பணிகளுக்கு, நன்றாகச் சரிசெய்யப்பட்ட திறந்த மாதிரிகள் பெரிய ஹோஸ்ட் செய்யப்பட்டவற்றை விட சிறப்பாகச் செயல்படும்.
-
கட்டுக்கதை: திறந்த தன்மை என்பது பாதுகாப்பற்ற தன்மையைக் குறிக்கிறது. யதார்த்தம்: திறந்த தன்மை ஆய்வை மேம்படுத்தும். பாதுகாப்பு ரகசியத்தை அல்ல, நடைமுறைகளைப் பொறுத்தது [3].
-
கட்டுக்கதை: இலவசமாக இருந்தால் உரிமம் ஒரு பொருட்டல்ல. உண்மை: அது மிகவும் இலவசமாக இருக்கும்போதுதான்
திறந்த மூல AI 🧠✨
திறந்த மூல AI என்பது ஒரு மதம் அல்ல. இது அதிக கட்டுப்பாடு, தெளிவான நிர்வாகம் மற்றும் வேகமான மறு செய்கை மூலம் உங்களை உருவாக்க அனுமதிக்கும் நடைமுறை சுதந்திரங்களின் தொகுப்பாகும். யாராவது ஒரு மாதிரி "திறந்திருக்கும்" என்று கூறும்போது, எந்த அடுக்குகள் திறந்திருக்கும் என்று கேளுங்கள்: குறியீடு, எடைகள், தரவு அல்லது அணுகல். உரிமத்தைப் படியுங்கள். அதை உங்கள் பயன்பாட்டு வழக்குடன் ஒப்பிடுங்கள். பின்னர், முக்கியமாக, அதை உங்கள் உண்மையான பணிச்சுமையுடன் சோதிக்கவும்.
விந்தையாக, சிறந்த பகுதி கலாச்சாரமானது: திறந்த திட்டங்கள் பங்களிப்புகளையும் ஆய்வுகளையும் அழைக்கின்றன, இது மென்பொருளையும் மக்களையும் சிறந்ததாக்குகிறது. வெற்றிபெறும் நடவடிக்கை மிகப்பெரிய மாதிரி அல்லது மிகவும் பிரகாசமான அளவுகோல் அல்ல என்பதை நீங்கள் கண்டறியலாம், ஆனால் அடுத்த வாரம் நீங்கள் உண்மையில் புரிந்துகொண்டு, சரிசெய்து, மேம்படுத்தக்கூடிய ஒன்று. அதுதான் திறந்த மூல AI இன் அமைதியான சக்தி - ஒரு வெள்ளி தோட்டா அல்ல, நாளைக் காப்பாற்றும் ஒரு நன்கு அணிந்த பல கருவி போன்றது.
ரொம்ப நேரம் ஆச்சு படிக்கவே முடியல 📝
திறந்த மூல AI என்பது AI அமைப்புகளைப் பயன்படுத்த, படிக்க, மாற்ற மற்றும் பகிர அர்த்தமுள்ள சுதந்திரத்தைப் பற்றியது. இது கட்டமைப்புகள், மாதிரிகள், தரவு மற்றும் கருவி போன்ற அடுக்குகளில் தோன்றும். திறந்த மூலத்தை திறந்த எடைகள் அல்லது திறந்த அணுகலுடன் குழப்ப வேண்டாம். உரிமத்தைச் சரிபார்க்கவும், உங்கள் உண்மையான பணிகளுடன் மதிப்பீடு செய்யவும், முதல் நாளிலிருந்தே பாதுகாப்பு மற்றும் நிர்வாகத்திற்கான வடிவமைப்பைச் செய்யவும். அதைச் செய்யுங்கள், நீங்கள் வேகம், கட்டுப்பாடு மற்றும் அமைதியான பாதை வரைபடத்தைப் பெறுவீர்கள். ஆச்சரியப்படும் விதமாக அரிதானது, நேர்மையாக விலைமதிப்பற்றது 🙃.
குறிப்புகள்
[1] திறந்த மூல முன்முயற்சி - திறந்த மூல வரையறை (OSD): மேலும் படிக்க
[2] OSI - AI & வெளிப்படைத்தன்மை பற்றிய ஆழமான பார்வை: மேலும் படிக்க
[3] NIST - AI இடர் மேலாண்மை கட்டமைப்பு: மேலும் படிக்க
[4] மெட்டா - லாமா மாதிரி உரிமம்: மேலும் படிக்க
[5] பொறுப்பான AI உரிமங்கள் (OpenRAIL): மேலும் படிக்க