AI அளவிடுதல் என்றால் என்ன?

AI அளவிடுதல் என்றால் என்ன?

ஒரு டெமோ மாடல் ஒரு சிறிய சோதனை சுமையை நசுக்கி, உண்மையான பயனர்கள் தோன்றும் தருணத்தை முடக்குவதை நீங்கள் எப்போதாவது பார்த்திருந்தால், நீங்கள் வில்லனை சந்தித்திருக்கிறீர்கள்: அளவிடுதல். AI தரவு, கணினி, நினைவகம், அலைவரிசை - மற்றும் விந்தையாக, கவனத்திற்கு பேராசை கொண்டது. எனவே AI அளவிடுதல் என்றால் என்ன, உண்மையில், ஒவ்வொரு வாரமும் எல்லாவற்றையும் மீண்டும் எழுதாமல் அதை எவ்வாறு பெறுவது?

இதற்குப் பிறகு நீங்கள் படிக்க விரும்பக்கூடிய கட்டுரைகள்:

🔗 AI சார்பு என்றால் என்ன என்பதை எளிமையாக விளக்குகிறோம்.
மறைக்கப்பட்ட சார்புகள் AI முடிவுகள் மற்றும் மாதிரி விளைவுகளை எவ்வாறு வடிவமைக்கின்றன என்பதை அறிக.

🔗 தொடக்க வழிகாட்டி: செயற்கை நுண்ணறிவு என்றால் என்ன?
AI, முக்கிய கருத்துக்கள், வகைகள் மற்றும் அன்றாட பயன்பாடுகளின் கண்ணோட்டம்.

🔗 விளக்கக்கூடிய AI என்றால் என்ன, அது ஏன் முக்கியமானது
விளக்கக்கூடிய AI எவ்வாறு வெளிப்படைத்தன்மை, நம்பிக்கை மற்றும் ஒழுங்குமுறை இணக்கத்தை அதிகரிக்கிறது என்பதைக் கண்டறியவும்.

🔗 முன்கணிப்பு AI என்றால் என்ன, அது எவ்வாறு செயல்படுகிறது
முன்கணிப்பு AI, பொதுவான பயன்பாட்டு வழக்குகள், நன்மைகள் மற்றும் வரம்புகளைப் புரிந்து கொள்ளுங்கள்.


AI அளவிடுதல் என்றால் என்ன? 📈

AI அளவிடுதல் என்பது ஒரு AI அமைப்பின் செயல்திறன், நம்பகத்தன்மை மற்றும் செலவுகளை ஏற்றுக்கொள்ளக்கூடிய வரம்புகளுக்குள் வைத்துக்கொண்டு அதிக தரவு, கோரிக்கைகள், பயனர்கள் மற்றும் பயன்பாட்டு நிகழ்வுகளைக் கையாளும் திறன் ஆகும். பெரிய சேவையகங்கள் மட்டுமல்ல - வளைவு ஏறும் போது தாமதத்தை குறைவாகவும், செயல்திறன் அதிகமாகவும், தரத்தை சீராகவும் வைத்திருக்கும் ஸ்மார்ட்டர் கட்டமைப்புகள். மீள் உள்கட்டமைப்பு, உகந்த மாதிரிகள் மற்றும் கவனிக்கத்தக்க தன்மை ஆகியவை உண்மையில் தீயில் இருப்பதை உங்களுக்குச் சொல்லும் என்று சிந்தியுங்கள்.

 

AI அளவிடுதல்

நல்ல AI அளவிடுதலை உருவாக்குவது எது ✅

AI அளவிடுதல் சிறப்பாக செய்யப்படும்போது, ​​நீங்கள் பெறுவீர்கள்:

  • கூர்மையான அல்லது நீடித்த சுமையின் கீழ் கணிக்கக்கூடிய தாமதம்

  • சேர்க்கப்பட்ட வன்பொருள் அல்லது பிரதிகளுக்கு விகிதத்தில் தோராயமாக வளரும் செயல்திறன்.

  • செலவுத் திறன் அதிகரிக்காது.

  • உள்ளீடுகள் பல்வகைப்பட்டு அளவுகள் அதிகரிக்கும் போது தர நிலைத்தன்மை

  • ஆட்டோஸ்கேலிங், டிரேசிங் மற்றும் விவேகமான SLO-க்கள் காரணமாக செயல்பாட்டு அமைதி.

இது வழக்கமாக கிடைமட்ட அளவிடுதல், தொகுதிப்படுத்துதல், தற்காலிக சேமிப்பு, அளவீடு, வலுவான சேவை மற்றும் பிழை பட்ஜெட்டுகளுடன் இணைக்கப்பட்ட சிந்தனைமிக்க வெளியீட்டு கொள்கைகளை ஒருங்கிணைக்கிறது [5].


AI அளவிடுதல் vs செயல்திறன் vs திறன் 🧠

  • செயல்திறன் என்பது ஒரு கோரிக்கை எவ்வளவு விரைவாக தனிமையில் நிறைவடைகிறது என்பதாகும்.

  • திறன் என்பது ஒரே நேரத்தில் எத்தனை கோரிக்கைகளை நீங்கள் கையாள முடியும் என்பதுதான்.

  • AI அளவிடுதல் என்பது வளங்களைச் சேர்ப்பதா அல்லது சிறந்த நுட்பங்களைப் பயன்படுத்துவதா என்பது திறனை அதிகரிப்பதா மற்றும் செயல்திறனை சீராக வைத்திருப்பதா என்பதுதான் - உங்கள் பில் அல்லது உங்கள் பேஜரை ஊதிப் பெருக்காமல்.

சிறிய வேறுபாடு, மிகப்பெரிய விளைவுகள்.


AI-யில் அளவுகோல் ஏன் வேலை செய்கிறது: அளவிடுதல் சட்டங்களின் யோசனை 📚

மாதிரி அளவு, தரவு மற்றும் கணக்கீடு அளவிடும்போது இழப்பு கணிக்கக்கூடிய வழிகளில் மேம்படும் கணக்கீட்டு-உகந்த சமநிலையும் உள்ளது ; இரண்டையும் ஒன்றாக அளவிடுவது ஒன்றை மட்டுமே அளவிடுவதை விட அதிகமாகும். நடைமுறையில், இந்த யோசனைகள் பயிற்சி பட்ஜெட்டுகள், தரவுத்தொகுப்பு திட்டமிடல் மற்றும் பரிமாற்றங்களை வழங்குதல் [4] ஆகியவற்றைத் தெரிவிக்கின்றன.

விரைவான மொழிபெயர்ப்பு: பெரியது சிறப்பாக இருக்கும், ஆனால் உள்ளீடுகளை அளந்து விகிதாசாரத்தில் கணக்கிடும்போது மட்டுமே - இல்லையெனில் அது ஒரு சைக்கிளில் டிராக்டர் டயர்களை வைப்பது போன்றது. அது தீவிரமாகத் தெரிகிறது, எங்கும் செல்லாது.


கிடைமட்டம் vs செங்குத்து: இரண்டு அளவிடுதல் நெம்புகோல்கள் 🔩

  • செங்குத்து அளவிடுதல் : பெரிய பெட்டிகள், அதிக எடை கொண்ட GPUகள், அதிக நினைவகம். எளிமையானது, சில நேரங்களில் விலை அதிகம். ஒற்றை-முனை பயிற்சி, குறைந்த தாமத அனுமானம் அல்லது உங்கள் மாதிரி நன்றாகத் துண்டாக்க மறுக்கும் போது நல்லது.

  • கிடைமட்ட அளவிடுதல் ஆட்டோஸ்கேலர்களுடன் சிறப்பாகச் செயல்படும் . குபெர்னெட்டஸில், போக்குவரத்து அதிகரிப்புகளுக்கான உங்கள் அடிப்படை கூட்டக் கட்டுப்பாட்டிற்கு ஏற்ப ஹாரிஸான்டாடோஸ்கேலர் பாட்களை அளவிடுகிறது [1].

நிகழ்வு (கலவை): ஒரு உயர்-சுயவிவர வெளியீட்டின் போது, ​​சர்வர்-சைடு பேட்ச்சிங்கை இயக்குவதும், எந்த கிளையன்ட் மாற்றங்களும் இல்லாமல் வரிசை ஆழம் நிலைப்படுத்தப்பட்ட p95 க்கு ஆட்டோஸ்கேலரை எதிர்வினையாற்ற அனுமதிப்பதும். வெளிப்படையான வெற்றிகள் இன்னும் வெற்றிகளாகும்.


AI அளவிடுதலின் முழு அடுக்கு 🥞

  1. தரவு அடுக்கு : வேகமான பொருள் கடைகள், திசையன் குறியீடுகள் மற்றும் உங்கள் பயிற்சியாளர்களைத் தடுக்காத ஸ்ட்ரீமிங் உட்கொள்ளல்.

  2. பயிற்சி அடுக்கு : தரவு/மாதிரி இணைநிலை, சோதனைச் சாவடி, மறுமுயற்சிகளைக் கையாளும் பரவலாக்கப்பட்ட கட்டமைப்புகள் மற்றும் திட்டமிடுபவர்கள்.

  3. சேவை அடுக்கு : உகந்த இயக்க நேரங்கள், டைனமிக் பேட்சிங் , பேஜ்டு அட்டென்ஷன் , கேச்சிங், டோக்கன் ஸ்ட்ரீமிங். ட்ரைடன் மற்றும் vLLM ஆகியவை இங்கே அடிக்கடி வரும் ஹீரோக்கள் [2][3].

  4. இசைக்குழு : HPA அல்லது தனிப்பயன் ஆட்டோஸ்கேலர்கள் வழியாக நெகிழ்ச்சித்தன்மைக்கான குபெர்னெட்டுகள் [1].

  5. கவனிக்கத்தக்க தன்மை : பயனர் பயணங்களைப் பின்பற்றும் தடயங்கள், அளவீடுகள் மற்றும் பதிவுகள் மற்றும் தயாரிப்பில் மாதிரி நடத்தை; உங்கள் SLO களைச் சுற்றி அவற்றை வடிவமைக்கவும் [5].

  6. நிர்வாகம் & செலவு : ஒவ்வொரு கோரிக்கைக்கும் பொருளாதாரம், பட்ஜெட்டுகள் மற்றும் ரன்வே பணிச்சுமைகளுக்கான கொலை-சுவிட்சுகள்.


ஒப்பீட்டு அட்டவணை: AI அளவிடுதல் கருவிகள் & வடிவங்கள் 🧰

வேண்டுமென்றே கொஞ்சம் சீரற்றது - ஏனென்றால் நிஜ வாழ்க்கை அப்படித்தான்.

கருவி / வடிவம் பார்வையாளர்கள் விலை அதிகம் இது ஏன் வேலை செய்கிறது குறிப்புகள்
குபெர்னெட்ஸ் + HPA தள அணிகள் திறந்த மூல + உள்கட்டமைப்பு அளவீடுகள் அதிகரிக்கும்போது செதில்கள் கிடைமட்டமாகப் பாட்களாகின்றன. தனிப்பயன் அளவீடுகள் தங்கம் [1]
என்விடியா ட்ரைடன் அனுமானம் SRE இலவச சர்வர்; GPU $ டைனமிக் பேட்சிங் செயல்திறனை அதிகரிக்கிறது config.pbtxt வழியாக உள்ளமைக்கவும் [2]
vLLM (பக்க கவனம்) எல்.எல்.எம் அணிகள் திறந்த மூல திறமையான KV-கேச் பேஜிங் மூலம் அதிக செயல்திறன் நீண்ட குறிப்புகளுக்கு சிறந்தது [3]
ONNX இயக்க நேரம் / டென்சர்ஆர்டி பெர்ஃப் மேதாவிகள் இலவச / விற்பனையாளர் கருவிகள் கர்னல்-நிலை மேம்படுத்தல்கள் தாமதத்தைக் குறைக்கின்றன ஏற்றுமதி பாதைகள் குழப்பமாக இருக்கலாம்.
RAG முறை பயன்பாட்டு அணிகள் உள் + குறியீடு மீட்டெடுப்பதற்கு அறிவை ஏற்றுகிறது; குறியீட்டை அளவிடுகிறது புத்துணர்ச்சிக்கு சிறந்தது

ஆழமான டைவ் 1: ஊசியை நகர்த்தும் தந்திரங்களை வழங்குதல் 🚀

  • டைனமிக் பேட்சிங் குழுக்கள் சிறிய அனுமான அழைப்புகளை சேவையகத்தில் பெரிய தொகுதிகளாக மாற்றுகின்றன, கிளையன்ட் மாற்றங்கள் இல்லாமல் GPU பயன்பாட்டை வியத்தகு முறையில் அதிகரிக்கின்றன [2].

  • பக்கவாட்டு கவனம், KV தற்காலிக சேமிப்புகளை பக்கமாக்குவதன் மூலம் அதிக உரையாடல்களை நினைவகத்தில் வைத்திருக்கிறது, இது ஒருங்கிணைவின் கீழ் செயல்திறனை மேம்படுத்துகிறது [3].

  • ஒரே மாதிரியான தூண்டுதல்கள் அல்லது உட்பொதிவுகளுக்கான ஒருங்கிணைப்பு மற்றும் தற்காலிக சேமிப்பைக் கோருதல்

  • சுவர் கடிகாரம் அரிதாகவே அசைந்தாலும், ஊக டிகோடிங்


ஆழமான டைவ் 2: மாதிரி-நிலை செயல்திறன் - அளவீடு, வடிகட்டுதல், ப்ரூன் 🧪

  • அளவீடு நினைவகத்தை சுருக்கவும் அனுமானத்தை விரைவுபடுத்தவும் அளவுரு துல்லியத்தை (எ.கா., 8-பிட்/4-பிட்) குறைக்கிறது; மாற்றங்களுக்குப் பிறகு எப்போதும் பணி தரத்தை மறு மதிப்பீடு செய்யுங்கள்.

  • வடிகட்டுதல் ஒரு பெரிய ஆசிரியரிடமிருந்து உங்கள் வன்பொருள் உண்மையில் விரும்பும் ஒரு சிறிய மாணவருக்கு அறிவை மாற்றுகிறது.

  • கட்டமைக்கப்பட்ட கத்தரித்தல், குறைந்த பங்களிப்பை வழங்கும் எடைகள்/தலைகளை ஒழுங்கமைக்கிறது.

உண்மையைச் சொல்லப் போனால், இது உங்கள் சூட்கேஸின் அளவைக் குறைத்து, பின்னர் உங்கள் எல்லா காலணிகளும் இன்னும் பொருந்த வேண்டும் என்று வலியுறுத்துவது போன்றது. எப்படியோ அது பெரும்பாலும் அப்படித்தான்.


ஆழமான டைவ் 3: கண்ணீர் இல்லாமல் தரவு மற்றும் பயிற்சி அளவிடுதல் 🧵

  • இணையான தன்மையின் கடினமான பகுதிகளை மறைக்கும் பரவலாக்கப்பட்ட பயிற்சியைப் பயன்படுத்தவும், இதன் மூலம் நீங்கள் சோதனைகளை விரைவாக அனுப்ப முடியும்.

  • அந்த அளவிடுதல் சட்டங்களை : மாதிரி அளவு மற்றும் டோக்கன்களுக்கு இடையே பட்ஜெட்டை சிந்தனையுடன் ஒதுக்குங்கள்; இரண்டையும் ஒன்றாக அளவிடுவது கணக்கீட்டு திறன் கொண்டது [4].

  • பாடத்திட்டமும் தரவுத் தரமும் பெரும்பாலும் மக்கள் ஒப்புக்கொள்வதை விட விளைவுகளை அதிகமாக மாற்றுகின்றன. சிறந்த தரவு சில நேரங்களில் அதிக தரவை விட அதிகமாக இருக்கும் - நீங்கள் ஏற்கனவே பெரிய கிளஸ்டரை ஆர்டர் செய்திருந்தாலும் கூட.


ஆழமான டைவ் 4: அறிவை அளவிடுவதற்கான ஒரு உத்தியாக RAG 🧭

மாறிவரும் உண்மைகளுடன் தொடர்ந்து இணைந்திருக்க ஒரு மாதிரியை மீண்டும் பயிற்சி செய்வதற்குப் பதிலாக, RAG அனுமானத்தில் ஒரு மீட்டெடுப்பு படியைச் சேர்க்கிறது. உங்கள் கார்பஸ் வளரும்போது மாதிரியை நிலையாக வைத்திருக்கலாம் மற்றும் குறியீட்டையும் மீட்டெடுப்பாளர்களையும் அளவிடலாம் . அறிவு மிகுந்த பயன்பாடுகளுக்கான முழு மறுபயிற்சிகளை விட நேர்த்தியானது - மேலும் பெரும்பாலும் மலிவானது.


தனக்குத்தானே பணம் செலுத்தும் கவனிப்பு 🕵️♀️

நீங்கள் பார்க்க முடியாததை அளவிட முடியாது. இரண்டு அத்தியாவசியங்கள்:

  • திறன் திட்டமிடல் மற்றும் தானியங்கு அளவிடுதலுக்கான அளவீடுகள்

  • தடயங்கள் . நீங்கள் அளவிடும் அளவை உங்கள் SLOகளுடன் இணைக்கவும், இதனால் டேஷ்போர்டுகள் ஒரு நிமிடத்திற்குள் கேள்விகளுக்கு பதிலளிக்கும் [5].

டேஷ்போர்டுகள் ஒரு நிமிடத்திற்குள் கேள்விகளுக்கு பதிலளிக்கும்போது, ​​மக்கள் அவற்றைப் பயன்படுத்துகிறார்கள். அவை பதிலளிக்காதபோது, ​​அவர்கள் அவ்வாறு செய்வது போல் பாசாங்கு செய்கிறார்கள்.


நம்பகத்தன்மை பாதுகாப்புத் தடுப்புகள்: SLOக்கள், பிழை பட்ஜெட்டுகள், நியாயமான வெளியீடுகள் 🧯

  • தாமதம், கிடைக்கும் தன்மை மற்றும் முடிவுத் தரம் ஆகியவற்றிற்கான SLO-களை வரையறுக்கவும் வெளியீட்டு வேகத்துடன் நம்பகத்தன்மையை சமநிலைப்படுத்த பிழை பட்ஜெட்டுகளைப்

  • உலகளாவிய சோதனைகளுக்கு முன் போக்குவரத்துப் பிரிவுகளுக்குப் பின்னால் செல்லுங்கள், கேனரிகளைச் செய்யுங்கள், நிழல் சோதனைகளை நடத்துங்கள். உங்கள் எதிர்கால சுயம் சிற்றுண்டிகளை அனுப்பும்.


நாடகம் இல்லாமல் செலவு கட்டுப்பாடு 💸

அளவிடுதல் என்பது வெறும் தொழில்நுட்பம் மட்டுமல்ல; அது நிதி சார்ந்தது. GPU மணிநேரங்களையும் டோக்கன்களையும் யூனிட் பொருளாதாரத்துடன் (1k டோக்கன்களுக்கான செலவு, ஒரு உட்பொதிப்புக்கு, ஒரு வெக்டர் வினவலுக்கு) முதல் தர வளங்களாகக் கருதுங்கள். பட்ஜெட்டுகள் மற்றும் எச்சரிக்கையைச் சேர்க்கவும்; விஷயங்களை நீக்குவதைக் கொண்டாடுங்கள்.


AI அளவிடுதலுக்கான எளிய வரைபடம் 🗺️

  1. SLOகளுடன் தொடங்குங்கள் ; முதல் நாளில் வயர் அளவீடுகள்/தடங்கள் [5].

  2. பேட்சிங் மற்றும் தொடர்ச்சியான பேட்சிங்கை ஆதரிக்கும் ஒரு சர்விங் ஸ்டேக்கைத் தேர்ந்தெடுக்கவும்

  3. மாதிரியை மேம்படுத்தவும் : அது எங்கு உதவுகிறது என்பதை அளவிடவும், வேகமான கர்னல்களை இயக்கவும் அல்லது குறிப்பிட்ட பணிகளுக்கு வடிகட்டவும்; உண்மையான மதிப்பீடுகளுடன் தரத்தை சரிபார்க்கவும்.

  4. நெகிழ்ச்சித்தன்மைக்கான கட்டிடக் கலைஞர் : சரியான சமிக்ஞைகள், தனி வாசிப்பு/எழுதும் பாதைகள் மற்றும் நிலையற்ற அனுமான பிரதிகள் கொண்ட குபெர்னெட்ஸ் HPA [1].

  5. மீட்டெடுப்பை ஏற்றுக்கொள்ளுங்கள் , இதனால் ஒவ்வொரு வாரமும் மீண்டும் பயிற்சி செய்வதற்குப் பதிலாக உங்கள் குறியீட்டை அளவிடலாம்.

  6. செலவுடன் வளையத்தை மூடு : அலகு பொருளாதாரம் மற்றும் வாராந்திர மதிப்புரைகளை நிறுவுதல்.


பொதுவான தோல்வி முறைகள் & விரைவான திருத்தங்கள் 🧨

  • GPU 30% பயன்பாட்டில் உள்ளது, அதே நேரத்தில் தாமதம் மோசமாக உள்ளது.

    • டைனமிக் பேட்சிங்கை இயக்கவும் , பேட்ச் கேப்களை கவனமாக உயர்த்தவும், சர்வர் கன்கரன்சியை மீண்டும் சரிபார்க்கவும் [2].

  • நீண்ட தூண்டுதல்களுடன் செயல்திறன் குறைகிறது

    • பக்கவாட்டு கவனத்தை மற்றும் அதிகபட்ச ஒரே நேரத்தில் வரிசைகளை சரிசெய்யும் சேவையைப் பயன்படுத்தவும்

  • ஆட்டோஸ்கேலர் மடிப்புகள்

    • சாளரங்களுடன் மென்மையான அளவீடுகள்; தூய CPU க்கு பதிலாக வரிசை ஆழம் அல்லது வினாடிக்கு தனிப்பயன் டோக்கன்களில் அளவிடுதல் [1].

  • அறிமுகப்படுத்தப்பட்ட பிறகு செலவுகள் வெடிக்கின்றன

    • கோரிக்கை-நிலை செலவு அளவீடுகளைச் சேர்க்கவும், பாதுகாப்பான இடங்களில் அளவீட்டை இயக்கவும், சிறந்த வினவல்களைத் தற்காலிகமாகச் சேமிக்கவும், மோசமான குற்றவாளிகளை விகித-வரம்பு செய்யவும்.


AI அளவிடுதல் விளையாட்டு புத்தகம்: விரைவான சரிபார்ப்புப் பட்டியல் ✅

  • SLO-களும் பிழை பட்ஜெட்டுகளும் உள்ளன, அவை தெரியும்.

  • அளவீடுகள்: தாமதம், tps, GPU mem, தொகுதி அளவு, டோக்கன்/கள், கேச் ஹிட்

  • நுழைவு முதல் மாதிரி வரை பிந்தைய செயல்முறை வரை தடயங்கள்

  • பரிமாறுதல்: பேட்சிங் ஆன், கன்கரன்சி டியூன் செய்யப்பட்டது, சூடான கேச்கள்

  • மாதிரி: உதவும் இடத்தில் அளவிடப்பட்டது அல்லது வடிகட்டப்பட்டது.

  • உள்கட்டமைப்பு: சரியான சமிக்ஞைகளுடன் HPA கட்டமைக்கப்பட்டுள்ளது.

  • அறிவு புத்துணர்ச்சிக்கான மீட்பு பாதை

  • அலகு பொருளாதாரம் அடிக்கடி மதிப்பாய்வு செய்யப்படுகிறது


ரொம்ப நீளமா படிச்சேன்ல, இறுதி குறிப்புகள் 🧩

AI அளவிடுதல் என்பது ஒரு தனி அம்சமோ அல்லது ரகசிய மாற்றமோ அல்ல. இது ஒரு பேட்டர்ன் மொழி: ஆட்டோஸ்கேலர்களுடன் கிடைமட்ட அளவிடுதல், பயன்பாட்டிற்கான சர்வர்-சைடு பேட்சிங், மாடல்-லெவல் செயல்திறன், ஆஃப்லோட் அறிவை மீட்டெடுப்பது மற்றும் ரோல்அவுட்களை சலிப்படையச் செய்யும் கண்காணிப்பு. SLO-களை தெளித்து, அனைவரையும் சீரமைக்க சுகாதாரத்தை செலவு செய்யுங்கள். முதல் முறையிலேயே நீங்கள் அதை முழுமையாகப் பெற மாட்டீர்கள் - யாரும் செய்வதில்லை - ஆனால் சரியான பின்னூட்ட சுழல்களுடன், உங்கள் அமைப்பு அதிகாலை 2 மணிக்கு குளிர்-வியர்வை உணர்வு இல்லாமல் வளரும் 😅


குறிப்புகள்

[1] குபெர்னெட்ஸ் டாக்ஸ் - கிடைமட்ட பாட் ஆட்டோஸ்கேலிங் - மேலும் படிக்க
[2] NVIDIA ட்ரைடன் - டைனமிக் பேட்சர் - மேலும் படிக்க
[3] vLLM ஆவணங்கள் - பக்கப்படுத்தப்பட்ட கவனம் - மேலும் படிக்க
[4] ஹாஃப்மேன் மற்றும் பலர் (2022) - பயிற்சி கணினி-உகந்த பெரிய மொழி மாதிரிகள் - மேலும் படிக்க
[5] கூகிள் SRE பணிப்புத்தகம் - SLO-களை செயல்படுத்துதல் - மேலும் படிக்க

அதிகாரப்பூர்வ AI உதவியாளர் கடையில் சமீபத்திய AI ஐக் கண்டறியவும்.

எங்களை பற்றி

வலைப்பதிவிற்குத் திரும்பு