உங்கள் முகத்தைப் பயன்படுத்தி உங்கள் மொபைலைத் திறந்திருந்தால், ரசீதை ஸ்கேன் செய்திருந்தால், அல்லது செல்ஃப்-செக்-அவுட் கேமராவை உற்றுப் பார்த்திருந்தால், அது உங்கள் வெண்ணெய் பழத்தை மதிப்பிடுகிறதா என்று யோசித்திருந்தால், நீங்கள் கணினி பார்வையை எதிர்த்திருக்கிறீர்கள். எளிமையாகச் சொன்னால், AI இல் உள்ள கணினி விஷன் பார்த்து புரிந்துகொண்டு கற்றுக்கொள்வதாகும் . பயனுள்ளதா? நிச்சயமாக. சில நேரங்களில் ஆச்சரியமா? ஆம். நாம் நேர்மையாக இருந்தால் எப்போதாவது கொஞ்சம் பயமுறுத்தும். சிறந்த நிலையில், அது குழப்பமான பிக்சல்களை நடைமுறைச் செயல்களாக மாற்றுகிறது. மோசமான நிலையில், அது யூகித்து தள்ளாடுகிறது. சரியாக ஆராய்வோம் .
இதற்குப் பிறகு நீங்கள் படிக்க விரும்பக்கூடிய கட்டுரைகள்:
🔗 AI சார்பு என்றால் என்ன
AI அமைப்புகளில் சார்பு எவ்வாறு உருவாகிறது மற்றும் அதைக் கண்டறிந்து குறைப்பதற்கான வழிகள்.
🔗 முன்கணிப்பு AI என்றால் என்ன
போக்குகள் மற்றும் விளைவுகளை எதிர்பார்க்க AI எவ்வாறு தரவைப் பயன்படுத்துகிறது.
🔗 AI பயிற்சியாளர் என்றால் என்ன?
AI பயிற்சி அளிக்கும் நிபுணர்களால் பயன்படுத்தப்படும் பொறுப்புகள், திறன்கள் மற்றும் கருவிகள்.
🔗 கூகிள் வெர்டெக்ஸ் AI என்றால் என்ன
மாதிரிகளை உருவாக்குவதற்கும் பயன்படுத்துவதற்கும் கூகிளின் ஒருங்கிணைந்த AI தளத்தின் கண்ணோட்டம்.
AI-யில் கணினி பார்வை என்றால் என்ன? 📸
AI-யில் கணினி பார்வை என்பது கணினிகளுக்கு காட்சித் தரவை விளக்கவும் பகுத்தறிவு செய்யவும் கற்பிக்கும் செயற்கை நுண்ணறிவின் கிளையாகும். இது மூல பிக்சல்களிலிருந்து கட்டமைக்கப்பட்ட அர்த்தத்திற்கான குழாய்வழியாகும்: “இது ஒரு நிறுத்த அடையாளம்,” “அவை பாதசாரிகள்,” “வெல்ட் குறைபாடுடையது,” “இன்வாய்ஸ் மொத்தம் இங்கே.” இது வகைப்பாடு, கண்டறிதல், பிரிவுப்படுத்தல், கண்காணிப்பு, ஆழ மதிப்பீடு, OCR மற்றும் பேட்டர்ன்-கற்றல் மாதிரிகள் மூலம் ஒன்றாக இணைக்கப்பட்டுள்ளது போன்ற பணிகளை உள்ளடக்கியது. முறையான புலம் கிளாசிக் வடிவவியலை நவீன ஆழமான கற்றல் வரை பரவியுள்ளது, நீங்கள் நகலெடுத்து மாற்றக்கூடிய நடைமுறை விளையாட்டு புத்தகங்களுடன். [1]
ஒரு சிறிய நிகழ்வு: ஒரு சாதாரண 720p கேமராவுடன் கூடிய ஒரு பேக்கேஜிங் வரிசையை கற்பனை செய்து பாருங்கள். ஒரு இலகுரக டிடெக்டர் மூடிகளைக் கண்டுபிடிக்கும், மேலும் ஒரு எளிய டிராக்கர் பாட்டிலை பச்சை விளக்கு மூலம் ஒளிரச் செய்வதற்கு முன்பு அவை தொடர்ச்சியாக ஐந்து பிரேம்களுக்கு சீரமைக்கப்பட்டுள்ளதா என்பதை உறுதிப்படுத்துகிறது. ஆடம்பரமாக இல்லை - ஆனால் மலிவானது, வேகமானது, மேலும் இது மறுவேலையைக் குறைக்கிறது.
AI-யில் கணினி பார்வையை பயனுள்ளதாக்குவது எது? ✅
-
சிக்னல்-டு-ஆக்ஷன் ஓட்டம் : காட்சி உள்ளீடு செயல்படக்கூடிய வெளியீடாக மாறுகிறது. குறைவான டேஷ்போர்டு, அதிக முடிவு.
-
பொதுமைப்படுத்தல் : சரியான தரவுகளுடன், ஒரு மாதிரி பல்வேறு வகையான படங்களைக் கையாளுகிறது. சரியாக இல்லை - சில நேரங்களில் அதிர்ச்சியூட்டும் வகையில் நன்றாக.
-
தரவுப் பரிமாற்றம் : கேமராக்கள் மலிவானவை, எல்லா இடங்களிலும் கிடைக்கின்றன. பார்வை அந்த பிக்சல்களின் பெருங்கடலை நுண்ணறிவாக மாற்றுகிறது.
-
வேகம் : மாதிரிகள் பணி மற்றும் தெளிவுத்திறனைப் பொறுத்து, மிதமான வன்பொருளில் - அல்லது கிட்டத்தட்ட உண்மையான நேரத்தில் - பிரேம்களை நிகழ்நேரத்தில் செயலாக்க முடியும்.
-
தொகுத்தல் : நம்பகமான அமைப்புகளில் எளிய படிகளைச் சங்கிலி: கண்டறிதல் → கண்காணிப்பு → தரக் கட்டுப்பாடு.
-
சுற்றுச்சூழல் அமைப்பு : கருவிகள், முன் பயிற்சி பெற்ற மாதிரிகள், அளவுகோல்கள் மற்றும் சமூக ஆதரவு - ஒரு பரந்த குறியீட்டு சந்தை.
உண்மையைச் சொல்லப் போனால், ரகசிய சாஸ் ஒரு ரகசியம் அல்ல: நல்ல தரவு, ஒழுக்கமான மதிப்பீடு, கவனமாகப் பயன்படுத்துதல். மீதமுள்ளவை பயிற்சி... ஒருவேளை காபி. ☕
AI-யில் கணினி பார்வை எவ்வாறு செயல்படுகிறது, ஒரே ஒரு தெளிவான பாதையில் 🧪
-
பட சேகரிப்பு
கேமராக்கள், ஸ்கேனர்கள், ட்ரோன்கள், தொலைபேசிகள். சென்சார் வகை, வெளிப்பாடு, லென்ஸ் மற்றும் பிரேம் வீதத்தை கவனமாக தேர்வு செய்யவும். குப்பையில் போடுங்கள், முதலியன. -
முன் செயலாக்கம்
தேவைப்பட்டால் அளவை மாற்றுதல், செதுக்குதல், இயல்பாக்குதல், மங்கலாக்குதல் அல்லது இரைச்சல் நீக்குதல். சில நேரங்களில் ஒரு சிறிய மாறுபாடு மாற்றங்கள் மலைகளை நகர்த்தும். [4] -
லேபிள்கள் & தரவுத்தொகுப்புகள்
எல்லைப் பெட்டிகள், பலகோணங்கள், முக்கிய புள்ளிகள், உரை இடைவெளிகள். சமச்சீர், பிரதிநிதித்துவ லேபிள்கள் - அல்லது உங்கள் மாதிரி சாய்ந்த பழக்கங்களைக் கற்றுக்கொள்கிறது. -
மாடலிங்
-
வகைப்பாடு : “எந்த வகை?”
-
கண்டறிதல் : "பொருள்கள் எங்கே?"
-
பிரிவு : "எந்த பிக்சல்கள் எந்த விஷயத்தைச் சேர்ந்தவை?"
-
முக்கிய குறிப்புகள் & போஸ் : "மூட்டுகள் அல்லது அடையாளங்கள் எங்கே?"
-
OCR : "படத்தில் என்ன உரை உள்ளது?"
-
ஆழம் & 3D : "எல்லாம் எவ்வளவு தூரம்?"
கட்டமைப்புகள் வேறுபடுகின்றன, ஆனால் கன்வல்யூஷனல் வலைகள் மற்றும் மின்மாற்றி பாணி மாதிரிகள் ஆதிக்கம் செலுத்துகின்றன. [1]
-
-
பயிற்சி
தரவைப் பிரிக்கவும், ஹைப்பர் அளவுருக்களை சரிசெய்யவும், முறைப்படுத்தவும், அதிகரிக்கவும். வால்பேப்பரை மனப்பாடம் செய்வதற்கு முன்பு சீக்கிரமாக நிறுத்தவும். -
மதிப்பீடு
OCR-க்கு mAP, IoU, F1, CER/WER போன்ற பணி-பொருத்தமான அளவீடுகளைப் பயன்படுத்தவும். சரியாகத் தேர்ந்தெடுக்க வேண்டாம். நியாயமாக ஒப்பிடுங்கள். [3] -
இலக்குக்கான வரிசைப்படுத்தல்
பெரிய தரவுத்தொகுப்புகளும் கணினியும் முக்கியமான நிறைவை அடைந்தவுடன், ஆழமான வலைகள் ஒரு தரமான பாய்ச்சலை ஊக்குவித்தன. இமேஜ்நெட் சவால் போன்ற அளவுகோல்கள் அந்த முன்னேற்றத்தைக் காணக்கூடியதாகவும் இடைவிடாததாகவும் ஆக்கின. [2]
நீங்கள் உண்மையில் பயன்படுத்தும் முக்கிய பணிகள் (மற்றும் எப்போது) 🧩
-
பட வகைப்பாடு : ஒரு படத்திற்கு ஒரு லேபிள். விரைவான வடிப்பான்கள், வரிசைப்படுத்தல் அல்லது தரமான வாயில்களுக்குப் பயன்படுத்தவும்.
-
பொருள் கண்டறிதல் : பொருட்களைச் சுற்றியுள்ள பெட்டிகள். சில்லறை இழப்பு தடுப்பு, வாகனக் கண்டறிதல், வனவிலங்கு எண்ணிக்கை.
-
நிகழ்வுப் பிரிவு : ஒரு பொருளுக்கு பிக்சல்-துல்லியமான நிழல் படங்கள். உற்பத்தி குறைபாடுகள், அறுவை சிகிச்சை கருவிகள், வேளாண் தொழில்நுட்பம்.
-
சொற்பொருள் பிரிவு : நிகழ்வுகளைப் பிரிக்காமல் பிக்சலுக்கு வகுப்பு. நகர்ப்புற சாலை காட்சிகள், நிலப்பரப்பு.
-
முக்கிய புள்ளி கண்டறிதல் & தோரணை : மூட்டுகள், அடையாளங்கள், முக அம்சங்கள். விளையாட்டு பகுப்பாய்வு, பணிச்சூழலியல், AR.
-
கண்காணிப்பு : காலப்போக்கில் பொருட்களைப் பின்தொடரவும். தளவாடங்கள், போக்குவரத்து, பாதுகாப்பு.
-
OCR & ஆவணம் AI : உரை பிரித்தெடுத்தல் மற்றும் தளவமைப்பு பாகுபடுத்துதல். விலைப்பட்டியல்கள், ரசீதுகள், படிவங்கள்.
-
ஆழம் & 3D : பல காட்சிகள் அல்லது மோனோகுலர் குறிப்புகளிலிருந்து மறுகட்டமைப்பு. ரோபாட்டிக்ஸ், AR, மேப்பிங்.
-
காட்சி தலைப்பு : காட்சிகளை இயல்பான மொழியில் சுருக்கவும். அணுகல், தேடல்.
-
பார்வை-மொழி மாதிரிகள் : மல்டிமாடல் பகுத்தறிவு, மீட்டெடுப்பு-மேம்படுத்தப்பட்ட பார்வை, அடிப்படை தரநிலை.
சிறிய பெட்டி அதிர்வு: கடைகளில், காணாமல் போன அலமாரி முகப்புகளை ஒரு டிடெக்டர் கொடியிடுகிறது; ஊழியர்கள் மீண்டும் சேமிக்கும்போது ஒரு டிராக்கர் இரட்டை எண்ணைத் தடுக்கிறது; ஒரு எளிய விதி குறைந்த நம்பிக்கை பிரேம்களை மனித மதிப்பாய்வுக்கு வழிநடத்துகிறது. இது பெரும்பாலும் இசையில் இருக்கும் ஒரு சிறிய இசைக்குழு.
ஒப்பீட்டு அட்டவணை: வேகமாக அனுப்புவதற்கான கருவிகள் 🧰
வேண்டுமென்றே கொஞ்சம் வித்தியாசமாக இருக்கிறது. ஆமாம், இடைவெளி வித்தியாசமாக இருக்கிறது - எனக்குத் தெரியும்.
| கருவி / கட்டமைப்பு | சிறந்தது | உரிமம்/விலை | இது ஏன் நடைமுறையில் வேலை செய்கிறது |
|---|---|---|---|
| ஓபன்சிவி | முன் செயலாக்கம், கிளாசிக் CV, விரைவான POCகள் | இலவசம் - திறந்த மூல | மிகப்பெரிய கருவிப்பெட்டி, நிலையான APIகள், போரில் சோதிக்கப்பட்டது; சில நேரங்களில் உங்களுக்குத் தேவையானது. [4] |
| பைடார்ச் | ஆராய்ச்சிக்கு உகந்த பயிற்சி | இலவசம் | டைனமிக் வரைபடங்கள், மிகப்பெரிய சுற்றுச்சூழல் அமைப்பு, பல பயிற்சிகள். |
| டென்சர்ஃப்ளோ/கேராஸ் | அளவில் உற்பத்தி | இலவசம் | முதிர்ந்த பரிமாறும் விருப்பங்கள், மொபைல் மற்றும் எட்ஜுக்கும் நல்லது. |
| அல்ட்ராலிடிக்ஸ் யோலோ | விரைவான பொருள் கண்டறிதல் | இலவச + கட்டண துணை நிரல்கள் | எளிதான பயிற்சி வளையம், போட்டி வேக-துல்லியம், தன்னம்பிக்கை ஆனால் வசதியானது. |
| டிடெக்ட்ரான்2 / எம்எம்டிடெக்ஷன் | வலுவான அடிப்படைகள், பிரிவு | இலவசம் | மீண்டும் உருவாக்கக்கூடிய முடிவுகளைக் கொண்ட குறிப்பு-தர மாதிரிகள். |
| OpenVINO / ONNX இயக்க நேரம் | அனுமான உகப்பாக்கம் | இலவசம் | தாமதத்தைக் குறைத்து, மீண்டும் எழுதாமல் பரவலாகப் பயன்படுத்துங்கள். |
| டெசராக்ட் | குறைந்த பட்ஜெட்டில் OCR | இலவசம் | படத்தை சுத்தம் செய்தால் நன்றாக வேலை செய்யும்... சில நேரங்களில் நீங்கள் உண்மையிலேயே செய்ய வேண்டும். |
AI-யில் கணினி பார்வையில் தரத்தை எது இயக்குகிறது 🔧
-
தரவு கவரேஜ் : விளக்கு மாற்றங்கள், கோணங்கள், பின்னணிகள், விளிம்பு நிலைகள். அது நடக்க முடிந்தால், அதைச் சேர்க்கவும்.
-
லேபிள் தரம் : சீரற்ற பெட்டிகள் அல்லது ஒழுங்கற்ற பலகோணங்கள் mAP-ஐ நாசமாக்குகின்றன. ஒரு சிறிய QA நீண்ட தூரம் செல்லும்.
-
ஸ்மார்ட் ஆக்மென்டேஷன்கள் : செதுக்கு, சுழற்று, பிரகாசத்தை நடுங்கு, செயற்கை இரைச்சலைச் சேர்க்கவும். சீரற்ற குழப்பமாக இல்லாமல், யதார்த்தமாக இருங்கள்.
-
மாதிரி-தேர்வு பொருத்தம் : கண்டறிதல் தேவைப்படும் இடங்களில் கண்டறிதலைப் பயன்படுத்தவும் - வகைப்படுத்தியை இடங்களை யூகிக்க கட்டாயப்படுத்த வேண்டாம்.
-
தாக்கத்துடன் பொருந்தக்கூடிய அளவீடுகள் : தவறான எதிர்மறைகள் அதிகமாகப் பாதித்தால், நினைவுகூருதலை மேம்படுத்தவும். தவறான நேர்மறைகள் அதிகமாகப் பாதித்தால், முதலில் துல்லியம்.
-
இறுக்கமான பின்னூட்ட வளையம் : தோல்விகளைப் பதிவு செய்தல், மறுபெயரிடுதல், மீண்டும் பயிற்சி செய்தல். துவைத்தல், மீண்டும் செய்தல். சற்று சலிப்பூட்டுதல்-மிகவும் பயனுள்ளதாக இருக்கும்.
கண்டறிதல்/பிரிவுப்படுத்தலுக்கு, சமூகத் தரநிலை IoU வரம்புகள் முழுவதும் சராசரி துல்லியம் COCO-பாணி mAP . IoU மற்றும் AP@{0.5:0.95} எவ்வாறு கணக்கிடப்படுகின்றன என்பதை அறிவது, லீடர்போர்டு உரிமைகோரல்கள் தசமங்களுடன் உங்களை திகைக்க வைப்பதைத் தடுக்கிறது. [3]
கற்பனையாக இல்லாத நிஜ உலக பயன்பாட்டு வழக்குகள் 🌍
-
சில்லறை விற்பனை : அலமாரி பகுப்பாய்வு, இழப்பு தடுப்பு, வரிசை கண்காணிப்பு, பிளானோகிராம் இணக்கம்.
-
உற்பத்தி : மேற்பரப்பு குறைபாடு கண்டறிதல், அசெம்பிளி சரிபார்ப்பு, ரோபோ வழிகாட்டுதல்.
-
சுகாதாரப் பராமரிப்பு : கதிரியக்கவியல் வகைப்படுத்தல், கருவி கண்டறிதல், செல் பிரிவு.
-
இயக்கம் : ADAS, போக்குவரத்து கேமராக்கள், பார்க்கிங் ஆக்கிரமிப்பு, மைக்ரோமொபிலிட்டி கண்காணிப்பு.
-
விவசாயம் : பயிர் எண்ணிக்கை, நோய் கண்டறிதல், அறுவடை தயார்நிலை.
-
காப்பீடு & நிதி : சேத மதிப்பீடு, KYC காசோலைகள், மோசடி கொடிகள்.
-
கட்டுமானம் & எரிசக்தி : பாதுகாப்பு இணக்கம், கசிவு கண்டறிதல், அரிப்பைக் கண்காணித்தல்.
-
உள்ளடக்கம் & அணுகல்தன்மை : தானியங்கி தலைப்புகள், கட்டுப்பாடு, காட்சி தேடல்.
நீங்கள் கவனிக்கும் முறை: கைமுறை ஸ்கேனிங்கை தானியங்கி ட்ரேஜுடன் மாற்றவும், பின்னர் நம்பிக்கை குறையும் போது மனிதர்களிடம் அதிகரிக்கவும். கவர்ச்சியாக இல்லை - ஆனால் அது அளவிடப்படுகிறது.
தரவு, லேபிள்கள் மற்றும் முக்கியமான அளவீடுகள் 📊
-
வகைப்பாடு : துல்லியம், சமநிலையின்மைக்கான F1.
-
கண்டறிதல் : IoU வரம்புகளில் mAP; ஒவ்வொரு வகுப்பு AP மற்றும் அளவு வாளிகளையும் ஆய்வு செய்யுங்கள். [3]
-
பிரிவு : mIoU, Dice; நிகழ்வு-நிலை பிழைகளையும் சரிபார்க்கவும்.
-
கண்காணிப்பு : MOTA, IDF1; மறு அடையாளத் தரம்தான் அமைதியான ஹீரோ.
-
OCR : எழுத்துப் பிழை விகிதம் (CER) மற்றும் சொல் பிழை விகிதம் (WER); தளவமைப்பு தோல்விகள் பெரும்பாலும் ஆதிக்கம் செலுத்துகின்றன.
-
பின்னடைவு பணிகள் : ஆழம் அல்லது போஸ் முழுமையான/தொடர்புடைய பிழைகளைப் பயன்படுத்துகின்றன (பெரும்பாலும் பதிவு அளவுகோல்களில்).
உங்கள் மதிப்பீட்டு நெறிமுறையை ஆவணப்படுத்துங்கள், இதன் மூலம் மற்றவர்கள் அதைப் பின்பற்ற முடியும். இது கவர்ச்சியற்றது - ஆனால் அது உங்களை நேர்மையாக வைத்திருக்கும்.
உருவாக்கம் vs வாங்குதல் - அதை எங்கு இயக்குவது 🏗️
-
கிளவுட் : தொடங்குவதற்கு எளிதானது, தொகுதி பணிச்சுமைகளுக்கு சிறந்தது. வெளியேறும் செலவுகளைக் கவனியுங்கள்.
-
எட்ஜ் சாதனங்கள் : குறைந்த தாமதம் மற்றும் சிறந்த தனியுரிமை. நீங்கள் அளவீடு, கத்தரித்தல் மற்றும் முடுக்கிகள் பற்றி கவலைப்படுவீர்கள்.
-
சாதனத்தில் உள்ள மொபைல் : பொருந்தும்போது அற்புதம். மாடல்களை மேம்படுத்தி பேட்டரியை வாட்ச் செய்யுங்கள்.
-
ஹைப்ரிட் : விளிம்பில் முன் வடிகட்டி, மேகத்தில் அதிக சுமை. ஒரு நல்ல சமரசம்.
சலிப்பூட்டும் நம்பகமான அடுக்கு: PyTorch உடன் முன்மாதிரி, ஒரு நிலையான கண்டுபிடிப்பாளரைப் பயிற்றுவித்தல், ONNX க்கு ஏற்றுமதி செய்தல், OpenVINO/ONNX இயக்க நேரத்துடன் முடுக்கிவிடுதல் மற்றும் முன் செயலாக்கம் மற்றும் வடிவவியலுக்கு (அளவுத்திருத்தம், ஹோமோகிராபி, உருவவியல்) OpenCV ஐப் பயன்படுத்துதல். [4]
அபாயங்கள், நெறிமுறைகள் மற்றும் பேசுவதற்கு கடினமான பகுதிகள் ⚖️
பார்வை அமைப்புகள் தரவுத்தொகுப்பு சார்புகள் அல்லது செயல்பாட்டு குருட்டுப் புள்ளிகளைப் பெறலாம். சுயாதீன மதிப்பீடுகள் (எ.கா., NIST FRVT) வழிமுறைகள் மற்றும் நிலைமைகள் முழுவதும் முகம் அடையாளம் காணும் பிழை விகிதங்களில் மக்கள்தொகை வேறுபாடுகளை அளவிட்டுள்ளன. இது பீதியடைய ஒரு காரணம் அல்ல, ஆனால் கவனமாகச் சோதிக்கவும், வரம்புகளை ஆவணப்படுத்தவும், உற்பத்தியில் தொடர்ந்து கண்காணிக்கவும் இது ஒரு காரணம். அடையாளம் அல்லது பாதுகாப்பு தொடர்பான பயன்பாட்டு நிகழ்வுகளை நீங்கள் பயன்படுத்தினால், மனித மதிப்பாய்வு மற்றும் மேல்முறையீட்டு வழிமுறைகளைச் சேர்க்கவும். தனியுரிமை, ஒப்புதல் மற்றும் வெளிப்படைத்தன்மை ஆகியவை விருப்பத்தேர்வு கூடுதல் அல்ல. [5]
நீங்கள் உண்மையில் பின்பற்றக்கூடிய ஒரு விரைவான தொடக்க வரைபடம் 🗺️
-
முடிவை வரையறுக்கவும்
ஒரு படத்தைப் பார்த்த பிறகு கணினி என்ன நடவடிக்கை எடுக்க வேண்டும்? இது வேனிட்டி அளவீடுகளை மேம்படுத்துவதிலிருந்து உங்களைத் தடுக்கிறது. -
ஒரு ஸ்க்ராப்பி டேட்டாஸெட்டை சேகரிக்கவும்
. உங்கள் உண்மையான சூழலைப் பிரதிபலிக்கும் சில நூறு படங்களுடன் தொடங்குங்கள். கவனமாக லேபிளிடுங்கள் - அது நீங்களும் மூன்று ஒட்டும் குறிப்புகளும் கூட. -
ஒரு அடிப்படை மாதிரியைத் தேர்வுசெய்யவும்
முன் பயிற்சி பெற்ற எடைகளைக் கொண்ட எளிய முதுகெலும்பைத் தேர்வுசெய்யவும். இன்னும் கவர்ச்சியான கட்டமைப்புகளைத் துரத்த வேண்டாம். [1] -
தட அளவீடுகள், குழப்பமான புள்ளிகள் மற்றும் தோல்வி முறைகளைப் பயிற்றுவிக்கவும், பதிவு செய்யவும், மதிப்பீடு செய்யவும் -
வளையத்தை இறுக்குங்கள்
கடினமான எதிர்மறைகளைச் சேர்க்கவும், லேபிள் சறுக்கலை சரிசெய்யவும், பெருக்கங்களை சரிசெய்யவும், வரம்புகளை மீண்டும் சரிசெய்யவும். சிறிய மாற்றங்கள் சேர்க்கப்படுகின்றன. [3] -
ஒரு மெல்லிய பதிப்பைப் பயன்படுத்துங்கள்
அளவிட்டு ஏற்றுமதி செய்யுங்கள். பொம்மை அளவுகோலில் அல்லாமல், உண்மையான சூழலில் தாமதம்/செயல்திறனை அளவிடவும். -
கண்காணித்து மீண்டும் செய்யவும்
தவறான செயல்களைச் சேகரிக்கவும், மறுபெயரிடவும், மீண்டும் பயிற்சி செய்யவும். உங்கள் மாதிரி புதைபடிவமாக மாறாமல் இருக்க அவ்வப்போது மதிப்பீடுகளைத் திட்டமிடுங்கள்.
தொழில்முறை குறிப்பு: உங்கள் மிகவும் இழிவான அணி வீரர் அமைத்த ஒரு சிறிய ஹோல்ட்அவுட்டைக் குறிக்கவும். அவர்களால் அதில் துளையிட முடியாவிட்டால், நீங்கள் தயாராக இருக்கலாம்.
நீங்கள் தவிர்க்க விரும்பும் பொதுவான தவறுகள் 🧨
-
சுத்தமான ஸ்டுடியோ படங்களில் பயிற்சி, லென்ஸில் மழையுடன் நிஜ உலகத்திற்கு அனுப்புதல்.
-
நீங்கள் ஒரு முக்கியமான வகுப்பைப் பற்றி உண்மையிலேயே அக்கறை கொள்ளும்போது ஒட்டுமொத்த mAP க்கும் உகந்ததாக்குதல். [3]
-
வர்க்க ஏற்றத்தாழ்வைப் புறக்கணித்துவிட்டு, அரிதான நிகழ்வுகள் ஏன் மறைந்து போகின்றன என்று யோசிப்பது.
-
மாதிரி செயற்கை கலைப்பொருட்களைக் கற்றுக்கொள்ளும் வரை மிகைப்படுத்தல்.
-
கேமரா அளவுத்திருத்தத்தைத் தவிர்த்துவிட்டு, பின்னர் பார்வைப் பிழைகளை என்றென்றும் எதிர்த்துப் போராடுவது. [4]
-
சரியான மதிப்பீட்டு அமைப்பை நகலெடுக்காமல் லீடர்போர்டு எண்களை நம்புதல். [2][3]
புக்மார்க் செய்ய வேண்டிய ஆதாரங்கள் 🔗
நீங்கள் முதன்மைப் பொருட்கள் மற்றும் பாடக் குறிப்புகளை விரும்பினால், இவை அடிப்படைகள், பயிற்சி மற்றும் வரையறைகளுக்கு தங்கம். குறிப்புகள் பகுதியைப் பார்க்கவும்: CS231n குறிப்புகள், ImageNet சவால் தாள், COCO தரவுத்தொகுப்பு/மதிப்பீட்டு ஆவணங்கள், OpenCV ஆவணங்கள் மற்றும் NIST FRVT அறிக்கைகள். [1][2][3][4][5]
இறுதி குறிப்புகள் - அல்லது மிக நீளமானது, படிக்கவில்லை 🍃
AI-யில் கணினி பார்வை பிக்சல்களை முடிவுகளாக மாற்றுகிறது. சரியான பணியை சரியான தரவுகளுடன் இணைத்து, சரியான விஷயங்களை அளவிடும்போது, அசாதாரண ஒழுக்கத்துடன் மீண்டும் மீண்டும் செய்யும்போது அது பிரகாசிக்கிறது. கருவி தாராளமானது, அளவுகோல்கள் பொதுவில் உள்ளன, மேலும் இறுதி முடிவில் கவனம் செலுத்தினால் முன்மாதிரியிலிருந்து உற்பத்திக்கான பாதை வியக்கத்தக்க வகையில் குறுகியதாக இருக்கும். உங்கள் லேபிள்களை நேராக்குங்கள், தாக்கத்துடன் பொருந்தக்கூடிய அளவீடுகளைத் தேர்வுசெய்யவும், மாதிரிகள் அதிக வேலைகளைச் செய்யட்டும். ஒரு உருவகம் உதவினால் - மிக விரைவான ஆனால் நேரடியான பயிற்சியாளருக்கு முக்கியமானதைக் கண்டறியக் கற்பிப்பது போல அதை நினைத்துப் பாருங்கள். நீங்கள் உதாரணங்களைக் காட்டுகிறீர்கள், தவறுகளைச் சரிசெய்கிறீர்கள், படிப்படியாக உண்மையான வேலையுடன் அதை நம்புகிறீர்கள். சரியானது அல்ல, ஆனால் மாற்றத்தை ஏற்படுத்தும் அளவுக்கு நெருக்கமாக இருக்கிறது. 🌟
குறிப்புகள்
-
CS231n: கணினி பார்வைக்கான ஆழமான கற்றல் (பாடநெறி குறிப்புகள்) - ஸ்டான்போர்ட் பல்கலைக்கழகம்.
மேலும் படிக்கவும் -
இமேஜ்நெட் பெரிய அளவிலான காட்சி அங்கீகார சவால் (தாள்) - ருஸ்ஸகோவ்ஸ்கி மற்றும் பலர்.
மேலும் படிக்கவும் -
COCO தரவுத்தொகுப்பு & மதிப்பீடு - அதிகாரப்பூர்வ தளம் (பணி வரையறைகள் மற்றும் mAP/IoU மரபுகள்).
மேலும் படிக்கவும் -
OpenCV ஆவணமாக்கல் (v4.x) - முன் செயலாக்கம், அளவுத்திருத்தம், உருவவியல் போன்றவற்றுக்கான தொகுதிகள்.
மேலும் படிக்கவும் -
NIST FRVT பகுதி 3: மக்கள்தொகை விளைவுகள் (NISTIR 8280) - மக்கள்தொகை முழுவதும் முகம் அடையாளம் காணும் துல்லியத்தின் சுயாதீன மதிப்பீடு.
மேலும் படிக்கவும்