பொருளடக்கம்[மறை][காட்டு]
- 1. CelebFaces பண்புக்கூறுகள் தரவுத்தொகுப்பு
- 2. DOTA
- 3. கூகுள் ஃபேஷியல் எக்ஸ்பிரஷன் ஒப்பீட்டு தரவுத்தொகுப்பு
- 4. காட்சி மரபணு
- 5. லிப்ரிஸ்பீச்
- 6. நகரப்பகுதிகள்
- 7. இயக்கவியல் தரவுத்தொகுப்பு
- 8. CelebAMask-HQ
- 9. பென் ட்ரீபேங்க்
- 10. VoxCeleb
- 11. சிக்ஸ்ரே
- 12. அமெரிக்க விபத்துக்கள்
- 13. கண் நோய் அங்கீகாரம்
- 14. இருதய நோய்
- 15. CLEVR
- 16. உலகளாவிய சார்புகள்
- 17. கிட்டி - 360
- 18. MOT(பல பொருள் கண்காணிப்பு)
- 19. பாஸ்கல் 3D+
- 20. விலங்குகளின் முகம் சிதைக்கக்கூடிய மாதிரிகள்
- 21. MPII மனித போஸ்ட் டேட்டாசெட்
- 22. UCF101
- 23. ஆடியோசெட்
- 24. ஸ்டான்போர்ட் இயற்கை மொழி அனுமானம்
- 25. காட்சி கேள்வி பதில்
- தீர்மானம்
இப்போதெல்லாம், நம்மில் பெரும்பாலோர் இயந்திர கற்றல் மற்றும் AI மாதிரிகளை உருவாக்குவதிலும் தற்போதைய தரவுத்தொகுப்புகளைப் பயன்படுத்தி சிக்கல்களைத் தீர்ப்பதிலும் கவனம் செலுத்துகிறோம். ஆனால் முதலில், தரவுத்தொகுப்பு, அதன் முக்கியத்துவம் மற்றும் வலுவான AI மற்றும் ML தீர்வுகளை உருவாக்குவதில் அதன் பங்கு ஆகியவற்றை நாம் வரையறுக்க வேண்டும்.
இன்று, பல்வேறு துறைகளில் நிஜ-உலகப் பிரச்சினைகளைச் சமாளிப்பதற்கான ஆராய்ச்சி அல்லது பயன்பாடுகளை உருவாக்குவதற்கான திறந்த மூல தரவுத்தொகுப்புகள் எங்களிடம் ஏராளமாக உள்ளன.
இருப்பினும், உயர்தர அளவு தரவுத்தொகுப்புகளின் பற்றாக்குறை கவலைக்கு ஒரு ஆதாரமாக உள்ளது. தரவு பெருமளவில் உயர்ந்துள்ளது மற்றும் எதிர்காலத்தில் வேகமாக விரிவடையும்.
இந்த இடுகையில், உங்கள் அடுத்த AI திட்டத்தை உருவாக்க நீங்கள் பயன்படுத்தக்கூடிய இலவசமாகக் கிடைக்கும் தரவுத்தொகுப்புகளை நாங்கள் உள்ளடக்குவோம்.
1. CelebFaces பண்புக்கூறுகள் தரவுத்தொகுப்பு
CelebFaces Attributes Dataset (CelebA) ஆனது 200K பிரபலங்களின் புகைப்படங்களையும் ஒவ்வொரு படத்திற்கும் 40 பண்புக்கூறு சிறுகுறிப்புகளையும் கொண்டுள்ளது, இது போன்ற திட்டங்களுக்கு இது ஒரு சிறந்த தொடக்க புள்ளியாக அமைகிறது. முகத்தை அடையாளம் காணுதல், முகம் கண்டறிதல், மைல்கல் (அல்லது முக உறுப்பு) உள்ளூர்மயமாக்கல் மற்றும் முகத்தை திருத்துதல் & தொகுப்பு. மேலும், இந்தத் தொகுப்பில் உள்ள புகைப்படங்கள் பரந்த அளவிலான நிலை மாறுபாடுகள் மற்றும் பின்னணி ஒழுங்கீனங்களைக் கொண்டிருக்கின்றன.
2. டோடா
DOTA (தரவுத்தொகுப்பு பொருள் கண்டறிதல் வான்வழி புகைப்படங்களில்) என்பது பொருள் கண்டறிதலுக்கான ஒரு பெரிய அளவிலான தரவுத்தொகுப்பாகும், இதில் 15 பொதுவான பிரிவுகள் (எ.கா., கப்பல், விமானம், கார் போன்றவை), பயிற்சிக்கான 1411 படங்கள் மற்றும் சரிபார்ப்புக்கான 458 படங்கள் ஆகியவை அடங்கும்.
3. கூகுள் ஃபேஷியல் எக்ஸ்பிரஷன் ஒப்பீட்டு தரவுத்தொகுப்பு
கூகுள் முகபாவனை ஒப்பீட்டு தரவுத்தொகுப்பில் 500,000 முகப் புகைப்படங்கள் உட்பட சுமார் 156,000 பட மும்மூர்த்திகள் உள்ளன. இந்த தரவுத்தொகுப்பில் உள்ள ஒவ்வொரு மும்மடங்கு குறைந்தது ஆறு மனித மதிப்பீட்டாளர்களால் குறிப்பிடப்பட்டது என்பது குறிப்பிடத்தக்கது.
இந்த தரவுத்தொகுப்பு முக வெளிப்பாடு பகுப்பாய்வு சம்பந்தப்பட்ட திட்டங்களுக்கு பயனுள்ளதாக இருக்கும், அதாவது வெளிப்பாடு அடிப்படையிலான படம் மீட்டெடுப்பு, உணர்ச்சி வகைப்படுத்தல், வெளிப்பாடு தொகுப்பு மற்றும் பல. தரவுத்தொகுப்பிற்கான அணுகலைப் பெற, ஒரு சுருக்கமான படிவத்தை பூர்த்தி செய்ய வேண்டும்.
4. காட்சி மரபணு
விஷுவல் ஜீனோமில் பல தேர்வு சூழலில் காட்சி கேள்வி பதில் தரவு கிடைக்கிறது. இது 101,174 மில்லியன் QA ஜோடிகளுடன் 1.7 MSCOCO புகைப்படங்களால் ஆனது, ஒரு படத்திற்கு சராசரியாக 17 கேள்விகள்.
விஷுவல் கேள்வி பதில் தரவுத்தொகுப்புடன் ஒப்பிடுகையில், விஷுவல் ஜீனோம் தரவுத்தொகுப்பு ஆறு கேள்வி வகைகளில் மிகவும் நியாயமான விநியோகத்தைக் கொண்டுள்ளது: என்ன, எங்கே, எப்போது, யார், ஏன் மற்றும் எப்படி.
கூடுதலாக, விஷுவல் ஜீனோம் தரவுத்தொகுப்பில் பொருள்கள், பண்புகள் மற்றும் இணைப்புகளுடன் பெரிதும் குறியிடப்பட்ட 108K புகைப்படங்கள் உள்ளன.
5. லிப்ரிஸ்பீச்
LibriSpeech கார்பஸ் என்பது LibriVox திட்டத்தில் இருந்து சுமார் 1,000 மணிநேர ஆடியோபுக்குகளின் தொகுப்பாகும். பெரும்பாலான ஆடியோபுக்குகள் ப்ராஜெக்ட் குட்டன்பெர்க்கிலிருந்து வந்தவை.
பயிற்சி தரவு 100 மணிநேரம், 360 மணிநேரம் மற்றும் 500 மணிநேரம் ஆகிய மூன்று பகிர்வுகளாக பிரிக்கப்பட்டுள்ளது, அதே நேரத்தில் டெவ் மற்றும் சோதனை தரவு ஆடியோ நீளத்தில் தோராயமாக 5 மணிநேரம் ஆகும்.
6. நகரப்பகுதிகள்
நகர்ப்புற காட்சிகளைக் கொண்ட ஸ்டீரியோ வீடியோக்களின் மிகவும் நன்கு அறியப்பட்ட பெரிய அளவிலான தரவுத்தளங்களில் ஒன்று தி சிட்டிஸ்கேப்ஸ் என்று அழைக்கப்படுகிறது.
GPS இருப்பிடங்கள், வெளிப்புற வெப்பநிலை, ஈகோ-மோஷன் தரவு மற்றும் சரியான ஸ்டீரியோ முன்னோக்குகள் ஆகியவற்றை உள்ளடக்கிய பிக்சல்-துல்லியமான சிறுகுறிப்புகளுடன், இது 50 தனித்துவமான ஜெர்மன் நகரங்களிலிருந்து பதிவுகளை உள்ளடக்கியது.
7. இயக்கவியல் தரவுத்தொகுப்பு
மனித செயல்பாடுகளை பெரிய அளவில் மற்றும் நல்ல தரத்துடன் அங்கீகரிப்பதற்காக நன்கு அறியப்பட்ட வீடியோ தரவுத்தொகுப்புகளில் ஒன்று இயக்கவியல் தரவுத்தொகுப்பு ஆகும். 600 மனித நடவடிக்கை வகுப்புகளில் ஒவ்வொன்றிற்கும் குறைந்தது 600 வீடியோ கிளிப்புகள் உள்ளன, மொத்தம் 500,000 க்கும் அதிகமானவை.
திரைப்படங்கள் யூடியூப்பில் இருந்து நீக்கப்பட்டன; ஒவ்வொன்றும் சுமார் 10 வினாடிகள் நீளமானது மற்றும் ஒரு செயல்பாட்டு வகுப்பு மட்டுமே பட்டியலிடப்பட்டுள்ளது.
8. CelebMAsk-HQ
CelebAMask-HQ என்பது தோல், மூக்கு, கண்கள், புருவங்கள், காதுகள், வாய், உதடு, முடி, தொப்பி, கண் கண்ணாடி, காதணி, நெக்லஸ் போன்ற முகக் கூறுகளை உள்ளடக்கிய 30,000 வகுப்புகள் மற்றும் கவனமாகக் குறிப்பிடப்பட்ட முகமூடிகளுடன் கூடிய 19 உயர் தெளிவுத்திறன் கொண்ட முகப் புகைப்படங்களின் தொகுப்பாகும். கழுத்து, பொருள்.
முகத்தை அடையாளம் காணுதல், முகம் பாகுபடுத்துதல் மற்றும் GANகள் ஆகியவற்றைச் சோதிக்கவும் பயிற்சி செய்யவும் தரவுத்தொகுப்பைப் பயன்படுத்தலாம்.
9. பென் ட்ரீபேங்க்
வரிசை குறியிடலுக்கான மாதிரிகளை மதிப்பிடுவதற்கு மிகவும் குறிப்பிடத்தக்க மற்றும் அடிக்கடி பயன்படுத்தப்படும் கார்போராக்களில் ஒன்று ஆங்கில பென் ட்ரீபேங்க் (PTB) கார்பஸ் ஆகும், குறிப்பாக வால் ஸ்ட்ரீட் ஜர்னல் கட்டுரைகளுடன் தொடர்புடைய கார்பஸின் பகுதி.
ஒவ்வொரு வார்த்தையும் அதன் பேச்சின் ஒரு பகுதியை பணியின் ஒரு அங்கமாகக் குறிக்க வேண்டும். எழுத்து நிலை மற்றும் சொல் நிலை மொழி மாதிரியாக்கம் கார்பஸை அடிக்கடி பயன்படுத்துகிறது.
10. VoxCeleb
VoxCeleb என்பது தானாக உருவாக்கப்பட்ட ஒரு பெரிய அளவிலான பேச்சு அடையாள தரவுத்தொகுப்பாகும் திறந்த மூல ஊடகம். VoxCeleb 6k க்கும் மேற்பட்ட பேச்சாளர்களிடமிருந்து ஒரு மில்லியனுக்கும் அதிகமான பேச்சுகளைக் கொண்டுள்ளது.
தரவுத்தொகுப்பில் ஆடியோ-விஷுவல் உள்ளதால், காட்சிப் பேச்சுத் தொகுப்பு, பேச்சுப் பிரிப்பு, முகத்திலிருந்து குரலுக்கு குறுக்கு-மாடல் பரிமாற்றம் அல்லது அதற்கு நேர்மாறாக, மற்றும் தற்போதைய முக அங்கீகாரத்திற்கு துணையாக வீடியோவிலிருந்து முகத்தை அடையாளம் காணுதல் உள்ளிட்ட பல்வேறு கூடுதல் பயன்பாடுகளுக்கு இது பயன்படுத்தப்படலாம். தரவுத்தொகுப்புகள்.
11. சிக்ஸ்ரே
SIXray தரவுத்தொகுப்பில் சுரங்கப்பாதை நிலையங்களில் இருந்து சேகரிக்கப்பட்ட 1,059,231 எக்ஸ்-ரே படங்கள் மற்றும் மனித பாதுகாப்பு ஆய்வாளர்கள் ஆறு முக்கிய வகையான தடைசெய்யப்பட்ட பொருட்களைக் கண்டறிவதற்காக குறிப்பெடுக்கப்பட்டுள்ளனர்: கைத்துப்பாக்கிகள், கத்திகள், குறடுகளை, இடுக்கி, கத்தரிக்கோல் மற்றும் சுத்தியல். மேலும், பொருள் உள்ளூர்மயமாக்கலின் செயல்திறனை மதிப்பிடுவதற்காக, ஒவ்வொரு அனுமதிக்கப்படாத உருப்படிக்கான எல்லைப் பெட்டிகளும் சோதனைத் தொகுப்புகளில் கைமுறையாகச் சேர்க்கப்பட்டுள்ளன.
12. அமெரிக்க விபத்துக்கள்
திட்டத்தின் பொருள் ஏற்கனவே தரவுத்தொகுப்பின் பெயரால் வெளிப்படுத்தப்பட்டுள்ளது, அமெரிக்க விபத்துக்கள். நாடு தழுவிய வாகன விபத்துகள் குறித்த இந்தத் தரவுத்தொகுப்பில் பிப்ரவரி 2016 முதல் டிசம்பர் 2021 வரையிலான தகவல்கள் அடங்கும், மேலும் இது அமெரிக்காவில் உள்ள 49 மாநிலங்களை உள்ளடக்கியது.
ஏறத்தாழ 1.5 மில்லியன் விபத்து பதிவுகள் இப்போது இந்தத் தொகுப்பில் உள்ளன. இது பல ட்ராஃபிக் APIகளைப் பயன்படுத்தி நிகழ்நேரத்தில் சேகரிக்கப்பட்டது.
இந்த APIகள் போக்குவரத்து கேமராக்கள், சட்ட அமலாக்க அமைப்புகள் மற்றும் US மற்றும் மாநில போக்குவரத்து துறைகள் உட்பட பல்வேறு ஆதாரங்களில் இருந்து சேகரிக்கப்பட்ட போக்குவரத்து தகவலை அனுப்புகின்றன.
13. கண் நோய் அங்கீகாரம்
ஒழுங்கமைக்கப்பட்ட கண் நோய் நுண்ணறிவு அங்கீகாரம் (ODIR) 5,000 நோயாளிகளின் வயது, அவர்களின் இடது மற்றும் வலது கண்களில் உள்ள ஃபண்டஸின் நிறம் மற்றும் மருத்துவ நிபுணர்களின் நோயறிதல் முக்கிய வார்த்தைகள் உள்ளிட்ட தகவல்களைக் கொண்டுள்ளது.
இந்த தரவுத்தொகுப்பு, ஷாங்காங் மெடிக்கல் டெக்னாலஜி கோ., லிமிடெட் வாங்கிய சீனாவில் உள்ள பல்வேறு மருத்துவமனைகள் மற்றும் மருத்துவ வசதிகளிலிருந்து நோயாளிகளின் தரவுகளின் உண்மையான சேகரிப்பு ஆகும். உடன் தரக் கட்டுப்பாடு மேலாண்மை, சிறுகுறிப்புகள் திறமையான மனித வாசகர்களால் குறிக்கப்பட்டன.
14. இருதய நோய்
இந்த இதய நோய் தரவுத்தொகுப்பு வயது, பாலினம், மார்பு வலி வகை, ஓய்வு இரத்த அழுத்தம் போன்ற 76 அளவுருக்களின் அடிப்படையில் ஒரு நோயாளிக்கு இதய நோய் இருப்பதைக் கண்டறிய உதவுகிறது.
303 வழக்குகளுடன், தரவுத்தளமானது ஒரு நோயின் இருப்பை (மதிப்பு 1,2,3,4) அது இல்லாததிலிருந்து (மதிப்பு 0) வேறுபடுத்த முயல்கிறது.
15. CLEVR
CLEVR தரவுத்தொகுப்பு (கலவை மொழி மற்றும் தொடக்கக் காட்சிப் பகுத்தறிவு) காட்சி கேள்விக்கான பதிலைப் பிரதிபலிக்கிறது. இது 3D-ரெண்டர் செய்யப்பட்ட பொருட்களின் புகைப்படங்களைக் கொண்டுள்ளது, ஒவ்வொரு புகைப்படமும் பல வகைகளாகப் பிரிக்கப்பட்ட உயர் தொகுப்புக் கேள்விகளின் வரிசையுடன் இருக்கும்.
அனைத்து ரயில் மற்றும் சரிபார்ப்பு படங்கள் மற்றும் கேள்விகளுக்கு, தரவுத்தொகுப்பில் 70,000 புகைப்படங்கள் மற்றும் பயிற்சிக்கான 700,000 கேள்விகள், 15,000 படங்கள் மற்றும் 150,000 சரிபார்ப்புக்கான கேள்விகள், மற்றும் 15,000 படங்கள் மற்றும் 150,000 கேள்விகள், பொருள்கள், பதில்கள், செயல்திட்டங்கள், காட்சி நிகழ்ச்சிகள் ஆகியவற்றைச் சோதிக்கும்.
16. உலகளாவிய சார்புகள்
யுனிவர்சல் டிபென்டென்சிஸ் (யுடி) திட்டம் பல மொழிகளுக்கு குறுக்கு-மொழியில் ஒரே மாதிரியான உருவவியல் மற்றும் தொடரியல் ட்ரீபேங்க் சிறுகுறிப்பை உருவாக்குவதை நோக்கமாகக் கொண்டுள்ளது. 2.7 இல் வெளியிடப்பட்ட பதிப்பு 2020, 183 மொழிகளில் 104 மரக்கட்டைகளைக் கொண்டுள்ளது.
சிறுகுறிப்பு உலகளாவிய POW குறிச்சொற்கள், சார்புத் தலைகள் மற்றும் உலகளாவிய சார்பு லேபிள்களால் ஆனது.
17. கிட்டி - 360
மொபைல் ரோபோக்களுக்காக அடிக்கடி பயன்படுத்தப்படும் தரவுத்தொகுப்புகளில் ஒன்று மற்றும் தன்னாட்சி ஓட்டுநர் KITTI (கார்ல்ஸ்ரூஹே இன்ஸ்டிடியூட் ஆப் டெக்னாலஜி மற்றும் டொயோட்டா டெக்னாலஜிகல் இன்ஸ்டிடியூட்) ஆகும்.
உயர் தெளிவுத்திறன் கொண்ட RGB, கிரேஸ்கேல் ஸ்டீரியோ மற்றும் 3D லேசர் ஸ்கேனர் கேமராக்கள் போன்ற சென்சார் முறைகளின் வரம்பைப் பயன்படுத்தி படம்பிடிக்கப்பட்ட மணிநேர மதிப்புள்ள ட்ராஃபிக் காட்சிகளால் இது உருவாக்கப்பட்டுள்ளது. தரவுத்தொகுப்பு காலப்போக்கில் பல ஆராய்ச்சியாளர்களால் மேம்படுத்தப்பட்டுள்ளது, அவர்கள் தங்கள் தேவைகளுக்கு ஏற்ப அதன் பல்வேறு பகுதிகளை கைமுறையாக சிறுகுறிப்பு செய்தனர்.
18. MOT(பல பொருள் கண்காணிப்பு)
MOT (மல்டிபிள் ஆப்ஜெக்ட் டிராக்கிங்) என்பது பல பொருள் கண்காணிப்புக்கான தரவுத்தொகுப்பாகும், இதில் பொது இடங்களின் உட்புற மற்றும் வெளிப்புற காட்சிகள் அடங்கும், இதில் பாதசாரிகள் ஆர்வமுள்ள பொருட்களாக உள்ளனர். ஒவ்வொரு காட்சியின் வீடியோவும் இரண்டு துண்டுகளாக பிரிக்கப்பட்டுள்ளது, ஒன்று பயிற்சிக்காகவும் மற்றொன்று சோதனைக்காகவும்.
தரவுத்தொகுப்பில் அடங்கும் பொருள் கண்டறிதல் வீடியோ பிரேம்களில் மூன்று டிடெக்டர்களைப் பயன்படுத்துகிறது: SDP, Faster-RCNN மற்றும் DPM.
19. பாஸ்கல் 3D+
Pascal3D+ மல்டி-வியூ தரவுத்தொகுப்பு காட்டுப்பகுதியில் சேகரிக்கப்பட்ட புகைப்படங்களால் ஆனது, அதாவது, அதிக மாறுபாடுகளுடன் கூடிய உருப்படி வகைகளின் படங்கள், கட்டுப்பாடற்ற சூழ்நிலைகளில், நெரிசலான சூழல்களில், மற்றும் பல்வேறு நிலைகளில் எடுக்கப்பட்டது. Pascal3D+ ஆனது PASCAL VOC 12 தரவுத்தொகுப்பிலிருந்து எடுக்கப்பட்ட 2012 திடமான பொருள் வகைகளை உள்ளடக்கியது.
இந்த உருப்படிகளில் தோரணை தகவல் குறிக்கப்பட்டுள்ளது (அஜிமுத், உயரம் மற்றும் கேமராவிற்கான தூரம்). Pascal3D+ ஆனது, இந்த 12 வகைகளில் இமேஜ்நெட் சேகரிப்பில் இருந்து போஸ்-குறிப்புக் கொண்ட புகைப்படங்களை உள்ளடக்கியது.
20. விலங்குகளின் முகம் சிதைக்கக்கூடிய மாதிரிகள்
விலங்குகளின் முகத்தை சிதைக்கக்கூடிய மாதிரிகள் (FDMA) திட்டத்தின் குறிக்கோள், மனித முக அடையாளத்தை அடையாளம் காணுதல் மற்றும் கண்காணிப்பு ஆகியவற்றில் தற்போதைய வழிமுறைகளுக்கு சவால் விடுவது மற்றும் விலங்குகளின் முகப் பண்புகளின் சிறப்பியல்புகளைக் கொண்ட கணிசமான பெரிய மாறுபாட்டைக் கையாளக்கூடிய புதிய வழிமுறைகளை உருவாக்குவது ஆகும்.
முக உணர்ச்சிகள் அல்லது நிலைகளில் ஏற்படும் மாற்றங்கள், பகுதி அடைப்புகள் மற்றும் வெளிச்சம் ஆகியவற்றால் தூண்டப்பட்ட மாறுபாடுகளைக் கையாளும் போது, மனித முகங்களில் உள்ள அடையாளங்களை அடையாளம் கண்டு கண்காணிக்கும் திறனைத் திட்டத்தின் வழிமுறைகள் வெளிப்படுத்தின.
21. MPII மனித இடுகை தரவுத்தொகுப்பு
MPII மனித போஸ் தரவுத்தொகுப்பில் சுமார் 25K புகைப்படங்கள் உள்ளன, அவற்றில் 15K பயிற்சி மாதிரிகள், 3K சரிபார்ப்பு மாதிரிகள் மற்றும் 7K மாதிரிகள் சோதனை மாதிரிகள்.
நிலைகள் 16 உடல் மூட்டுகள் வரை கைமுறையாக லேபிளிடப்பட்டுள்ளன, மேலும் 410 பல்வேறு மனித செயல்பாடுகளை உள்ளடக்கிய YouTube படங்களிலிருந்து புகைப்படங்கள் எடுக்கப்பட்டுள்ளன.
22. யு.சி.எஃப் 101
UCF101 தரவுத்தொகுப்பில் 13,320 வகைகளாக ஒழுங்கமைக்கப்பட்ட 101 வீடியோ கிளிப்புகள் உள்ளன. இந்த 101 பிரிவுகளும் ஐந்து வகைகளாகப் பிரிக்கப்பட்டுள்ளன: உடல் இயக்கங்கள், மனித-மனித தொடர்புகள், மனித-பொருள் தொடர்புகள், இசைக்கருவி வாசித்தல் மற்றும் விளையாட்டு.
வீடியோக்கள் YouTube இலிருந்து 27 மணிநேரம் கொண்டவை.
23. ஆடியோசெட்
ஆடியோசெட் என்பது 2 மில்லியனுக்கும் அதிகமான மனித-குறிப்புள்ள 10-வினாடி வீடியோ பிரிவுகளால் உருவாக்கப்பட்ட ஆடியோ நிகழ்வு தரவுத்தொகுப்பு ஆகும். இந்தத் தரவைக் குறிப்பிடுவதற்கு, 632 நிகழ்வு வகைகளைக் கொண்ட ஒரு படிநிலை ஆன்டாலஜி பயன்படுத்தப்படுகிறது, இது ஒரே ஒலியை வேறுவிதமாக லேபிளிடலாம் என்பதைக் குறிக்கிறது.
24. ஸ்டான்போர்ட் இயற்கை மொழி அனுமானம்
SNLI தரவுத்தொகுப்பில் (ஸ்டான்போர்ட் நேச்சுரல் லாங்குவேஜ் இன்ஃபெரன்ஸ்) 570k வாக்கிய இணைப்புகள் உள்ளன, அவை கைமுறையாக உள்ளடக்கம், முரண்பாடு அல்லது நடுநிலை என வகைப்படுத்தப்பட்டுள்ளன.
வளாகங்கள் Flickr30k பட விளக்கங்களாகும், அதே சமயம் கருதுகோள்கள் கூட்டத்தை அடிப்படையாகக் கொண்ட சிறுகுறிப்பாளர்களால் உருவாக்கப்பட்டன, அவர்கள் ஒரு முன்மாதிரியை வழங்கினர் மற்றும் உள்ளடக்கிய, முரண்பாடான மற்றும் நடுநிலை அறிக்கைகளை உருவாக்க அறிவுறுத்தப்பட்டனர்.
25. காட்சி கேள்வி பதில்
காட்சி கேள்வி பதில் (VQA) என்பது படங்கள் தொடர்பான திறந்த கேள்விகளைக் கொண்ட தரவுத்தொகுப்பாகும். இந்தக் கேள்விகளுக்குப் பதிலளிக்க, நீங்கள் பார்வை, மொழி மற்றும் பொது அறிவு ஆகியவற்றைப் புரிந்துகொள்ள வேண்டும்.
தீர்மானம்
இயந்திரக் கற்றல் மற்றும் செயற்கை நுண்ணறிவு (AI) நடைமுறையில் ஒவ்வொரு வணிகத்திலும் நம் அன்றாட வாழ்விலும் அதிகமாக இருப்பதால், இந்த விஷயத்தில் கிடைக்கும் ஆதாரங்கள் மற்றும் தகவல்களின் எண்ணிக்கையும் அதிகரிக்கிறது.
ஆயத்த பொது தரவுத்தொகுப்புகள் AI மாதிரிகளை உருவாக்க ஒரு சிறந்த தொடக்க புள்ளியை வழங்குகின்றன, அதே நேரத்தில் அனுபவமுள்ள ML புரோகிராமர்கள் நேரத்தை மிச்சப்படுத்தவும் அவர்களின் திட்டங்களின் பிற கூறுகளில் கவனம் செலுத்தவும் அனுமதிக்கிறது.
ஒரு பதில் விடவும்