25 சிறந்த மாற்று AI பயிற்சி தரவுத்தொகுப்புகள் (2024)

பொருளடக்கம்[மறை][காட்டு]

1. CelebFaces பண்புக்கூறுகள் தரவுத்தொகுப்பு
2. DOTA
3. கூகுள் ஃபேஷியல் எக்ஸ்பிரஷன் ஒப்பீட்டு தரவுத்தொகுப்பு
4. காட்சி மரபணு
5. லிப்ரிஸ்பீச்
6. நகரப்பகுதிகள்
7. இயக்கவியல் தரவுத்தொகுப்பு
8. CelebAMask-HQ
9. பென் ட்ரீபேங்க்
10. VoxCeleb
11. சிக்ஸ்ரே
12. அமெரிக்க விபத்துக்கள்
13. கண் நோய் அங்கீகாரம்
14. இருதய நோய்
15. CLEVR
16. உலகளாவிய சார்புகள்
17. கிட்டி - 360
18. MOT(பல பொருள் கண்காணிப்பு)
19. பாஸ்கல் 3D+
20. விலங்குகளின் முகம் சிதைக்கக்கூடிய மாதிரிகள்
21. MPII மனித போஸ்ட் டேட்டாசெட்
22. UCF101
23. ஆடியோசெட்
24. ஸ்டான்போர்ட் இயற்கை மொழி அனுமானம்
25. காட்சி கேள்வி பதில்
தீர்மானம்

இப்போதெல்லாம், நம்மில் பெரும்பாலோர் இயந்திர கற்றல் மற்றும் AI மாதிரிகளை உருவாக்குவதிலும் தற்போதைய தரவுத்தொகுப்புகளைப் பயன்படுத்தி சிக்கல்களைத் தீர்ப்பதிலும் கவனம் செலுத்துகிறோம். ஆனால் முதலில், தரவுத்தொகுப்பு, அதன் முக்கியத்துவம் மற்றும் வலுவான AI மற்றும் ML தீர்வுகளை உருவாக்குவதில் அதன் பங்கு ஆகியவற்றை நாம் வரையறுக்க வேண்டும்.

இன்று, பல்வேறு துறைகளில் நிஜ-உலகப் பிரச்சினைகளைச் சமாளிப்பதற்கான ஆராய்ச்சி அல்லது பயன்பாடுகளை உருவாக்குவதற்கான திறந்த மூல தரவுத்தொகுப்புகள் எங்களிடம் ஏராளமாக உள்ளன.

இருப்பினும், உயர்தர அளவு தரவுத்தொகுப்புகளின் பற்றாக்குறை கவலைக்கு ஒரு ஆதாரமாக உள்ளது. தரவு பெருமளவில் உயர்ந்துள்ளது மற்றும் எதிர்காலத்தில் வேகமாக விரிவடையும்.

இந்த இடுகையில், உங்கள் அடுத்த AI திட்டத்தை உருவாக்க நீங்கள் பயன்படுத்தக்கூடிய இலவசமாகக் கிடைக்கும் தரவுத்தொகுப்புகளை நாங்கள் உள்ளடக்குவோம்.

1. CelebFaces பண்புக்கூறுகள் தரவுத்தொகுப்பு

CelebFaces Attributes Dataset (CelebA) ஆனது 200K பிரபலங்களின் புகைப்படங்களையும் ஒவ்வொரு படத்திற்கும் 40 பண்புக்கூறு சிறுகுறிப்புகளையும் கொண்டுள்ளது, இது போன்ற திட்டங்களுக்கு இது ஒரு சிறந்த தொடக்க புள்ளியாக அமைகிறது. முகத்தை அடையாளம் காணுதல், முகம் கண்டறிதல், மைல்கல் (அல்லது முக உறுப்பு) உள்ளூர்மயமாக்கல் மற்றும் முகத்தை திருத்துதல் & தொகுப்பு. மேலும், இந்தத் தொகுப்பில் உள்ள புகைப்படங்கள் பரந்த அளவிலான நிலை மாறுபாடுகள் மற்றும் பின்னணி ஒழுங்கீனங்களைக் கொண்டிருக்கின்றன.

2. டோடா

DOTA (தரவுத்தொகுப்பு பொருள் கண்டறிதல் வான்வழி புகைப்படங்களில்) என்பது பொருள் கண்டறிதலுக்கான ஒரு பெரிய அளவிலான தரவுத்தொகுப்பாகும், இதில் 15 பொதுவான பிரிவுகள் (எ.கா., கப்பல், விமானம், கார் போன்றவை), பயிற்சிக்கான 1411 படங்கள் மற்றும் சரிபார்ப்புக்கான 458 படங்கள் ஆகியவை அடங்கும்.

3. கூகுள் ஃபேஷியல் எக்ஸ்பிரஷன் ஒப்பீட்டு தரவுத்தொகுப்பு

கூகுள் முகபாவனை ஒப்பீட்டு தரவுத்தொகுப்பில் 500,000 முகப் புகைப்படங்கள் உட்பட சுமார் 156,000 பட மும்மூர்த்திகள் உள்ளன. இந்த தரவுத்தொகுப்பில் உள்ள ஒவ்வொரு மும்மடங்கு குறைந்தது ஆறு மனித மதிப்பீட்டாளர்களால் குறிப்பிடப்பட்டது என்பது குறிப்பிடத்தக்கது.

இந்த தரவுத்தொகுப்பு முக வெளிப்பாடு பகுப்பாய்வு சம்பந்தப்பட்ட திட்டங்களுக்கு பயனுள்ளதாக இருக்கும், அதாவது வெளிப்பாடு அடிப்படையிலான படம் மீட்டெடுப்பு, உணர்ச்சி வகைப்படுத்தல், வெளிப்பாடு தொகுப்பு மற்றும் பல. தரவுத்தொகுப்பிற்கான அணுகலைப் பெற, ஒரு சுருக்கமான படிவத்தை பூர்த்தி செய்ய வேண்டும்.

4. காட்சி மரபணு

விஷுவல் ஜீனோமில் பல தேர்வு சூழலில் காட்சி கேள்வி பதில் தரவு கிடைக்கிறது. இது 101,174 மில்லியன் QA ஜோடிகளுடன் 1.7 MSCOCO புகைப்படங்களால் ஆனது, ஒரு படத்திற்கு சராசரியாக 17 கேள்விகள்.

விஷுவல் கேள்வி பதில் தரவுத்தொகுப்புடன் ஒப்பிடுகையில், விஷுவல் ஜீனோம் தரவுத்தொகுப்பு ஆறு கேள்வி வகைகளில் மிகவும் நியாயமான விநியோகத்தைக் கொண்டுள்ளது: என்ன, எங்கே, எப்போது, யார், ஏன் மற்றும் எப்படி.

கூடுதலாக, விஷுவல் ஜீனோம் தரவுத்தொகுப்பில் பொருள்கள், பண்புகள் மற்றும் இணைப்புகளுடன் பெரிதும் குறியிடப்பட்ட 108K புகைப்படங்கள் உள்ளன.

5. லிப்ரிஸ்பீச்

LibriSpeech கார்பஸ் என்பது LibriVox திட்டத்தில் இருந்து சுமார் 1,000 மணிநேர ஆடியோபுக்குகளின் தொகுப்பாகும். பெரும்பாலான ஆடியோபுக்குகள் ப்ராஜெக்ட் குட்டன்பெர்க்கிலிருந்து வந்தவை.

பயிற்சி தரவு 100 மணிநேரம், 360 மணிநேரம் மற்றும் 500 மணிநேரம் ஆகிய மூன்று பகிர்வுகளாக பிரிக்கப்பட்டுள்ளது, அதே நேரத்தில் டெவ் மற்றும் சோதனை தரவு ஆடியோ நீளத்தில் தோராயமாக 5 மணிநேரம் ஆகும்.

6. நகரப்பகுதிகள்

நகர்ப்புற காட்சிகளைக் கொண்ட ஸ்டீரியோ வீடியோக்களின் மிகவும் நன்கு அறியப்பட்ட பெரிய அளவிலான தரவுத்தளங்களில் ஒன்று தி சிட்டிஸ்கேப்ஸ் என்று அழைக்கப்படுகிறது.

GPS இருப்பிடங்கள், வெளிப்புற வெப்பநிலை, ஈகோ-மோஷன் தரவு மற்றும் சரியான ஸ்டீரியோ முன்னோக்குகள் ஆகியவற்றை உள்ளடக்கிய பிக்சல்-துல்லியமான சிறுகுறிப்புகளுடன், இது 50 தனித்துவமான ஜெர்மன் நகரங்களிலிருந்து பதிவுகளை உள்ளடக்கியது.

7. இயக்கவியல் தரவுத்தொகுப்பு

மனித செயல்பாடுகளை பெரிய அளவில் மற்றும் நல்ல தரத்துடன் அங்கீகரிப்பதற்காக நன்கு அறியப்பட்ட வீடியோ தரவுத்தொகுப்புகளில் ஒன்று இயக்கவியல் தரவுத்தொகுப்பு ஆகும். 600 மனித நடவடிக்கை வகுப்புகளில் ஒவ்வொன்றிற்கும் குறைந்தது 600 வீடியோ கிளிப்புகள் உள்ளன, மொத்தம் 500,000 க்கும் அதிகமானவை.

திரைப்படங்கள் யூடியூப்பில் இருந்து நீக்கப்பட்டன; ஒவ்வொன்றும் சுமார் 10 வினாடிகள் நீளமானது மற்றும் ஒரு செயல்பாட்டு வகுப்பு மட்டுமே பட்டியலிடப்பட்டுள்ளது.

8. CelebMAsk-HQ

CelebAMask-HQ என்பது தோல், மூக்கு, கண்கள், புருவங்கள், காதுகள், வாய், உதடு, முடி, தொப்பி, கண் கண்ணாடி, காதணி, நெக்லஸ் போன்ற முகக் கூறுகளை உள்ளடக்கிய 30,000 வகுப்புகள் மற்றும் கவனமாகக் குறிப்பிடப்பட்ட முகமூடிகளுடன் கூடிய 19 உயர் தெளிவுத்திறன் கொண்ட முகப் புகைப்படங்களின் தொகுப்பாகும். கழுத்து, பொருள்.

முகத்தை அடையாளம் காணுதல், முகம் பாகுபடுத்துதல் மற்றும் GANகள் ஆகியவற்றைச் சோதிக்கவும் பயிற்சி செய்யவும் தரவுத்தொகுப்பைப் பயன்படுத்தலாம்.

9. பென் ட்ரீபேங்க்

வரிசை குறியிடலுக்கான மாதிரிகளை மதிப்பிடுவதற்கு மிகவும் குறிப்பிடத்தக்க மற்றும் அடிக்கடி பயன்படுத்தப்படும் கார்போராக்களில் ஒன்று ஆங்கில பென் ட்ரீபேங்க் (PTB) கார்பஸ் ஆகும், குறிப்பாக வால் ஸ்ட்ரீட் ஜர்னல் கட்டுரைகளுடன் தொடர்புடைய கார்பஸின் பகுதி.

ஒவ்வொரு வார்த்தையும் அதன் பேச்சின் ஒரு பகுதியை பணியின் ஒரு அங்கமாகக் குறிக்க வேண்டும். எழுத்து நிலை மற்றும் சொல் நிலை மொழி மாதிரியாக்கம் கார்பஸை அடிக்கடி பயன்படுத்துகிறது.

10. VoxCeleb

VoxCeleb என்பது தானாக உருவாக்கப்பட்ட ஒரு பெரிய அளவிலான பேச்சு அடையாள தரவுத்தொகுப்பாகும் திறந்த மூல ஊடகம். VoxCeleb 6k க்கும் மேற்பட்ட பேச்சாளர்களிடமிருந்து ஒரு மில்லியனுக்கும் அதிகமான பேச்சுகளைக் கொண்டுள்ளது.

தரவுத்தொகுப்பில் ஆடியோ-விஷுவல் உள்ளதால், காட்சிப் பேச்சுத் தொகுப்பு, பேச்சுப் பிரிப்பு, முகத்திலிருந்து குரலுக்கு குறுக்கு-மாடல் பரிமாற்றம் அல்லது அதற்கு நேர்மாறாக, மற்றும் தற்போதைய முக அங்கீகாரத்திற்கு துணையாக வீடியோவிலிருந்து முகத்தை அடையாளம் காணுதல் உள்ளிட்ட பல்வேறு கூடுதல் பயன்பாடுகளுக்கு இது பயன்படுத்தப்படலாம். தரவுத்தொகுப்புகள்.

11. சிக்ஸ்ரே

SIXray தரவுத்தொகுப்பில் சுரங்கப்பாதை நிலையங்களில் இருந்து சேகரிக்கப்பட்ட 1,059,231 எக்ஸ்-ரே படங்கள் மற்றும் மனித பாதுகாப்பு ஆய்வாளர்கள் ஆறு முக்கிய வகையான தடைசெய்யப்பட்ட பொருட்களைக் கண்டறிவதற்காக குறிப்பெடுக்கப்பட்டுள்ளனர்: கைத்துப்பாக்கிகள், கத்திகள், குறடுகளை, இடுக்கி, கத்தரிக்கோல் மற்றும் சுத்தியல். மேலும், பொருள் உள்ளூர்மயமாக்கலின் செயல்திறனை மதிப்பிடுவதற்காக, ஒவ்வொரு அனுமதிக்கப்படாத உருப்படிக்கான எல்லைப் பெட்டிகளும் சோதனைத் தொகுப்புகளில் கைமுறையாகச் சேர்க்கப்பட்டுள்ளன.

12. அமெரிக்க விபத்துக்கள்

திட்டத்தின் பொருள் ஏற்கனவே தரவுத்தொகுப்பின் பெயரால் வெளிப்படுத்தப்பட்டுள்ளது, அமெரிக்க விபத்துக்கள். நாடு தழுவிய வாகன விபத்துகள் குறித்த இந்தத் தரவுத்தொகுப்பில் பிப்ரவரி 2016 முதல் டிசம்பர் 2021 வரையிலான தகவல்கள் அடங்கும், மேலும் இது அமெரிக்காவில் உள்ள 49 மாநிலங்களை உள்ளடக்கியது.

ஏறத்தாழ 1.5 மில்லியன் விபத்து பதிவுகள் இப்போது இந்தத் தொகுப்பில் உள்ளன. இது பல ட்ராஃபிக் APIகளைப் பயன்படுத்தி நிகழ்நேரத்தில் சேகரிக்கப்பட்டது.

இந்த APIகள் போக்குவரத்து கேமராக்கள், சட்ட அமலாக்க அமைப்புகள் மற்றும் US மற்றும் மாநில போக்குவரத்து துறைகள் உட்பட பல்வேறு ஆதாரங்களில் இருந்து சேகரிக்கப்பட்ட போக்குவரத்து தகவலை அனுப்புகின்றன.

13. கண் நோய் அங்கீகாரம்

ஒழுங்கமைக்கப்பட்ட கண் நோய் நுண்ணறிவு அங்கீகாரம் (ODIR) 5,000 நோயாளிகளின் வயது, அவர்களின் இடது மற்றும் வலது கண்களில் உள்ள ஃபண்டஸின் நிறம் மற்றும் மருத்துவ நிபுணர்களின் நோயறிதல் முக்கிய வார்த்தைகள் உள்ளிட்ட தகவல்களைக் கொண்டுள்ளது.

இந்த தரவுத்தொகுப்பு, ஷாங்காங் மெடிக்கல் டெக்னாலஜி கோ., லிமிடெட் வாங்கிய சீனாவில் உள்ள பல்வேறு மருத்துவமனைகள் மற்றும் மருத்துவ வசதிகளிலிருந்து நோயாளிகளின் தரவுகளின் உண்மையான சேகரிப்பு ஆகும். உடன் தரக் கட்டுப்பாடு மேலாண்மை, சிறுகுறிப்புகள் திறமையான மனித வாசகர்களால் குறிக்கப்பட்டன.

14. இருதய நோய்

இந்த இதய நோய் தரவுத்தொகுப்பு வயது, பாலினம், மார்பு வலி வகை, ஓய்வு இரத்த அழுத்தம் போன்ற 76 அளவுருக்களின் அடிப்படையில் ஒரு நோயாளிக்கு இதய நோய் இருப்பதைக் கண்டறிய உதவுகிறது.

303 வழக்குகளுடன், தரவுத்தளமானது ஒரு நோயின் இருப்பை (மதிப்பு 1,2,3,4) அது இல்லாததிலிருந்து (மதிப்பு 0) வேறுபடுத்த முயல்கிறது.

15. CLEVR

CLEVR தரவுத்தொகுப்பு (கலவை மொழி மற்றும் தொடக்கக் காட்சிப் பகுத்தறிவு) காட்சி கேள்விக்கான பதிலைப் பிரதிபலிக்கிறது. இது 3D-ரெண்டர் செய்யப்பட்ட பொருட்களின் புகைப்படங்களைக் கொண்டுள்ளது, ஒவ்வொரு புகைப்படமும் பல வகைகளாகப் பிரிக்கப்பட்ட உயர் தொகுப்புக் கேள்விகளின் வரிசையுடன் இருக்கும்.

அனைத்து ரயில் மற்றும் சரிபார்ப்பு படங்கள் மற்றும் கேள்விகளுக்கு, தரவுத்தொகுப்பில் 70,000 புகைப்படங்கள் மற்றும் பயிற்சிக்கான 700,000 கேள்விகள், 15,000 படங்கள் மற்றும் 150,000 சரிபார்ப்புக்கான கேள்விகள், மற்றும் 15,000 படங்கள் மற்றும் 150,000 கேள்விகள், பொருள்கள், பதில்கள், செயல்திட்டங்கள், காட்சி நிகழ்ச்சிகள் ஆகியவற்றைச் சோதிக்கும்.

16. உலகளாவிய சார்புகள்

யுனிவர்சல் டிபென்டென்சிஸ் (யுடி) திட்டம் பல மொழிகளுக்கு குறுக்கு-மொழியில் ஒரே மாதிரியான உருவவியல் மற்றும் தொடரியல் ட்ரீபேங்க் சிறுகுறிப்பை உருவாக்குவதை நோக்கமாகக் கொண்டுள்ளது. 2.7 இல் வெளியிடப்பட்ட பதிப்பு 2020, 183 மொழிகளில் 104 மரக்கட்டைகளைக் கொண்டுள்ளது.

சிறுகுறிப்பு உலகளாவிய POW குறிச்சொற்கள், சார்புத் தலைகள் மற்றும் உலகளாவிய சார்பு லேபிள்களால் ஆனது.

17. கிட்டி - 360

மொபைல் ரோபோக்களுக்காக அடிக்கடி பயன்படுத்தப்படும் தரவுத்தொகுப்புகளில் ஒன்று மற்றும் தன்னாட்சி ஓட்டுநர் KITTI (கார்ல்ஸ்ரூஹே இன்ஸ்டிடியூட் ஆப் டெக்னாலஜி மற்றும் டொயோட்டா டெக்னாலஜிகல் இன்ஸ்டிடியூட்) ஆகும்.

உயர் தெளிவுத்திறன் கொண்ட RGB, கிரேஸ்கேல் ஸ்டீரியோ மற்றும் 3D லேசர் ஸ்கேனர் கேமராக்கள் போன்ற சென்சார் முறைகளின் வரம்பைப் பயன்படுத்தி படம்பிடிக்கப்பட்ட மணிநேர மதிப்புள்ள ட்ராஃபிக் காட்சிகளால் இது உருவாக்கப்பட்டுள்ளது. தரவுத்தொகுப்பு காலப்போக்கில் பல ஆராய்ச்சியாளர்களால் மேம்படுத்தப்பட்டுள்ளது, அவர்கள் தங்கள் தேவைகளுக்கு ஏற்ப அதன் பல்வேறு பகுதிகளை கைமுறையாக சிறுகுறிப்பு செய்தனர்.

18. MOT(பல பொருள் கண்காணிப்பு)

MOT (மல்டிபிள் ஆப்ஜெக்ட் டிராக்கிங்) என்பது பல பொருள் கண்காணிப்புக்கான தரவுத்தொகுப்பாகும், இதில் பொது இடங்களின் உட்புற மற்றும் வெளிப்புற காட்சிகள் அடங்கும், இதில் பாதசாரிகள் ஆர்வமுள்ள பொருட்களாக உள்ளனர். ஒவ்வொரு காட்சியின் வீடியோவும் இரண்டு துண்டுகளாக பிரிக்கப்பட்டுள்ளது, ஒன்று பயிற்சிக்காகவும் மற்றொன்று சோதனைக்காகவும்.

தரவுத்தொகுப்பில் அடங்கும் பொருள் கண்டறிதல் வீடியோ பிரேம்களில் மூன்று டிடெக்டர்களைப் பயன்படுத்துகிறது: SDP, Faster-RCNN மற்றும் DPM.

19. பாஸ்கல் 3D+

Pascal3D+ மல்டி-வியூ தரவுத்தொகுப்பு காட்டுப்பகுதியில் சேகரிக்கப்பட்ட புகைப்படங்களால் ஆனது, அதாவது, அதிக மாறுபாடுகளுடன் கூடிய உருப்படி வகைகளின் படங்கள், கட்டுப்பாடற்ற சூழ்நிலைகளில், நெரிசலான சூழல்களில், மற்றும் பல்வேறு நிலைகளில் எடுக்கப்பட்டது. Pascal3D+ ஆனது PASCAL VOC 12 தரவுத்தொகுப்பிலிருந்து எடுக்கப்பட்ட 2012 திடமான பொருள் வகைகளை உள்ளடக்கியது.

இந்த உருப்படிகளில் தோரணை தகவல் குறிக்கப்பட்டுள்ளது (அஜிமுத், உயரம் மற்றும் கேமராவிற்கான தூரம்). Pascal3D+ ஆனது, இந்த 12 வகைகளில் இமேஜ்நெட் சேகரிப்பில் இருந்து போஸ்-குறிப்புக் கொண்ட புகைப்படங்களை உள்ளடக்கியது.

20. விலங்குகளின் முகம் சிதைக்கக்கூடிய மாதிரிகள்

விலங்குகளின் முகத்தை சிதைக்கக்கூடிய மாதிரிகள் (FDMA) திட்டத்தின் குறிக்கோள், மனித முக அடையாளத்தை அடையாளம் காணுதல் மற்றும் கண்காணிப்பு ஆகியவற்றில் தற்போதைய வழிமுறைகளுக்கு சவால் விடுவது மற்றும் விலங்குகளின் முகப் பண்புகளின் சிறப்பியல்புகளைக் கொண்ட கணிசமான பெரிய மாறுபாட்டைக் கையாளக்கூடிய புதிய வழிமுறைகளை உருவாக்குவது ஆகும்.

முக உணர்ச்சிகள் அல்லது நிலைகளில் ஏற்படும் மாற்றங்கள், பகுதி அடைப்புகள் மற்றும் வெளிச்சம் ஆகியவற்றால் தூண்டப்பட்ட மாறுபாடுகளைக் கையாளும் போது, மனித முகங்களில் உள்ள அடையாளங்களை அடையாளம் கண்டு கண்காணிக்கும் திறனைத் திட்டத்தின் வழிமுறைகள் வெளிப்படுத்தின.

21. MPII மனித இடுகை தரவுத்தொகுப்பு

MPII மனித போஸ் தரவுத்தொகுப்பில் சுமார் 25K புகைப்படங்கள் உள்ளன, அவற்றில் 15K பயிற்சி மாதிரிகள், 3K சரிபார்ப்பு மாதிரிகள் மற்றும் 7K மாதிரிகள் சோதனை மாதிரிகள்.

நிலைகள் 16 உடல் மூட்டுகள் வரை கைமுறையாக லேபிளிடப்பட்டுள்ளன, மேலும் 410 பல்வேறு மனித செயல்பாடுகளை உள்ளடக்கிய YouTube படங்களிலிருந்து புகைப்படங்கள் எடுக்கப்பட்டுள்ளன.

22. யு.சி.எஃப் 101

UCF101 தரவுத்தொகுப்பில் 13,320 வகைகளாக ஒழுங்கமைக்கப்பட்ட 101 வீடியோ கிளிப்புகள் உள்ளன. இந்த 101 பிரிவுகளும் ஐந்து வகைகளாகப் பிரிக்கப்பட்டுள்ளன: உடல் இயக்கங்கள், மனித-மனித தொடர்புகள், மனித-பொருள் தொடர்புகள், இசைக்கருவி வாசித்தல் மற்றும் விளையாட்டு.

வீடியோக்கள் YouTube இலிருந்து 27 மணிநேரம் கொண்டவை.

23. ஆடியோசெட்

ஆடியோசெட் என்பது 2 மில்லியனுக்கும் அதிகமான மனித-குறிப்புள்ள 10-வினாடி வீடியோ பிரிவுகளால் உருவாக்கப்பட்ட ஆடியோ நிகழ்வு தரவுத்தொகுப்பு ஆகும். இந்தத் தரவைக் குறிப்பிடுவதற்கு, 632 நிகழ்வு வகைகளைக் கொண்ட ஒரு படிநிலை ஆன்டாலஜி பயன்படுத்தப்படுகிறது, இது ஒரே ஒலியை வேறுவிதமாக லேபிளிடலாம் என்பதைக் குறிக்கிறது.

24. ஸ்டான்போர்ட் இயற்கை மொழி அனுமானம்

SNLI தரவுத்தொகுப்பில் (ஸ்டான்போர்ட் நேச்சுரல் லாங்குவேஜ் இன்ஃபெரன்ஸ்) 570k வாக்கிய இணைப்புகள் உள்ளன, அவை கைமுறையாக உள்ளடக்கம், முரண்பாடு அல்லது நடுநிலை என வகைப்படுத்தப்பட்டுள்ளன.

வளாகங்கள் Flickr30k பட விளக்கங்களாகும், அதே சமயம் கருதுகோள்கள் கூட்டத்தை அடிப்படையாகக் கொண்ட சிறுகுறிப்பாளர்களால் உருவாக்கப்பட்டன, அவர்கள் ஒரு முன்மாதிரியை வழங்கினர் மற்றும் உள்ளடக்கிய, முரண்பாடான மற்றும் நடுநிலை அறிக்கைகளை உருவாக்க அறிவுறுத்தப்பட்டனர்.

25. காட்சி கேள்வி பதில்

காட்சி கேள்வி பதில் (VQA) என்பது படங்கள் தொடர்பான திறந்த கேள்விகளைக் கொண்ட தரவுத்தொகுப்பாகும். இந்தக் கேள்விகளுக்குப் பதிலளிக்க, நீங்கள் பார்வை, மொழி மற்றும் பொது அறிவு ஆகியவற்றைப் புரிந்துகொள்ள வேண்டும்.

தீர்மானம்

இயந்திரக் கற்றல் மற்றும் செயற்கை நுண்ணறிவு (AI) நடைமுறையில் ஒவ்வொரு வணிகத்திலும் நம் அன்றாட வாழ்விலும் அதிகமாக இருப்பதால், இந்த விஷயத்தில் கிடைக்கும் ஆதாரங்கள் மற்றும் தகவல்களின் எண்ணிக்கையும் அதிகரிக்கிறது.

ஆயத்த பொது தரவுத்தொகுப்புகள் AI மாதிரிகளை உருவாக்க ஒரு சிறந்த தொடக்க புள்ளியை வழங்குகின்றன, அதே நேரத்தில் அனுபவமுள்ள ML புரோகிராமர்கள் நேரத்தை மிச்சப்படுத்தவும் அவர்களின் திட்டங்களின் பிற கூறுகளில் கவனம் செலுத்தவும் அனுமதிக்கிறது.

சிறந்த மாற்று AI பயிற்சி தரவுத்தொகுப்புகள்

25 சிறந்த மாற்று AI பயிற்சி தரவுத்தொகுப்புகள்

1. CelebFaces பண்புக்கூறுகள் தரவுத்தொகுப்பு

2. டோடா

3. கூகுள் ஃபேஷியல் எக்ஸ்பிரஷன் ஒப்பீட்டு தரவுத்தொகுப்பு

4. காட்சி மரபணு

5. லிப்ரிஸ்பீச்

6. நகரப்பகுதிகள்

7. இயக்கவியல் தரவுத்தொகுப்பு

8. CelebMAsk-HQ

9. பென் ட்ரீபேங்க்

10. VoxCeleb

11. சிக்ஸ்ரே

12. அமெரிக்க விபத்துக்கள்

13. கண் நோய் அங்கீகாரம்

14. இருதய நோய்

15. CLEVR

16. உலகளாவிய சார்புகள்

17. கிட்டி - 360

18. MOT(பல பொருள் கண்காணிப்பு)

19. பாஸ்கல் 3D+

20. விலங்குகளின் முகம் சிதைக்கக்கூடிய மாதிரிகள்

21. MPII மனித இடுகை தரவுத்தொகுப்பு

22. யு.சி.எஃப் 101

23. ஆடியோசெட்

24. ஸ்டான்போர்ட் இயற்கை மொழி அனுமானம்

25. காட்சி கேள்வி பதில்

தீர்மானம்

பற்றி ஜே

HashDork பற்றிய கூடுதல் கட்டுரைகள்:

உங்கள் AI இல் மாயத்தோற்றத்தை எவ்வாறு குறைப்பது

கொலோசியன் vs ஹெய்கன்

இந்த எதிர்கால தொழில்நுட்ப செய்திமடல் சக் இல்லை

25 சிறந்த மாற்று AI பயிற்சி தரவுத்தொகுப்புகள்

1. CelebFaces பண்புக்கூறுகள் தரவுத்தொகுப்பு

2. டோடா

3. கூகுள் ஃபேஷியல் எக்ஸ்பிரஷன் ஒப்பீட்டு தரவுத்தொகுப்பு

4. காட்சி மரபணு

5. லிப்ரிஸ்பீச்

6. நகரப்பகுதிகள்

7. இயக்கவியல் தரவுத்தொகுப்பு

8. CelebMAsk-HQ

9. பென் ட்ரீபேங்க்

10. VoxCeleb

11. சிக்ஸ்ரே

12. அமெரிக்க விபத்துக்கள்

13. கண் நோய் அங்கீகாரம்

14. இருதய நோய்

15. CLEVR

16. உலகளாவிய சார்புகள்

17. கிட்டி - 360

18. MOT(பல பொருள் கண்காணிப்பு)

19. பாஸ்கல் 3D+

20. விலங்குகளின் முகம் சிதைக்கக்கூடிய மாதிரிகள்

21. MPII மனித இடுகை தரவுத்தொகுப்பு

22. யு.சி.எஃப் 101

23. ஆடியோசெட்

24. ஸ்டான்போர்ட் இயற்கை மொழி அனுமானம்

25. காட்சி கேள்வி பதில்

தீர்மானம்

பற்றி ஜே

HashDork பற்றிய கூடுதல் கட்டுரைகள்:

உங்கள் AI இல் மாயத்தோற்றத்தை எவ்வாறு குறைப்பது

சமூக ஊடகத்திற்கான 10 சிறந்த AI கருவிகள்

கொலோசியன் vs ஹெய்கன்

10 சிறந்த AI அனிமேஷன் வீடியோ மேக்கர் கருவிகள்

ரீடர் இண்டராக்ஸன்ஸ்

ஒரு பதில் விடவும் பதிலை நிருத்து

இந்த எதிர்கால தொழில்நுட்ப செய்திமடல் சக் இல்லை

ஒரு பதில் விடவும்