مواد جي جدول[لڪ][ڏسو]
- 1. CelebFaces Attributes Dataset
- 2. DOTA
- 3. Google Facial Expression comparison dataset
- 4. بصري جينوم
- 5. لئبرري اسپيچ
- 6. شهري اسپيس
- 7. Kinetics Dataset
- 8. CelebAMask-HQ
- 9. Penn Treebank
- 10. VoxCeleb
- 11. SIXray
- 12. يو ايس حادثا
- 13. اکين جي بيمارين جي سڃاڻپ
- 14. دل جي بيماري
- 15. CLEVR
- 16. عالمگير انحصار
- 17. ڪيٽي - 360
- 18. MOT (گهڻن آبجیکٹ ٽريڪنگ)
- 19. پاسڪال 3D+
- 20. جانورن جا منهن جا خراب ڪرڻ وارا ماڊل
- 21. MPII انساني پوسٽ ڊيٽا سيٽ
- 22. يو سي ايف 101
- 23. آڊيو سيٽ
- 24. اسٽينفورڊ نيچرل لئنگويج انفرنس
- 25. بصري سوال جو جواب
- ٿڪل
اڄڪلهه، اسان مان گھڻا مشين سکيا ۽ AI ماڊلز کي ترقي ڪرڻ ۽ موجوده ڊيٽا سيٽ استعمال ڪندي مسئلن کي حل ڪرڻ تي ڌيان ڏئي رهيا آهن. پر پهرين، اسان کي هڪ ڊيٽابيس، ان جي اهميت، ۽ مضبوط AI ۽ ML حل کي ترقي ڪرڻ ۾ ان جي ڪردار جي وضاحت ڪرڻ گهرجي.
اڄ، اسان وٽ اوپن سورس ڊيٽا سيٽن جو هڪ مجموعو آهي جنهن تي تحقيق ڪرڻ يا مختلف شعبن ۾ حقيقي دنيا جي مسئلن کي حل ڪرڻ لاءِ ايپليڪيشنون تيار ڪرڻ.
بهرحال، اعلي معيار جي مقدار جي ڊيٽا سيٽن جي گهٽتائي هڪ پريشاني جو ذريعو آهي. ڊيٽا بيحد وڌي وئي آهي ۽ مستقبل ۾ تيزيءَ سان وڌندي رهندي.
هن پوسٽ ۾، اسان آزاد طور تي دستياب ڊيٽا سيٽ کي ڍڪيندا سين جيڪي توهان پنهنجي ايندڙ AI پروجيڪٽ کي ترقي ڪرڻ لاء استعمال ڪري سگهو ٿا.
1. CelebFaces خاصيتون ڊيٽا سيٽ
CelebFaces Attributes Dataset (CelebA) هر تصوير لاءِ 200K کان وڌيڪ مشهور شخصيتن جون تصويرون ۽ 40 خاصيتن جي تشريح تي مشتمل آهي، ان کي منصوبن لاءِ هڪ بهترين شروعاتي نقطو بڻائي ٿو جهڙوڪ چهرو سڃاڻڻ، منهن جي سڃاڻپ، نشان (يا منهن جو حصو) لوڪلائيزيشن، ۽ منهن جي ايڊيٽنگ ۽ سنٿيسس. ان کان علاوه، هن مجموعي ۾ فوٽوز پوزيشن جي مختلف قسمن ۽ پس منظر جي ڪلٽر جي وسيع رينج تي مشتمل آهي.
2. ڊوٽا
DOTA (ڊيٽا سيٽ جو شيون ڳولڻ ايريئل فوٽوز ۾) اعتراض جي ڳولا لاءِ هڪ وڏي پيماني تي ڊيٽا سيٽ آهي جنهن ۾ 15 عام قسمون شامل آهن (مثال طور، جهاز، جهاز، ڪار، وغيره)، ٽريننگ لاءِ 1411 تصويرون، ۽ تصديق لاءِ 458 تصويرون.
3. Google Facial Expression comparison dataset
گوگل جي چهري جي اظهار جي مقابلي واري ڊيٽا سيٽ ۾ لڳ ڀڳ 500,000 تصويرن جي ٽريپلٽس شامل آهن، جن ۾ 156,000 چهري جون تصويرون شامل آهن. اها ڳالهه نوٽ ڪرڻ جي قابل آهي ته هن ڊيٽا سيٽ ۾ هر ٽرپلٽ گهٽ ۾ گهٽ ڇهه انساني ريٽررن پاران بيان ڪيل هئي.
هي ڊيٽا سيٽ انهن منصوبن لاءِ مفيد آهي جنهن ۾ منهن جي اظهار جو تجزيو شامل آهي، جهڙوڪ اظهار جي بنياد تي تصوير جي حاصلات، جذبات جي درجه بندي، اظهار جي جوڙجڪ، وغيره. ڊيٽا سيٽ تائين رسائي حاصل ڪرڻ لاء، هڪ مختصر فارم مڪمل ڪيو وڃي.
4. بصري جينوم
بصري سوال جواب ڏيڻ واري ڊيٽا هڪ گھڻ پسند واري ماحول ۾ موجود آهي Visual Genome ۾. اهو ٺهيل آهي 101,174 MSCOCO فوٽوز سان 1.7 ملين QA جوڑوں سان، سراسري طور تي 17 سوالن جي هر تصوير سان.
Visual Question Answering dataset جي مقابلي ۾، Visual Genome dataset کي ڇهن سوالن جي قسمن ۾ وڌيڪ منصفانه ورڇ آهي: ڇا، ڪٿي، ڪڏهن، ڪير، ڇو، ۽ ڪيئن.
ان کان علاوه، بصري جينوم ڊيٽا سيٽ ۾ 108K تصويرون شامل آهن جيڪي وڏي پيماني تي شيون، ملڪيت، ۽ ڪنيڪشن سان ٽيگ ڪيا ويا آهن.
5. لئبرري اسپيچ
LibriSpeech corpus LibriVox پروجيڪٽ مان تقريباً 1,000 ڪلاڪن جي آڊيو بوڪز جو مجموعو آهي. آڊيو بوڪ جي اڪثريت پروجيڪٽ گوتنبرگ مان نڪرندي آهي.
ٽريننگ ڊيٽا 100hr، 360hr، ۽ 500hr سيٽن جي ٽن حصن ۾ ورهايل آهي، جڏهن ته ديو ۽ ٽيسٽ ڊيٽا تقريباً 5hr آڊيو ڊگھائي ۾ آهن.
6. شهر جون جڳھون
شهري نظارن سان اسٽيريو ويڊيوز جي سڀ کان مشهور وڏي پيماني تي ڊيٽابيس مان هڪ کي سڏيو ويندو آهي The Cityscapes.
پکسل-صحيح تشريحن سان جن ۾ GPS جڳهيون، ٻاھرين گرمي پد، ايگو-موشن ڊيٽا، ۽ صحيح اسٽيريو نظريا شامل آھن، ان ۾ 50 مختلف جرمن شهرن مان رڪارڊنگ شامل آھن.
7. Kinetics ڊيٽا سيٽ
انساني سرگرمين کي وڏي پيماني تي ۽ سٺي معيار سان سڃاڻڻ لاءِ سڀ کان مشهور وڊيو ڊيٽا سيٽ آهي Kinetics dataset. اتي گهٽ ۾ گهٽ 600 وڊيو ڪلپس آهن هر هڪ لاءِ 600 انساني سرگرمين جي ڪلاسن مان، مجموعي طور تي 500,000 کان مٿي.
فلمون يوٽيوب تان ڪڍيون ويون؛ هر هڪ لڳ ڀڳ 10 سيڪنڊ ڊگهو آهي ۽ صرف هڪ سرگرمي ڪلاس درج ٿيل آهي.
8. CelebAMask-HQ
CelebAMask-HQ 30,000 هاءِ ريزوليوشن منهن جي تصويرن جو هڪ مجموعو آهي احتياط سان بيان ڪيل ماسڪ ۽ 19 طبقن سان جنهن ۾ منهن جا حصا شامل آهن جهڙوڪ چمڙي، نڪ، اکيون، ڀورو، ڪن، وات، لب، وار، ٽوپي، چشمو، ڪنڌ، هار، گردن، مواد.
ڊيٽا سيٽ کي استعمال ڪري سگھجي ٿو جانچڻ ۽ تربيت ڏيڻ لاءِ چهرو سڃاڻڻ، چهرو پارس ڪرڻ، ۽ GANs کي منهن ڏيڻ ۽ ايڊٽ ڪرڻ الورورٿمز لاءِ.
9. Penn Treebank
ھڪڙي سڀ کان وڌيڪ قابل ذڪر ۽ اڪثر استعمال ٿيل ڪارپورا ماڊلز جي اندازي لاءِ ترتيب جي ٽيگنگ لاءِ آھي انگريزي Penn Treebank (PTB) corpus، خاص طور تي وال اسٽريٽ جرنل آرٽيڪلز سان لاڳاپيل ڪارپس جو حصو.
هر لفظ کي لازمي طور تي تقرير جو حصو هجڻ گهرجي ڪم جي جزو جي طور تي. ڪردار جي سطح ۽ لفظ جي سطح ٻولي ماڊلنگ پڻ اڪثر ڪري corpus استعمال ڪري ٿو.
10. VoxCeleb
VoxCeleb هڪ وڏي پيماني تي تقرير جي سڃاڻپ ڊيٽا سيٽ آهي جيڪو خودڪار طور تي ٺاهيل آهي اوپن سورس ميڊيا. VoxCeleb 6k کان مٿي ڳالهائيندڙن کان هڪ ملين کان وڌيڪ تقريرون آهن.
جيئن ته ڊيٽا سيٽ ۾ آڊيو-بصري شامل آهي، اهو مختلف قسم جي اضافي ايپليڪيشنن لاءِ استعمال ٿي سگهي ٿو، جنهن ۾ بصري اسپيچ سنٿيسس، اسپيچ سيپئريشن، ڪراس ماڊل ٽرانسفر هڪ منهن کان آواز تائين يا ان جي برعڪس، ۽ ٽريننگ منهن جي سڃاڻپ کي وڊيو کان وٺي موجوده منهن جي سڃاڻپ کي پورو ڪرڻ لاءِ. ڊيٽا سيٽ.
11. ڇهه ري
SIXray ڊيٽا سيٽ ۾ شامل آهن 1,059,231 X-ray تصويرون سب وي اسٽيشنن مان گڏ ڪيون ويون آهن ۽ انساني سيڪيورٽي انسپيڪٽرن پاران بيان ڪيل ڇهن مکيه قسمن جي منع ٿيل شين کي ڳولڻ لاءِ: پستول، چاقو، رنچ، چمڪدار، اسڪيسر ۽ هامر. ان کان علاوه، هر ناپسنديده شيون لاء بائونڊنگ باڪس دستي طور تي شامل ڪيا ويا آهن ٽيسٽ سيٽ ۾ اعتراض لوڪلائيزيشن جي ڪارڪردگي جو جائزو وٺڻ لاء.
12. يو ايس حادثا
پروجيڪٽ جو مادو اڳ ۾ ئي ڊيٽا سيٽ جي نالي سان ظاهر ڪيو ويو آهي، يو ايس حادثا. ملڪ گير گاڏين جي حادثن تي هن ڊيٽا سيٽ ۾ فيبروري 2016 کان ڊسمبر 2021 تائين جي معلومات شامل آهي ۽ USA ۾ 49 رياستن تي مشتمل آهي.
لڳ ڀڳ 1.5 ملين حادثن جا رڪارڊ هاڻي هن مجموعي ۾ موجود آهن. اهو ڪيترن ئي ٽرئفڪ APIs استعمال ڪندي حقيقي وقت ۾ گڏ ڪيو ويو.
اهي APIs مختلف ذريعن کان گڏ ڪيل ٽرئفڪ جي معلومات کي منتقل ڪن ٿا، بشمول ٽرئفڪ ڪيمرا، قانون لاڳو ڪندڙ تنظيمون، ۽ آمريڪا ۽ رياستي رياستن جي ٽرانسپورٽ.
13. اکين جي بيماري جي سڃاڻپ
منظم ڪيل چشمي ڊيٽابيس Ocular Disease Intelligent Recognition (ODIR) 5,000 مريضن جي معلومات تي مشتمل آهي، جن ۾ انهن جي عمر، انهن جي کاٻي ۽ ساڄي اکين ۾ فنڊس جو رنگ، ۽ طبي ماهرن جي تشخيصي ڪي ورڊ شامل آهن.
هي ڊيٽا سيٽ چين جي مختلف اسپتالن ۽ طبي سهولتن مان مريضن جي ڊيٽا جو حقيقي مجموعو آهي جيڪو شينگگونگ ميڊيڪل ٽيڪنالاجي ڪمپني لميٽيڊ حاصل ڪيو آهي. سان معيار ڪنٽرول انتظام, تشريح کي ماهر انساني پڙهندڙن پاران ٽيگ ڪيو ويو.
14. دل جي بيماري
هي دل جي بيماري ڊيٽا سيٽ مريض ۾ دل جي بيماري جي موجودگي کي سڃاڻڻ ۾ مدد ڪري ٿي 76 پيرا ميٽرز جي بنياد تي جيئن ته عمر، جنس، سينه ۾ درد جو قسم، آرام وارو بلڊ پريشر وغيره.
303 ڪيسن سان، ڊيٽابيس صرف هڪ بيماري جي وجود کي مختلف ڪرڻ جي ڪوشش ڪري ٿو (قيمت 1,2,3,4) ان جي غير موجودگي (قيمت 0) کان.
15. CLEVR
CLEVR ڊيٽا سيٽ (تعميراتي ٻولي ۽ ايليمينٽري ويزوئل ريزننگ) بصري سوالن جي جوابن کي نقل ڪري ٿو. اهو 3D-پيش ڪيل شين جي تصويرن تي مشتمل آهي، هر هڪ تصوير سان گڏ ڪيترن ئي ڀاڱن ۾ ورهايل انتهائي جامع سوالن جو سلسلو.
سڀني ٽرين ۽ تصديق جي تصويرن ۽ سوالن لاءِ، ڊيٽا سيٽ تي مشتمل آهي 70,000 تصويرون ۽ 700,000 سوال ٽريننگ لاءِ، 15,000 تصويرون ۽ 150,000 سوالن جي تصديق لاءِ، ۽ 15,000 تصويرن ۽ 150,000 سوالن لاءِ جاچڻ لاءِ جن ۾ شيون، فنڪشنل پروگرام، تصويرون شامل آهن.
16. عالمگير انحصار
Universal Dependencies (UD) پروجيڪٽ جو مقصد ڪيترن ئي ٻولين لاءِ ڪراس-لساني طور تي يونيفارم مورفولوجي ۽ نحوي ٽري بئنڪ اينوٽيشن ٺاهڻ آهي. نسخو 2.7، جيڪو 2020 ۾ جاري ڪيو ويو، 183 ٻولين ۾ 104 ٽري بئنڪون آھن.
تشريح يونيورسل POW ٽيگ، انحصار سر، ۽ عالمگير انحصار ليبل مان ٺهيل آهي.
17. ڪيٽي - 360
موبائل روبوٽس لاءِ اڪثر استعمال ٿيل ڊيٽا سيٽن مان هڪ ۽ خودمختيار گاڏي KITTI (ڪارلسروه انسٽيٽيوٽ آف ٽيڪنالاجي ۽ ٽويوٽا ٽيڪنالاجي انسٽيٽيوٽ) آهي.
اھو ٺاھيو ويو آھي ڪلاڪن جي قيمتي ٽريفڪ منظرنامن تي جيڪي قبضو ڪيا ويا آھن استعمال ڪندي سينسر جي ھڪڙي حد جي طريقن، جھڙوڪ اعلي ريزوليوشن آر بي بي، گريسڪيل اسٽيريو، ۽ 3D ليزر اسڪينر ڪئميرا. ڊيٽا سيٽ کي وقت سان گڏ ڪيترن ئي محققن طرفان بهتر ڪيو ويو آهي جيڪي دستي طور تي ان جي مختلف حصن کي انهن جي ضرورتن کي پورو ڪرڻ لاءِ بيان ڪيو.
18. MOT (گهڻن آبجیکٹ ٽريڪنگ)
MOT (Multiple Object Tracking) ھڪ ڊيٽا سيٽ آھي گھڻن اعتراضن جي ٽريڪنگ لاءِ جنھن ۾ عوامي جڳهن جا اندروني ۽ ٻاھرين منظر شامل آھن جن ۾ پيادلن کي دلچسپيءَ جو سامان شامل آھي. هر منظر جي وڊيو کي ٻن حصن ۾ ورهايو ويو آهي، هڪ ٽريننگ لاءِ ۽ ٻيو ٽيسٽ لاءِ.
ڊيٽا سيٽ ۾ شامل آهي اعتراض جي سڃاڻپ ٽي ڊيڪٽر استعمال ڪندي ويڊيو فريم ۾: SDP، Faster-RCNN، ۽ DPM.
19. PASCAL 3D+
Pascal3D+ ملٽي-ويو ڊيٽا سيٽ جهنگلي ۾ گڏ ڪيل تصويرن مان ٺهيل آهي، يعني شين جي ڪيٽيگريز جون تصويرون جيڪي اعليٰ تبديليءَ سان، غير ڪنٽرول ٿيل حالتن ۾، ڀرپاسي واري ماحول ۾، ۽ مختلف هنڌن تي پڪڙيل آهن. Pascal3D+ ۾ PASCAL VOC 12 ڊيٽا سيٽ مان ٺهيل 2012 سخت اعتراض جا قسم شامل آهن.
اهي شيون انهن تي نشان لڳل پوسٽر معلومات آهن (azimuth، بلندي، ۽ ڪئميرا تائين فاصلو). Pascal3D+ اضافي طور تي انهن 12 ڀاڱن ۾ ImageNet ڪليڪشن مان پوز-تشريح ڪيل تصويرون شامل ڪري ٿو.
20. جانورن جا منهن جا خراب ڪرڻ وارا ماڊل
فيشل ڊيفارميبل ماڊلز آف اينيملز (FDMA) پروجيڪٽ جو مقصد انساني چهري جي نشانين جي سڃاڻپ ۽ ٽريڪنگ ۾ موجوده طريقن کي چيلينج ڪرڻ ۽ نوان الگورٿمس تيار ڪرڻ آهي جيڪي ڪافي وڏي تبديليءَ سان ڊيل ڪري سگهن ٿا جيڪي جانورن جي چهرن جي خاصيتن جي خاصيت آهي.
پروجيڪٽ جي الگورتھم انساني چهرن تي نشانين کي سڃاڻڻ ۽ ٽريڪ ڪرڻ جي صلاحيت کي ظاهر ڪيو جڏهن ته منهن جي جذبات يا پوزيشن ۾ تبديلين، جزوي بندش، ۽ روشنيءَ جي ڪري مختلف تبديلين کي منهن ڏيڻ.
21. MPII انساني پوسٽ ڊيٽا سيٽ
MPII Human Pose Dataset تي مشتمل آهي لڳ ڀڳ 25K تصويرون، جن مان 15K ٽريننگ جا نمونا آهن، جن مان 3K تصديق جا نمونا آهن، ۽ 7K جن مان ٽيسٽ جا نمونا آهن.
پوزيشنون دستي طور تي 16 جسماني جوڑوں سان ليبل ٿيل آهن، ۽ تصويرون يوٽيوب فلمن مان ورتيون ويون آهن 410 مختلف انساني سرگرمين کي ڍڪيندي.
22. يو سي ايف سي
UCF101 ڊيٽا سيٽ ۾ 13,320 وڊيو ڪلپس شامل آهن جن کي 101 ڀاڱن ۾ منظم ڪيو ويو آهي. انهن 101 درجن کي پنجن ڀاڱن ۾ ورهايو ويو آهي: جسماني حرڪتون، انساني-انساني رابطي، انساني-آبجیکٹ رابطي، موسيقي جو اوزار، ۽ راندين.
وڊيوز يوٽيوب کان آهن ۽ 27 ڪلاڪن تي مشتمل آهن.
23. آڊيو سيٽ
آڊيو سيٽ هڪ آڊيو ايونٽ ڊيٽا سيٽ آهي جيڪو 2 ملين کان وڌيڪ انساني-تشريح ڪيل 10-سيڪنڊ وڊيو حصن تي مشتمل آهي. هن ڊيٽا کي تشريح ڪرڻ لاءِ، 632 واقعن جي قسمن تي مشتمل هڪ درجيبندي آنٽولوجي استعمال ڪئي وئي آهي، جنهن جو مطلب آهي ته ساڳئي آواز کي مختلف طرح سان ليبل ڪيو وڃي ٿو.
24. اسٽنفورڊ قدرتي ٻولي جو حوالو
SNLI ڊيٽا سيٽ (Stanford Natural Language Inference) ۾ 570k جملي جو جوڙو شامل آھي جنھن کي دستي طور تي درج ڪيو ويو آھي انٽيلمينٽ، تضاد، يا غير جانبدار.
احاطا آهن Flickr30k تصويري وضاحتون، جڏهن ته مفروضا ٺاهيا ويا هئا ڪڙهاڙيءَ سان ڪيل تشريح ڪندڙ جن کي هڪ بنياد مهيا ڪيو ويو هو ۽ هدايتون ڏنيون ويون آهن ته هو انٽيلنگ، متضاد ۽ غير جانبدار بيان پيدا ڪن.
25. بصري سوال جو جواب
Visual Question Answering (VQA) ھڪڙو ڊيٽا سيٽ آھي جنھن ۾ تصويرن جي حوالي سان کليل سوالن تي مشتمل آھي. انهن سوالن جا جواب ڏيڻ لاءِ، توهان کي وژن، ٻولي ۽ عام فهم سمجهڻ جي ضرورت آهي.
ٿڪل
جيئن ته مشيني سکيا ۽ مصنوعي ذهانت (AI) عملي طور تي هر ڪاروبار ۾ ۽ اسان جي روزاني زندگيءَ ۾ وڌيڪ پکڙجي ويندي آهي، تنهنڪري ان موضوع تي موجود وسيلن ۽ معلومات جو تعداد به وڌي ٿو.
تيار ٿيل عوامي ڊيٽا سيٽس AI ماڊلز کي ترقي ڪرڻ لاءِ هڪ بهترين شروعاتي نقطو مهيا ڪن ٿا جڏهن ته موسمي ايم ايل پروگرامرز کي پڻ وقت بچائڻ ۽ انهن جي منصوبن جي ٻين عنصرن تي ڌيان ڏيڻ جي اجازت ڏين ٿا.
جواب ڇڏي وڃو