ዝርዝር ሁኔታ[ደብቅ][አሳይ]
- 1. CelebFaces ባህሪያት የውሂብ ስብስብ
- 2. DOTA
- 3. ጎግል የፊት አገላለጽ ንጽጽር ዳታ ስብስብ
- 4. ቪዥዋል ጂኖም
- 5. LibriSpeech
- 6. የከተማ ቦታዎች
- 7. Kinetics Dataset
- 8. CelebAMask-HQ
- 9. ፔን Treebank
- 10. VoxCeleb
- 11. SIXray
- 12. የአሜሪካ አደጋዎች
- 13. የዓይን ሕመምን መለየት
- 14. የልብ ህመም
- 15. CLEVR
- 16. ሁለንተናዊ ጥገኞች
- 17. ኪቲቲ - 360
- 18. MOT(ባለብዙ ነገር ክትትል)
- 19. ፓስካል 3D+
- 20. የፊት ቅርጽ ሊበላሹ የሚችሉ የእንስሳት ሞዴሎች
- 21. MPII የሰው ፖስት የውሂብ ስብስብ
- 22. UCF101
- 23. የድምጽ ቅንብር
- 24. የስታንፎርድ የተፈጥሮ ቋንቋ ማጣቀሻ
- 25. የእይታ ጥያቄ መልስ
- መደምደሚያ
በአሁኑ ጊዜ አብዛኞቻችን የማሽን መማሪያን እና AI ሞዴሎችን በማዳበር እና ወቅታዊ የውሂብ ስብስቦችን በመጠቀም ችግሮችን በመፍታት ላይ እናተኩራለን. በመጀመሪያ ግን የውሂብ ስብስብን፣ ጠቃሚነቱን እና ጠንካራ AI እና ML መፍትሄዎችን በማዘጋጀት ያለውን ሚና መግለጽ አለብን።
ዛሬ፣ በተለያዩ ዘርፎች የገሃዱ ዓለም ጉዳዮችን ለመፍታት ምርምር ለማድረግ ወይም መተግበሪያዎችን የምናዘጋጅባቸው ብዙ ክፍት ምንጭ ዳታ ስብስቦች አሉን።
ነገር ግን፣ ከፍተኛ ጥራት ያላቸው የቁጥር መረጃዎች እጥረት የጭንቀት ምንጭ ነው። መረጃው በከፍተኛ ደረጃ ጨምሯል እና ወደፊትም በፍጥነት መስፋፋቱን ይቀጥላል።
በዚህ ልኡክ ጽሁፍ የሚቀጥለውን የ AI ፕሮጄክትዎን ለማዳበር ሊጠቀሙባቸው የሚችሏቸውን በነፃ የሚገኙ የውሂብ ስብስቦችን እንሸፍናለን።
1. የCelebFaces ባህሪያት የውሂብ ስብስብ
CelebFaces Attributes Dataset (CelebA) ለእያንዳንዱ ምስል ከ200ሺህ በላይ የታዋቂ ፎቶዎችን እና 40 የባህሪ ማብራሪያዎችን ይዟል፣ይህም ለመሳሰሉት ፕሮጀክቶች ጥሩ መነሻ ያደርገዋል። ፊት ለይቶ ማወቅ፣ ፊትን መለየት ፣ የመሬት ምልክት (ወይም የፊት አካል) አካባቢያዊ ማድረግ እና የፊት ማረም እና ውህደት። በተጨማሪም፣ በዚህ ስብስብ ውስጥ ያሉት ፎቶዎች ሰፋ ያለ የአቀማመጥ ልዩነቶችን እና የተዝረከረኩ ነገሮችን ይይዛሉ።
2. ዶት
DOTA (የውሂብ ስብስብ የ የንጥል ፍለጋ በአየር ላይ ፎቶዎች) 15 የጋራ ምድቦችን (ለምሳሌ መርከብ፣ አውሮፕላን፣ መኪና፣ ወዘተ)፣ 1411 ምስሎችን ለሥልጠና እና 458 የማረጋገጫ ምስሎችን የሚያካትት ለዕቃ ፈልጎ ማወቂያ ትልቅ መጠን ያለው ዳታ ስብስብ ነው።
3. ጎግል የፊት አገላለጽ ንጽጽር ዳታ ስብስብ
የጎግል የፊት መግለጫ ንጽጽር ዳታ ስብስብ 500,000 የፊት ፎቶዎችን ጨምሮ ወደ 156,000 የሚጠጉ የሶስትዮሽ ምስሎችን ይዟል። በዚህ የመረጃ ቋት ውስጥ ያለው እያንዳንዱ ትሪፕሌት ቢያንስ በስድስት የሰው ደረጃ መለኪያዎች የተብራራ መሆኑ ልብ ሊባል ይገባል።
ይህ የመረጃ ስብስብ የፊት መግለጫ ትንተናን ለሚያካትቱ ፕሮጄክቶች ጠቃሚ ነው፣ ለምሳሌ በገለፃ ላይ የተመሰረተ ምስልን መልሶ ማግኘት፣ ስሜትን መከፋፈል፣ የገለጻ ውህደት እና የመሳሰሉት። የውሂብ ስብስብን ለመድረስ አጭር ቅጽ መሞላት አለበት።
4. ቪዥዋል ጂኖም
ምስላዊ ጥያቄ የባለብዙ ምርጫ አካባቢ ውሂብን መመለስ በ Visual Genome ውስጥ ይገኛል። በ101,174 MSCOCO ፎቶዎች ከ1.7 ሚሊዮን QA ጥንዶች ጋር ነው የተሰራው፣ በእያንዳንዱ ምስል በአማካይ 17 ጥያቄዎች አሉት።
ከ Visual question መልስ ዳታ ስብስብ ጋር ሲነጻጸር፣ የእይታ ጂኖም መረጃ ስብስብ በስድስት የጥያቄ ዓይነቶች ላይ የበለጠ ፍትሃዊ ስርጭት አለው፡ ምን፣ የት፣ መቼ፣ ማን፣ ለምን እና እንዴት።
በተጨማሪም የ Visual Genome ዳታ ስብስብ በዕቃዎች፣ ንብረቶች እና ግንኙነቶች ከፍተኛ መለያ የተደረገባቸውን 108 ኪ ፎቶዎችን ያካትታል።
5. LibriSpeech
LibriSpeech ኮርፐስ ከLibriVox ፕሮጀክት ወደ 1,000 ሰዓታት የሚጠጉ የኦዲዮ መጽሐፍት ስብስብ ነው። አብዛኛዎቹ የኦዲዮ መጽሐፍት ከፕሮጀክት ጉተንበርግ የመጡ ናቸው።
የስልጠናው መረጃ በሶስት ክፍልፋዮች በ100hr፣ 360hr እና 500hr ስብስቦች የተከፋፈለ ሲሆን የዴቭ እና የፈተና መረጃው በድምጽ ርዝመት በግምት 5hr ነው።
6. የከተማ ቦታዎች
የከተማ እይታ ካላቸው የስቲሪዮ ቪዲዮዎች በጣም ታዋቂ ከሆኑ ትላልቅ የውሂብ ጎታዎች አንዱ The Cityscapes ይባላል።
የጂፒኤስ አካባቢዎችን፣ የውጪውን የሙቀት መጠን፣ ኢጎ-እንቅስቃሴ ዳታ እና ትክክለኛ የስቲሪዮ እይታዎችን ባካተቱ የፒክሰል-ትክክለኛ ማብራሪያዎች፣ ከ50 የተለያዩ የጀርመን ከተሞች የተቀዳ ቅጂዎችን ያካትታል።
7. የኪነቲክስ የውሂብ ስብስብ
የሰዎች እንቅስቃሴን በከፍተኛ ደረጃ እና በጥሩ ጥራት ለመለየት ከሚታወቁት በጣም የታወቁ የቪዲዮ ዳታ ስብስቦች አንዱ የኪነቲክ ዳታ ስብስብ ነው። ለእያንዳንዱ 600 የሰው እንቅስቃሴ ክፍሎች ቢያንስ 600 የቪዲዮ ክሊፖች አሉ፣ በድምሩ ከ500,000 በላይ።
ፊልሞቹ ከዩቲዩብ ተስበው ነበር; እያንዳንዳቸው 10 ሰከንድ ያህል ይረዝማሉ እና የተዘረዘረው አንድ የእንቅስቃሴ ክፍል ብቻ ነው ያለው።
8. CelebAMAsk-HQ
CelebAMask-HQ የ30,000 ባለ ከፍተኛ ጥራት የፊት ፎቶዎች ስብስብ ነው በጥንቃቄ የተብራሩ ጭምብሎች እና 19 ክፍሎች እንደ ቆዳ፣ አፍንጫ፣ አይን፣ ብሮንት፣ ጆሮ፣ አፍ፣ ከንፈር፣ ፀጉር፣ ኮፍያ፣ የዓይን መስታወት፣ የጆሮ ጌጥ፣ የአንገት ሀብል፣ አንገት, ቁሳቁስ.
የውሂብ ስብስቡ የፊት ለይቶ ማወቂያን፣ ፊትን መተንተን እና ጂኤንን ፊትን ለማመንጨት እና ለማርትዕ ስልተ ቀመሮችን ለመፈተሽ እና ለማሰልጠን ስራ ላይ ሊውል ይችላል።
9. ፔን Treebank
ለተከታታይ መለያ መለያዎች ሞዴሎችን ለመገምገም በጣም ከሚታወቁ እና ብዙ ጊዜ ጥቅም ላይ የዋሉ ኮርፖራዎች አንዱ የእንግሊዝ ፔን ትሬባንክ (PTB) ኮርፐስ ነው፣ በተለይም ከዎል ስትሪት ጆርናል ጽሑፎች ጋር የሚዛመደው የኮርፐስ ክፍል።
እያንዳንዱ ቃል የንግግሩን ክፍል እንደ የሥራው አካል መለያ መለያ መስጠት አለበት። የቁምፊ ደረጃ እና የቃል ደረጃ የቋንቋ ሞዴሊንግ በተጨማሪም በተደጋጋሚ ኮርፐስ ይጠቀማል.
10. VoxCeleb
VoxCeleb በራስ ሰር የመነጨ ትልቅ የንግግር መለያ ውሂብ ስብስብ ነው። ክፍት ምንጭ ሚዲያ. VoxCeleb ከ6k በላይ ድምጽ ማጉያዎች ከአንድ ሚሊዮን በላይ ንግግሮች አሉት።
የመረጃ ቋቱ ኦዲዮ-ቪዥዋልን ስለሚያካትት ለተለያዩ ተጨማሪ አፕሊኬሽኖች ማለትም የእይታ ንግግር ውህደትን፣ የንግግር መለያየትን፣ ሞዳል-ሞዳልን ከፊት ወደ ድምፅ ማስተላለፍ ወይም በተቃራኒው፣ እና የፊት ለይቶ ማወቅን ከቪዲዮ ማሰልጠን የአሁኑን የፊት መታወቂያን ይጨምራል። የውሂብ ስብስቦች.
11. SIXray
የሲክስሬይ መረጃ ስብስብ 1,059,231 የኤክስሬይ ሥዕሎች ከምድር ውስጥ ባቡር ጣቢያዎች የተሰበሰቡ እና በሰው ደህንነት ተቆጣጣሪዎች የተገለጹ ስድስት ዋና ዋና የተከለከሉ ዕቃዎችን ማለትም ሽጉጥ፣ ቢላዋ፣ ዊንች፣ ፕላስ፣ መቀስ እና መዶሻ ያካትታል። በተጨማሪም የነገር የትርጉም አፈጻጸምን ለመገምገም ለእያንዳንዱ የተከለከለ ነገር የማሰሪያ ሳጥኖች በእጅ ወደ የሙከራ ስብስቦች ተጨምረዋል።
12. የአሜሪካ አደጋዎች
የፕሮጀክቱ ንጥረ ነገር አስቀድሞ በመረጃ ቋቱ ስም ፣ የዩኤስ አደጋዎች ተገልጧል። ይህ በአገር አቀፍ የተሽከርካሪ አደጋዎች ላይ ያለው መረጃ ከየካቲት 2016 እስከ ታኅሣሥ 2021 ድረስ ያለውን መረጃ ያካተተ ሲሆን በዩኤስኤ ውስጥ 49 ግዛቶችን ያጠቃልላል።
በዚህ ስብስብ ውስጥ በግምት 1.5 ሚሊዮን የአደጋ መዝገቦች አሉ። በርካታ የትራፊክ ኤፒአይዎችን በመጠቀም በቅጽበት ተሰብስቧል።
እነዚህ ኤፒአይዎች የትራፊክ ካሜራዎችን፣ የህግ አስከባሪ ድርጅቶችን እና የዩኤስ እና የግዛት ትራንስፖርት መምሪያዎችን ጨምሮ ከተለያዩ ምንጮች የተሰበሰቡ የትራፊክ መረጃዎችን ያስተላልፋሉ።
13. የዓይን በሽታን ለይቶ ማወቅ
የተደራጀው የአይን ዳታቤዝ የአይን በሽታ ኢንተለጀንት ማወቂያ (ODIR) እድሜያቸው፣ በግራ እና በቀኝ አይናቸው ላይ ያለው የፈንዱ ቀለም እና የህክምና ባለሙያዎች የመመርመሪያ ቁልፍ ቃላትን ጨምሮ ስለ 5,000 ታካሚዎች መረጃ ይዟል።
ይህ ዳታ ስብስብ የሻንግጎንግ ሜዲካል ቴክኖሎጂ ኮ ጋር የጥራት ቁጥጥር አስተዳደር፣ ማብራሪያዎች በሰለጠኑ የሰው አንባቢዎች መለያ ተሰጥቷቸዋል።
14. የልብ ህመም
ይህ የልብ ህመም መረጃ ስብስብ በታካሚው ላይ የልብ ህመም መኖሩን በ76 መለኪያዎች ማለትም እድሜ፣ ጾታ፣ የደረት ህመም አይነት፣ የእረፍት ጊዜ የደም ግፊት እና የመሳሰሉትን በመለየት ይረዳል።
ከ 303 ጉዳዮች ጋር, የውሂብ ጎታው በቀላሉ የበሽታ መኖሩን (እሴት 1,2,3,4) ከመጥፋት (ዋጋ 0) ለመለየት ይፈልጋል.
15. CLEVR
የCLEVR መረጃ ስብስብ (አጻጻፍ ቋንቋ እና አንደኛ ደረጃ ምስላዊ ማመዛዘን) የእይታ ጥያቄ መልስን ያስመስላል። በ3-ል የተሰሩ እቃዎች ፎቶግራፎችን ያቀፈ ሲሆን እያንዳንዱ ፎቶግራፍ በበርካታ ምድቦች የተከፋፈሉ ተከታታይ በጣም የተዋቀሩ ጥያቄዎች አሉት.
ለሁሉም የባቡር እና የማረጋገጫ ሥዕሎች እና ጥያቄዎች የመረጃ ቋቱ 70,000 ፎቶግራፎች እና 700,000 የሥልጠና ጥያቄዎችን ፣ 15,000 ምስሎችን እና 150,000 ጥያቄዎችን ለማረጋገጫ እና 15,000 ምስሎችን እና 150,000 ዕቃዎችን ፣ ምላሾችን ፣ የትዕይንት ግራፎችን እና የተግባርን ጥያቄዎችን ያካትታል።
16. ሁለንተናዊ ጥገኛዎች
ሁለንተናዊ ጥገኞች (UD) ፕሮጀክት ዓላማው በቋንቋ አቋራጭ ወጥ የሆነ ዘይቤ እና አገባብ የዛፍባንክ ማብራሪያ ለብዙ ቋንቋዎች መፍጠር ነው። በ2.7 የተለቀቀው ስሪት 2020፣ በ183 ቋንቋዎች 104 የዛፍ ባንኮች አሉት።
ማብራሪያው ከሁለንተናዊ POW መለያዎች፣ የጥገኝነት ራሶች እና ሁለንተናዊ የጥገኝነት መለያዎች የተሰራ ነው።
17. ኪቲ - 360
ለሞባይል ሮቦቶች በብዛት ጥቅም ላይ ከዋሉት የውሂብ ስብስቦች አንዱ እና በራስ ገዝነት መንዳት KITTI (የካርልስሩሄ የቴክኖሎጂ ተቋም እና ቶዮታ ቴክኖሎጂ ኢንስቲትዩት) ነው።
እንደ ባለ ከፍተኛ ጥራት RGB፣ grayscale stereo እና 3D laser scanner ካሜራዎች ያሉ የተለያዩ ሴንሰር ዘዴዎችን በመጠቀም የተያዙ የሰአታት ዋጋ ያላቸው የትራፊክ ሁኔታዎችን ያቀፈ ነው። የመረጃው ስብስብ ከጊዜ ወደ ጊዜ ተሻሽሏል በተለያዩ ተመራማሪዎች ለፍላጎታቸው እንዲመች የተለያዩ ክፍሎችን በእጅ አብራርተዋል።
18. MOT(ባለብዙ ነገር ክትትል)
MOT (ባለብዙ ነገር መከታተያ) እግረኞችን እንደ የፍላጎት ዕቃዎች የሚያካትቱ የህዝብ ቦታዎች የቤት ውስጥ እና የውጭ ገጽታዎችን የሚያጠቃልል የበርካታ ነገሮች ክትትል ዳታ ስብስብ ነው። የእያንዳንዱ ትዕይንት ቪዲዮ በሁለት ክፍሎች የተከፈለ ሲሆን አንደኛው ለስልጠና እና ሌላው ለሙከራ ነው።
የውሂብ ስብስብ ያካትታል የነገር ማወቂያዎች በቪዲዮ ክፈፎች ውስጥ ሶስት መመርመሪያዎችን በመጠቀም ኤስዲፒ፣ ፈጣኑ-RCNN እና DPM።
19. ፓስካል 3D+
የPascal3D+ ባለብዙ እይታ ዳታ ስብስብ በዱር ውስጥ የተሰበሰቡ ፎቶግራፎች ማለትም ከፍተኛ ልዩነት ያላቸው የንጥል ምድቦች ምስሎች ከቁጥጥር ውጪ በሆኑ ሁኔታዎች፣ በተጨናነቁ አካባቢዎች እና በተለያዩ ቦታዎች የተያዙ ፎቶግራፎችን ያቀፈ ነው። ፓስካል 3ዲ+ ከPASCAL VOC 12 የውሂብ ስብስብ የተውጣጡ 2012 ግትር የነገር ምድቦችን ያካትታል።
እነዚህ ነገሮች በእነሱ ላይ ምልክት የተደረገባቸው የአቀማመጥ መረጃ አላቸው (አዚሙዝ፣ ከፍታ እና ለካሜራ ያለው ርቀት)። ፓስካል 3ዲ+ በተጨማሪም በእነዚህ 12 ምድቦች ውስጥ ከImageNet ስብስብ በፖስ-የተብራሩ ፎቶዎችን ያካትታል።
20. የፊት መበላሸት የሚችሉ የእንስሳት ሞዴሎች
የፊት የሚዛባ የእንስሳት ሞዴሎች (FDMA) ፕሮጀክት ግብ በሰው ፊት ላይ የሚታዩ ምልክቶችን መለየት እና መከታተልን እና አዳዲስ ስልተ ቀመሮችን ማዘጋጀት ሲሆን የእንስሳት የፊት ባህሪያትን ባህሪይ ከፍተኛ ልዩነት መፍጠር ነው።
የፕሮጀክቱ አልጎሪዝም በሰው ፊት ላይ የሚታዩ ምልክቶችን የመለየት እና የመከታተል ችሎታን አሳይቷል በፊቱ ስሜቶች ወይም አቀማመጥ ለውጦች ፣በከፊል መዘጋቶች እና በብርሃን ለውጦች ምክንያት።
21. MPII የሰው ፖስት የውሂብ ስብስብ
የ MPII Human Pose ዳታ ስብስብ 25K ፎቶዎችን ይዟል፣ከነሱ 15ኪዩ የስልጠና ናሙናዎች፣ 3ኪዩቹ የማረጋገጫ ናሙናዎች እና 7ኪዩዋች የሙከራ ናሙናዎች ናቸው።
ቦታዎቹ እስከ 16 የሰውነት መገጣጠሚያዎች በእጅ የተለጠፈ ሲሆን ፎቶግራፎቹ የተወሰዱት ከዩቲዩብ ፊልሞች 410 የተለያዩ የሰዎች እንቅስቃሴዎችን የሚሸፍኑ ናቸው።
22. ዩሲኤፍ101
የ UCF101 የውሂብ ስብስብ በ13,320 ምድቦች የተደራጁ 101 የቪዲዮ ቅንጥቦችን ይዟል። እነዚህ 101 ምድቦች በአምስት ምድቦች የተከፋፈሉ ናቸው፡ የሰውነት እንቅስቃሴዎች፣ የሰው እና የሰው መስተጋብር፣ የሰው-ነገር መስተጋብር፣ የሙዚቃ መሳሪያ መጫወት እና ስፖርት።
ቪዲዮዎቹ ከዩቲዩብ የመጡ ናቸው እና የ27 ሰአታት ቆይታ አላቸው።
23. የድምጽ ቅንብር
ኦዲዮሴት ከ2 ሚሊዮን በላይ በሰው የተብራራ የ10 ሰከንድ የቪዲዮ ክፍሎች የተዋቀረ የኦዲዮ ክስተት ዳታ ስብስብ ነው። ይህንን መረጃ ለማብራራት፣ 632 የክስተት ዓይነቶችን ያካተተ ተዋረዳዊ ኦንቶሎጂ ጥቅም ላይ ይውላል፣ ይህ የሚያመለክተው ተመሳሳይ ድምጽ በተለየ መንገድ ሊሰየም ይችላል።
24. የስታንፎርድ የተፈጥሮ ቋንቋ ማጣቀሻ
የ SNLI ዳታ ስብስብ (የስታንፎርድ የተፈጥሮ ቋንቋ ኢንፈረንስ) 570k የዓረፍተ ነገር ጥንዶችን ይዟል በእጅ የተካተቱ እንደ ማዛመጃ፣ ተቃርኖ ወይም ገለልተኛ።
ግቢው የFlickr30k የሥዕል መግለጫዎች ሲሆኑ መላምቶች የተዘጋጁት በሕዝብ ምንጭ ገላጭ ተንታኞች ነው ቅድመ ሁኔታ በተሰጠው እና አሳሳች፣ ተቃራኒ እና ገለልተኛ መግለጫዎችን እንዲያወጡ ታዘዙ።
25. የእይታ ጥያቄ መልስ
Visual Question Answering (VQA) ሥዕሎችን በተመለከተ ክፍት ጥያቄዎችን የያዘ የውሂብ ስብስብ ነው። ለእነዚህ ጥያቄዎች መልስ ለመስጠት ራዕይን, ቋንቋን እና የጋራ አእምሮን መረዳት ያስፈልግዎታል.
መደምደሚያ
የማሽን መማሪያ እና አርቴፊሻል ኢንተለጀንስ (AI) በተግባር በሁሉም ንግድ እና በእለት ተእለት ህይወታችን ውስጥ በስፋት እየተስፋፉ ሲሄዱ በርዕሰ-ጉዳዩ ላይ የሚገኙት የሀብቶች እና መረጃዎች ብዛትም ይጨምራል።
ዝግጁ የሆኑ የህዝብ ዳታ ስብስቦች AI ሞዴሎችን ለማዘጋጀት ጥሩ መነሻ ነጥብ ይሰጣሉ እንዲሁም ልምድ ያካበቱ የኤምኤል ፕሮግራም አዘጋጆች ጊዜን እንዲቆጥቡ እና በሌሎች የፕሮጀክቶቻቸው አካላት ላይ እንዲያተኩሩ ያስችላቸዋል።
መልስ ይስጡ