Pythonдо Tensorflow & Keras менен терең үйрөнүү сүрөттөрүнүн классификациясы

Мазмуну[Жашыруу][Көрсөтүү]

Сүрөттүн классификациясы деген эмне?
Сүрөт классификациясы кандай иштейт?
Питондо Tensorflow жана Keras аркылуу сүрөт классификациясы+-
жыйынтыктоо

Биз роботторго үлгү аркылуу үйрөнүү жана алардын айланасын кабыл алуу үчүн тубаса жөндөмдөрүбүз менен сугарылганыбызды билүү бизди бекемдейт. Негизги көйгөй - компьютерлерди "көрүүгө" үйрөткөндөр, адамдар көбүрөөк убакыт жана күч-аракетти талап кылат.

Бирок, биз бул шык азыркы учурда уюмдарга жана ишканаларга берип жаткан практикалык баалуулугун эске алганда, аракет актайт. Бул макалада сиз сүрөттөрдү классификациялоо, ал кантип иштейт жана аны практикалык ишке ашыруу жөнүндө биле аласыз. баштайлы.

Сүрөттүн классификациясы деген эмне?

бир сүрөттү азыктандыруу иши нейрон тармак жана анын ошол сүрөт үчүн кандайдыр бир этикетка чыгаруусу сүрөттү таануу деп аталат. Тармактын чыгаруу энбелгиси алдын ала аныкталган класска туура келет.

Сүрөткө көп сандаган класстар же бир гана класстар дайындалышы мүмкүн. Бир гана класс болгондо "таануу" термини көп колдонулат, ал эми бир нече класстар болгондо "классификация" термини көп колдонулат.

Объектти аныктоо сүрөттөр классификациясынын чакан жыйындысы, анда объекттердин айрым учурлары жаныбарлар, транспорт каражаттары же адамдар сыяктуу берилген класска таандык экендиги аныкталган.

Сүрөт классификациясы кандай иштейт?

Пиксел түрүндөгү сүрөт компьютер тарабынан талданат. Ал муну сүрөттү матрицалардын жыйындысы катары кароо аркылуу ишке ашырат, алардын өлчөмү сүрөттүн чечилиши менен аныкталат. Жөнөкөй сөз менен айтканда, сүрөттөрдү классификациялоо бул компьютердин көз карашынан алгоритмдерди колдонуу менен статистикалык маалыматтарды изилдөө.

Сүрөттөрдү классификациялоо пикселдерди алдын ала аныкталган топторго же “класстарга” топтоо аркылуу санариптик сүрөттөрдү иштетүүдө ишке ашат. Алгоритмдер сүрөттү көңүлгө аларлык мүнөздөмөлөрдүн катарына бөлөт, бул акыркы классификатордун жүгүн азайтат.

Бул сапаттар классификаторго сүрөттүн мааниси жана потенциалдуу классификациясы жөнүндө маалымат берет. Сүрөттү классификациялоодо калган процесстер ага көз каранды болгондуктан, мүнөздүү экстракция ыкмасы эң критикалык фаза болуп саналат.

The маалыматтар берилген Алгоритмдин сүрөтүн классификациялоодо, өзгөчө көзөмөлдөнгөн классификацияда да абдан маанилүү. Класс жана төмөн сүрөт жана аннотация сапатына негизделген берилиштер дисбаланс менен коркунучтуу маалымат топтомуна салыштырмалуу, жакшы оптималдаштырылган классификация маалымат топтому кереметтүү аткарат.

Питондо Tensorflow жана Keras аркылуу сүрөт классификациясы

Биз колдонобуз CIFAR-10 маалымат топтому (анын ичинде учактар, учактар, канаттуулар жана башка 7 нерсе бар).

1. Орнотуу талаптары

Төмөндөгү код бардык шарттарды орнотот.

Орнотуу талаптары 1

2. Көз карандылыкты импорттоо

Pythonдо train.py файлын жасаңыз. Төмөнкү код Tensorflow жана Keras көз карандылыгын импорттойт.

Көз карандылыкты импорттоо 1

3. Параметрлерди инициализациялоо

CIFAR-10 болгону 10 сүрөт категориясын камтыйт, демек, сан класстар жөн гана классификациялоо үчүн категориялардын санын билдирет.

Параметрлерди баштоо

4. Берилиштер топтомун жүктөө

Функция берилиштер топтомун жүктөө үчүн Tensorflow Datasets модулун колдонот жана ал жөнүндө бир аз маалымат алуу үчүн маалымат менен True деп койдук. Кандай талаалар жана алардын баалуулуктары бар экенин көрүү үчүн аны басып чыгарсаңыз болот, биз маалыматты окутуу жана сыноо топтомдорундагы үлгүлөрдүн санын алуу үчүн колдонобуз.

5. Моделди түзүү

Эми биз үч катмарды курабыз, алардын ар бири эки ConvNets максимум топтоо жана ReLU активдештирүү функциясы менен, андан кийин толук туташтырылган 1024 бирдик тутумунан турат. Заманбап моделдер болгон ResNet50 же Xception менен салыштырганда, бул салыштырмалуу кичинекей модель болушу мүмкүн.

Моделди түзүү 1

6. Моделди үйрөтүү

Мен ар бир доордогу тактыкты жана жоготууну өлчөө үчүн Tensorboard колдондум жана маалыматтарды импорттоодон жана моделди жараткандан кийин бизге жагымдуу дисплейди тартууладым. Төмөнкү кодду иштетиңиз; сиздин CPU/GPU жараша, окутуу бир нече мүнөт талап кылынат.

Моделди окутуу

Тензорбордду колдонуу үчүн терминалга же учурдагы каталогдогу буйрук сабына төмөнкү буйрукту териңиз:

Тензор тактасы 1

Сиз валидация жоготуулары азайып, тактык 81% га чейин өсүп жатканын көрөсүз. Бул укмуш!

Текшерүүнүн тактыгы

Валидациялык жоготуу

моделди тестирлөө

Тренинг аяктагандан кийин, акыркы үлгү жана салмактар жыйынтыктар папкасында сакталып, бизге бир жолу машыгып, каалаган убакта болжолдоолорду жасоого мүмкүндүк берет. Test.py деп аталган жаңы питон файлындагы кодду аткарыңыз.

7. Сыноо үчүн коммуналдык кызматтарды импорттоо

Сыноо үчүн керектүү утилиталарды импорттоо

8. Питон каталогун түзүү

Ар бир бүтүн маанини берилиштер топтомунун тиешелүү энбелгисине которгон Python сөздүгүн түзүңүз:

Python каталогун түзүү 1

9. Сыноо маалыматтары жана модели жүктөлүүдө

Төмөнкү код сыноо маалыматтарын жана моделин жүктөйт.

10. Баалоо жана болжолдоо

Төмөнкү код баканын сүрөттөрүнө баа берип, болжолдоолорду жасайт.

Баалоо болжолу 1

11. Жыйынтыгы

Модель баканы 80.62% тактык менен алдын ала айткан.

натыйжалары

жыйынтыктоо

Макул, бул сабакты бүтүрдүк. Кичинекей CNN үчүн 80.62% жакшы болбосо да, мен сизге моделди өзгөртүүнү же ResNet50, Xception же башка алдыңкы үлгүлөрдү карап чыгууну сунуштайм.

Эми сиз Керастын биринчи сүрөт таануу тармагыңызды курганыңыздан кийин, ар кандай параметрлер анын иштешине кандай таасир этээрин билүү үчүн модель менен эксперимент жасашыңыз керек.

Pythonдо Tensorflow & Keras менен терең үйрөнүү сүрөттөрүнүн классификациясы

Сүрөттүн классификациясы деген эмне?

Сүрөт классификациясы кандай иштейт?