Содржина[Крие][Прикажи]
- Што е класификација на слики?
- Како функционира класификацијата на слики?
Класификација на слики користејќи Tensorflow и Keras во питон+-
- 1. Барања за инсталирање
- 2. Увоз на зависности
- 3. Иницијализирање на параметри
- 4. Се вчитува базата на податоци
- 5. Креирање на моделот
- 6. Тренирање на моделот
- Тестирање на моделот
- 7. Увоз на комуналии за тестирање
- 8. Изработка на пајтон директориум
- 9. Вчитување на тест податоци и модел
- 10. Евалуација и предвидување
- 11. Резултати
- Заклучок
Уверливо е да се знае дека успеавме да ги надополниме роботите со нашите вродени способности да учат со пример и да ја согледаат нивната околина. Основниот предизвик е оние што ги учат компјутерите да „гледаат“ како што на луѓето ќе им треба многу повеќе време и напор.
Меѓутоа, кога ќе ја земеме предвид практичната вредност што оваа вештина моментално им ја дава на организациите и претпријатијата, трудот е исплатлив. Во оваа статија, ќе научите за класификацијата на слики, како таа функционира и нејзината практична имплементација. Да почнеме.
Што е класификација на слики?
Работата да се храни слика во а невронска мрежа а тоа да дава некаква форма на ознака за таа слика е познато како препознавање слика. Излезната ознака на мрежата ќе одговара на однапред дефинирана класа.
Може да има многу часови доделени на сликата, или едноставно една. Кога има само една класа, терминот „препознавање“ често се користи, додека кога има повеќе класи, често се користи терминот „класификација“.
Откривање на предмети е подмножество на класификација на слики во која се откриваат одредени примери на објекти како што припаѓаат на дадена класа како што се животни, возила или луѓе.
Како функционира класификацијата на слики?
Сликата во форма на пиксели се анализира со компјутер. Тоа го постигнува со третирање на сликата како збирка од матрици, чија големина се одредува според резолуцијата на сликата. Едноставно кажано, класификација на слики е проучување на статистички податоци со користење на алгоритми од перспектива на компјутер.
Класификацијата на сликите се постигнува во дигиталната обработка на слики со групирање на пиксели во однапред одредени групи или „класи“. Алгоритмите ја делат сликата на низа значајни карактеристики, што го намалува товарот за конечниот класификатор.
Овие квалитети го информираат класификаторот за значењето на сликата и за потенцијалната класификација. Бидејќи остатокот од процесите во класифицирањето на сликата зависат од него, карактеристичниот метод на екстракција е најкритичната фаза.
на обезбедени податоци за алгоритмот е исто така клучен во класификацијата на сликите, особено надгледуваната класификација. Во споредба со страшна база на податоци со нерамнотежа на податоци заснована на класа и низок квалитет на сликата и прибелешките, добро оптимизираната база на податоци за класификација функционира восхитувачки.
Класификација на слики користејќи Tensorflow и Keras во питон
Ќе го користиме ЦИФАР-10 база на податоци (која вклучува авиони, авиони, птици и други 7 работи).
1. Барања за инсталирање
Кодот подолу ќе ги инсталира сите предуслови.
2. Увоз на зависности
Направете датотека train.py во Python. Кодот подолу ќе ги увезе зависностите на Tensorflow и Keras.
3. Иницијализирање на параметри
CIFAR-10 вклучува само 10 категории на слики, па оттука бројните класи едноставно се однесуваат на бројот на категории што треба да се класифицираат.
4. Се вчитува базата на податоци
Функцијата го користи модулот Tensorflow Datasets за да ја вчита базата на податоци, а ние поставивме информации на True за да добиеме некои информации за тоа. Можете да го испечатите за да видите кои се полињата и нивните вредности, а ние ќе ги користиме информациите за да го вратиме бројот на примероци во комплетите за обука и тестирање.
5. Креирање на моделот
Сега ќе изградиме три слоја, секој составен од две ConvNets со функција за макс-здружување и активирање ReLU, проследено со целосно поврзан систем од 1024 единици. Во споредба со ResNet50 или Xception, кои се најсовремени модели, ова може да биде релативно мал модел.
6. Тренирање на моделот
Го користев Tensorboard за мерење на точноста и загубата во секоја епоха и ни обезбедив прекрасен приказ по увозот на податоците и генерирањето на моделот. Стартувај го следниов код; во зависност од вашиот процесор/ГПУ, обуката ќе трае неколку минути.
За да користите tensorboard, само напишете ја следнава команда во терминалот или командната линија во тековниот директориум:
Ќе видите дека загубата на валидација се намалува, а точноста се зголемува на околу 81%. Тоа е фантастично!
Тестирање на моделот
Кога ќе заврши обуката, конечниот модел и тежините се зачувуваат во папката со резултати, што ни овозможува да тренираме еднаш и да правиме предвидувања кога и да избереме. Следете го кодот во новата датотека со python наречена test.py.
7. Увоз на комуналии за тестирање
8. Изработка на пајтон директориум
Направете речник на Python кој ја преведува секоја цел број вредност на соодветната ознака на базата на податоци:
9. Вчитување на тест податоци и модел
Следниот код ќе ги вчита податоците од тестот и моделот.
10. Евалуација и предвидување
Следниот код ќе ги процени и прави предвидувањата на сликите од жаба.
11. Резултати
Моделот ја предвиде жабата со 80.62% точност.
Заклучок
Добро, завршивме со оваа лекција. Иако 80.62% не е добро за малку CNN, силно ве советувам да го промените моделот или да погледнете во ResNet50, Xception или други најсовремени модели за подобри резултати.
Сега кога ја изградивте вашата прва мрежа за препознавање слики во Керас, треба да експериментирате со моделот за да откриете како различните параметри влијаат на неговите перформанси.
Оставете Одговор