Уявіце сабе свет, дзе кампутары больш дакладныя, чым людзі, у інтэрпрэтацыі візуальных дадзеных. Поля камп'ютэрнага зроку і машыннага навучання зрабілі гэтую ідэю рэальнасцю.
Камп'ютэрны зрок і машыннае навучанне - два найважнейшыя кампаненты штучнага інтэлекту. Іх часам блытаюць адзін з адным. Іх можна нават узаемазамяняць.
Аднак гэта асобныя вобласці з рознымі метадамі. У гэтым пасце мы абмяркуем кантрасты паміж камп'ютэрным зрокам і навучанне з дапамогай машыны. Далучайцеся да нас, калі мы даследуем гэтыя інтрыгуючыя падполя штучнага інтэлекту.
Чаму мы павінны рабіць гэта адрозненне?
І камп'ютэрны зрок, і машыннае навучанне з'яўляюцца найважнейшымі часткамі штучнага інтэлекту. Тым не менш, у іх розныя метадалогіі і мэты. Ведаючы адрозненні паміж імі, мы можам лепш выкарыстоўваць патэнцыял ІІ.
І мы можам выбраць правільную тэхналогію для нашых праектаў.
Давайце разгледзім іх абодвух па чарзе.
Разуменне камп'ютэрнага гледжання
Здольнасць кампутараў інтэрпрэтаваць візуальны свет вядомая як камп'ютэрны зрок. Яна ўключае ў сябе падрыхтоўку кампутараў для разумення і аналізу лічбавых малюнкаў і відэа.
Гэтая тэхналогія працуе падобна таму, як вочы і мозг працуюць у людзей. Кампутары могуць распазнаваць аб'екты, твары і ўзоры. Яны могуць здабываць дадзеныя з фатаграфій. І яны ацэньваюць дадзеныя з дапамогай алгарытмаў і мадэляў.
Некаторыя галіны, у тым ліку ахова здароўя, транспарт, забавы і бяспека, могуць атрымаць выгаду з камп'ютэрнага зроку. Напрыклад, камп'ютэрны зрок выкарыстоўваецца для кіравання беспілотнымі аўтамабілямі і дапамогі лекарам у дыягностыцы захворванняў.
Магчымасці камп'ютэрнага зроку бязмежныя. І мы толькі пачалі вывучаць іх патэнцыял.
Асноўныя задачы камп'ютэрнага зроку
Распазнаванне малюнкаў
Найважнейшай функцыяй камп'ютэрнага зроку з'яўляецца распазнаванне малюнкаў. Ён вучыць камп'ютэрныя сістэмы распазнаваць і класіфікаваць лічбавыя выявы. Гэта азначае, што кампутары здольныя аўтаматычна распазнаваць кампаненты карцінкі.
Яны могуць адрозніваць прадметы, жывёл і людзей і пазначаць іх адпаведным чынам.
У некалькіх галінах прамысловасці выкарыстоўваецца распазнаванне малюнкаў. Напрыклад, распазнаванне малюнкаў выкарыстоўваецца ў сістэмах бяспекі для ідэнтыфікацыі і адсочвання зламыснікаў. Акрамя таго, ён выкарыстоўваецца ў рэнтгенаграфіі, каб дапамагчы лекарам у дыягностыцы і лячэнні.
выяўленне аб'екта
Гэта тэхніка пошуку і распазнавання прадметаў у нерухомым або рухомым візуальным носьбіце. Прыкладанні для гэтай працы ўключаюць у сябе робатаў, аўтаномных аўтамабіляў і назірання. Напрыклад, гняздо Cam гэта сістэма хатняй бяспекі, якая папярэджвае кліентаў, калі яна выяўляе рух або гук з дапамогай выяўлення аб'ектаў.
Сегментацыя
Працэс сегментацыі выявы разбівае яе на мноства сегментаў, кожны са сваімі унікальнымі ўласцівасцямі. Праграмы для гэтай працы ўключаюць аналіз дакументаў, апрацоўку відэа і медыцынскія выявы.
Напрыклад, вядомая праграма для рэдагавання фатаграфій Adobe Photoshop выкарыстоўвае сегментацыю для ізаляцыі розных кампанентаў у выяве і прымянення розных эфектаў да кожнага элемента.
Разуменне машыннага навучання
Адзін прыклад штучны інтэлект гэта машыннае навучанне. Гэта навучанне кампутараў вучыцца на дадзеных і фармаваць прагнозы на іх аснове. Не будучы відавочна закадаваным, ён выкарыстоўвае статыстычныя мадэлі, якія дапамагаюць кампутарам лепш выконваць пэўны від дзейнасці.
Іншымі словамі, машыннае навучанне - гэта працэс навучання кампутары вучацца самастойна, прымаючы дадзеныя ў якасці кіраўніцтва.
Дадзеныя, алгарытмы і зваротная сувязь - гэта тры асноўныя кампаненты машыннага навучання. The алгарытм машыннага навучання трэба спачатку навучыцца на наборы дадзеных, каб вызначыць заканамернасці. Па-другое, алгарытм робіць прагнозы на аснове новага набору даных, выкарыстоўваючы вывучаныя шаблоны.
У рэшце рэшт, пасля атрымання зваротнай сувязі аб сваіх прагнозах, алгарытм уносіць карэктывы. І гэта павышае яго эфектыўнасць.
Асноўныя тыпы машыннага навучання
Кіраванае навучанне
Пры кантраляваным навучанні алгарытм навучаецца пазначаным наборам даных. Такім чынам, уваходы і адпаведныя выхады спалучаюцца. Навучыўшыся спалучаць уваходныя дадзеныя з выходнымі, алгарытм можа прагназаваць вынікі, выкарыстоўваючы свежыя даныя.
У такіх праграмах, як распазнаванне малюнкаў, распазнаванне гуку і апрацоўка натуральнай мовы, выкарыстоўваецца навучанне пад наглядам. Віртуальны памочнік Apple Siri, напрыклад, выкарыстоўвае навучанне пад наглядам для інтэрпрэтацыі і выканання вашых загадаў.
Навучанне без нагляду
Навучанне без кантролю - гэта падгрупа машыннага навучання. У гэтым выпадку алгарытм выкладаецца на наборы даных, у якім уваходныя і выходныя дадзеныя не спалучаюцца. Каб ствараць прагнозы, алгарытм павінен спачатку навучыцца распазнаваць заканамернасці і карэляцыі ў дадзеных.
Такія прыкладанні, як сціск даных, выяўленне анамалій і кластэрызацыя, выкарыстоўваюць навучанне без нагляду. Напрыклад, амазонка рэкамендуе тавары спажыўцам на аснове іх гісторыі пакупак і звычак прагляду з выкарыстаннем навучання без нагляду.
Падмацаванне навучання
Гэта ўключае ў сябе ўзаемадзеянне з навакольным асяроддзем і атрыманне зваротнай сувязі ў выглядзе ўзнагарод і штрафаў. Алгарытм атрымлівае магчымасць прымаць рашэнні, якія павялічваюць узнагароды і памяншаюць штрафы.
Прыкладанні для такога тыпу машыннага навучання ўключаюць робатаў, беспілотныя аўтамабілі і гульні. Напрыклад, Google DeepMind AlphaGo праграмнае забеспячэнне выкарыстоўвае навучанне з падмацаваннем, каб гуляць у гульню Go.
Сувязь паміж камп'ютэрным зрокам і машынным навучаннем
Як задачы камп'ютэрнага зроку могуць выкарыстоўваць алгарытмы машыннага навучання?
Некалькі задач камп'ютэрнага зроку, уключаючы ідэнтыфікацыю аб'ектаў і катэгарызацыю малюнкаў, выкарыстоўваюць машыннае навучанне. Распаўсюджаная форма тэхнікі машыннага навучання, якая выкарыстоўваецца згорткавыя нейронавыя сеткі (CNN).
Ён можа ідэнтыфікаваць заканамернасці і характарыстыкі на малюнках.
Так, напрыклад, Карцінкі Google выкарыстоўвае алгарытмы машыннага навучання. Ён аўтаматычна распазнае і класіфікуе фатаграфіі на аснове прысутных прадметаў і асоб.
Прымяненне камп'ютэрнага зроку і машыннага навучання ў рэальным свеце
Некалькі рэальных прыкладанняў спалучаюць камп'ютэрны зрок і машыннае навучанне. Выдатны прыклад - беспілотныя аўтамабілі. Яны вызначаюць і кантралююць рэчы на дарозе з дапамогай камп'ютэрнага зроку.
І яны выкарыстоўваюць алгарытмы машыннага навучання, каб рабіць меркаванні на аснове гэтай інфармацыі. Waymo гэта фірма па вытворчасці беспілотных аўтамабіляў, якая належыць Alphabet. Для распазнання аб'ектаў і адлюстравання ён спалучае ў сабе камп'ютэрны зрок і машыннае навучанне.
Камп'ютэрнае зрок і машыннае навучанне выкарыстоўваюцца разам і ў медыцынскай прамысловасці. Яны дапамагаюць спецыялістам вывучыць медыцынскія здымкі і паставіць дыягназ. Напрыклад, зацверджаны FDA дыягнастычны інструмент IDx-DR выкарыстоўвае машыннае навучанне для вывучэння малюнкаў сятчаткі і выяўлення дыябетычнай рэтынапатыі. Гэта захворванне, якое, калі ігнараваць, можа прывесці да слепаты.
Адрозненні паміж машынным навучаннем і камп'ютэрным зрокам
Тыпы дадзеных, якія выкарыстоўваюцца
Тыпы дадзеных, якія выкарыстоўваюць камп'ютэрнае зрок і машыннае навучанне, адрозніваюцца. Машыннае навучанне можа апрацоўваць розныя тыпы даных, уключаючы лікавыя, тэкставыя і аўдыяданыя.
Аднак кампутарны зрок канцэнтруецца толькі на візуальныя дадзеныя як фатаграфіі і відэа.
Мэты кожнага поля
Машыннае навучанне і камп'ютэрнае зрок маюць розныя мэты. Асноўныя мэты камп'ютэрнага зроку - гэта аналіз і разуменне візуальнага ўводу. Сюды таксама ўваходзяць распазнаванне аб'ектаў, адсочванне руху і аналіз малюнкаў.
Аднак алгарытмы машыннага навучання можна выкарыстоўваць для ўсіх відаў дзейнасці.
Кампутарны зрок як падмноства машыннага навучання
Хоць гэта асобная вобласць, камп'ютэрны зрок таксама разглядаецца як частка машыннага навучання.
Некалькі метадаў і рэсурсаў, якія выкарыстоўваюцца ў машынным навучанні, напрыклад глыбокае вывучэнне, нейронавыя сеткі і кластэрызацыя — таксама выкарыстоўваюцца для стварэння камп'ютэрнага зроку.
Наперадзе захапляльныя магчымасці
Патэнцыял іх перасячэння становіцца ўсё больш захапляльным. З развіццём новых тэхналогій мы можам чакаць уражлівых прыкладанняў.
Адной з сфер, дзе гэта скрыжаванне асабліва цікава, з'яўляецца робататэхніка. Камп'ютэрнае зрок і машыннае навучанне будуць гуляць важную ролю ў тым, каб дазволіць робатам арыентавацца ў складаным асяроддзі.
Яны будуць узаемадзейнічаць з прадметамі і людзьмі, калі стануць больш незалежнымі. Мы можам чакаць, што ўбачым робатаў, больш эфектыўных у розных справах.
Яшчэ адзін інтрыгуючы патэнцыял - віртуальная рэальнасць. Камп'ютарны зрок і машыннае навучанне, дзякуючы сваёй здольнасці ідэнтыфікаваць і аналізаваць візуальны ўвод, могуць дазволіць людзям больш натуральна і інтуітыўна ўзаемадзейнічаць з віртуальным асяроддзем. Мы ўбачым прыкладанні, якія дазваляюць плаўна спалучаць рэальны і віртуальны светы. Гэта адкрые новыя магчымасці для забавы, адукацыі і іншых мэтаў.
Будучыня камп'ютэрнага зроку і машыннага навучання шмат абяцае. У наступныя гады мы ўбачым яшчэ больш прыкметнае выкарыстанне гэтых даменаў.
Пакінуць каментар