Ímyndaðu þér heim þar sem tölvur eru nákvæmari en fólk í að túlka sjónræn gögn. Sviðin tölvusjón og vélanám hafa gert þessa hugmynd að veruleika.
Tölvusjón og vélanám eru tveir mikilvægir þættir gervigreindar. Þeir eru stundum ruglaðir saman. Þeir geta jafnvel verið notaðir til skiptis.
Hins vegar eru þau aðskilin svæði með mismunandi aðferðum. Í þessari færslu munum við ræða andstæðurnar milli tölvusjónar og vél nám. Vertu með okkur þegar við kannum þessi forvitnilegu gervigreind undirsvið.
Af hverju þurfum við að gera þennan greinarmun?
Bæði tölvusjón og vélanám eru mikilvægir hlutir gervigreindar. Samt hafa þeir mismunandi aðferðafræði og markmið. Með því að þekkja muninn á þeim getum við nýtt betur möguleika gervigreindar.
Og við getum valið réttu tæknina fyrir verkefnin okkar.
Við skulum fara yfir þær báðar í einu.
Að skilja tölvusjón
Geta tölva til að túlka sjónheiminn er þekkt sem tölvusjón. Það felur í sér þjálfun tölvur til að skilja og greina stafrænar myndir og myndbönd.
Þessi tækni virkar eins og hvernig augu og heili virka í mönnum. Tölvur geta þekkt hluti, andlit og mynstur. Þeir geta dregið gögn úr myndum. Og þeir meta gögnin með því að nota reiknirit og líkön.
Nokkrar atvinnugreinar, þar á meðal heilbrigðisþjónusta, samgöngur, skemmtun og öryggi, geta notið góðs af tölvusjón. Til dæmis er tölvusjón notuð til að leiðbeina ökumannslausum bílum og aðstoða lækna við að greina sjúkdóma.
Möguleikarnir með tölvusjón eru takmarkalausir. Og við erum aðeins byrjuð að kanna möguleika þeirra.
Helstu verkefni tölvusjónar
Ímyndarviðurkenning
Mikilvægt hlutverk tölvusjónar er myndgreining. Það kennir tölvukerfum hvernig á að þekkja og flokka stafrænar myndir. Þetta gefur til kynna að tölvur séu færar um að þekkja íhluti myndar sjálfkrafa.
Þeir geta greint á milli hluta, dýra og manna og merkt þá á viðeigandi hátt.
Nokkrar atvinnugreinar nota myndþekkingu. Til dæmis er myndgreining notuð í öryggiskerfum til að bera kennsl á og rekja innbrotsþjófa. Einnig er það notað í röntgenmyndatöku til að aðstoða lækna við greiningu og meðferðir.
Hlutgreining
Það er tæknin við að staðsetja og þekkja hluti á kyrrstæðum eða hreyfanlegum myndmiðli. Umsóknir um þetta starf fela í sér vélmenni, sjálfstýrða bíla og eftirlit. Til dæmis, the Nest Cam er heimilisöryggiskerfi sem gerir viðskiptavinum viðvart þegar það skynjar hreyfingu eða hljóð með því að nota hlutskynjun.
Segmentation
Ferlið við að skipta mynd er að skipta henni upp í marga hluta, hver með sína einstöku eiginleika. Umsóknir um þetta starf eru skjalagreining, myndbandsvinnsla og læknisfræðileg myndgreining.
Til dæmis, hið þekkta myndvinnsluforrit Adobe Photoshop notar skiptingu til að einangra ýmsa hluti innan myndar og beita ýmsum áhrifum á hvern þátt.
Að skilja vélanám
Eitt dæmi um gervigreind er vélanám. Það er að kenna tölvum að læra af gögnum og mynda spár byggðar á þeim gögnum. Án þess að vera sérstaklega kóðað notar það tölfræðileg líkön til að hjálpa tölvum að verða betri í tiltekinni starfsemi.
Til að orða það á annan hátt, vélanám er ferlið við þjálfun tölvur til að læra á eigin spýtur á meðan þær taka gögn að leiðarljósi.
Gögn, reiknirit og endurgjöf eru þrír meginþættir vélanáms. The vélfræðinám reiknirit verður fyrst að þjálfa á gagnasafni til að bera kennsl á mynstur. Í öðru lagi gerir reikniritið spár byggðar á nýju gagnasafni með því að nota lærð mynstur.
Að lokum, eftir að hafa fengið endurgjöf um spár sínar, gerir reikniritið breytingar. Og það eykur skilvirkni þess.
Helstu tegundir vélanáms
Umsjón nám
Í námi undir eftirliti þjálfar merkt gagnasafn reikniritið. Svo, inntak og samsvarandi úttak eru pöruð. Eftir að hafa lært að para inntak við úttak getur reikniritið spáð fyrir um niðurstöður með því að nota fersk gögn.
Forrit eins og myndgreining, hljóðþekking og náttúruleg málvinnsla nota eftirlitsnám. Sýndaraðstoðarmaður Apple Siri, til dæmis, notar kennslu undir eftirliti til að túlka og framkvæma pantanir þínar.
Ekkert eftirlit með námi
Nám án eftirlits er undirmengi vélanáms. Í þessu tilviki er reikniritið kennt á gagnasafni þar sem inntak og úttak eru ekki pöruð. Til að búa til spár þarf reikniritið fyrst að læra að þekkja mynstur og fylgni í gögnunum.
Forrit eins og gagnaþjöppun, fráviksgreining og þyrping nota eftirlitslaust nám. Til dæmis, Amazon mælir með vörum til neytenda út frá innkaupasögu þeirra og vafravenjum með því að nota nám án eftirlits.
Styrkingarnám
Það felur í sér samskipti við umhverfið og fá endurgjöf í formi verðlauna og refsinga. Reikniritið öðlast getu til að taka ákvarðanir sem auka umbun og lækka refsingar.
Forrit fyrir þessa tegund vélanáms eru vélmenni, sjálfkeyrandi bíla og leikir. Til dæmis, Google DeepMind AlphaGo hugbúnaður notar styrkingarnám til að spila leikinn Go.
Tengsl tölvusjónar og vélanáms
Hvernig tölvusjónverkefni geta notað reiknirit fyrir vélanám?
Nokkur tölvusjónverkefni, þar á meðal hlutgreining og myndflokkun, nota vélanám. Algeng form vélanámstækni sem er notuð er snúnings tauganet (CNN).
Það getur greint mynstur og einkenni í myndum.
Til dæmis, Google myndir notar reiknirit vélanáms. Það þekkir sjálfkrafa og flokkar ljósmyndir út frá hlutum og einstaklingum sem eru til staðar.
Notkun tölvusjónar og vélanáms í hinum raunverulega heimi
Nokkur raunveruleg forrit sameina tölvusjón og vélanám. Gott dæmi eru sjálfkeyrandi bílar. Þeir bera kennsl á og fylgjast með hlutum á veginum með tölvusjón.
Og þeir nota vélræna reiknirit til að dæma út frá þeim upplýsingum. Waymo er sjálfkeyrandi bílafyrirtæki í eigu Alphabet. Fyrir hlutgreiningu og kortlagningu sameinar það bæði tölvusjón og vélanám.
Tölvusjón og vélanám eru einnig notuð saman í læknaiðnaðinum. Þeir aðstoða fagfólk við að skoða læknismyndir og aðstoða við greiningu. Til dæmis notar FDA-samþykkt greiningartæki IDx-DR vélanám til að skoða myndir af sjónhimnu og finna sjónhimnukvilla af völdum sykursýki. Það er skilyrði sem getur leitt til blindu ef það er hunsað.
Munur á vélanámi og tölvusjón
Tegundir gagna sem notuð eru
Mismunandi er hvaða gögn tölvusjón og vélanám nota. Vélnám getur séð um ýmsar gagnategundir, þar á meðal töluleg, texta- og hljóðgögn.
Hins vegar einbeitir tölvusjón aðeins að sjónræn gögn eins og myndir og myndbönd.
Markmið hvers sviðs
Vélnám og tölvusjón hafa ýmis markmið. Meginmarkmið tölvusjónar eru að greina og skilja sjónrænt inntak. Þetta felur einnig í sér hlutgreiningu, hreyfirakningu og myndgreiningu.
Hins vegar er hægt að nota vélræna reiknirit fyrir alls kyns athafnir.
Tölvusjón sem undirmengi vélanáms
Þó að það sé sérstakt svæði er líka litið á tölvusjón sem hluta af vélanámi.
Nokkrar af þeim aðferðum og úrræðum sem notaðar eru í vélanámi — svo sem djúpt nám, tauganet og þyrping – eru einnig notuð til að búa til tölvusjón.
Spennandi möguleikar framundan
Möguleikarnir á gatnamótum þeirra verða sífellt meira heillandi. Með framþróun nýrrar tækni getum við búist við að sjá stórkostleg forrit.
Eitt svið þar sem þessi gatnamót eru sérstaklega áhugaverð er vélfærafræði. Tölvusjón og vélanám munu gegna mikilvægu hlutverki við að gera vélmenni kleift að sigla um flókið umhverfi.
Þeir munu hafa samskipti við hluti og menn eftir því sem þeir verða sjálfstæðari. Við getum búist við að sjá vélmenni sem eru skilvirkari í ýmsum húsverkum.
Annar forvitnilegur möguleiki er sýndarveruleiki. Tölvusjón og vélanám, með getu þeirra til að bera kennsl á og greina sjónrænt inntak, geta gert mönnum kleift að taka þátt í sýndarumhverfi á náttúrulegri og innsæilegri hátt. Við munum sjá forrit sem gera okkur kleift að sameina raunverulegan og sýndarheiminn vel. Það mun gefa upp nýja möguleika til skemmtunar, fræðslu og annarra nota.
Framtíð tölvusjónar og vélanáms lofar miklu. Við munum sjá enn merkilegri notkun þessara léna á næstu árum.
Skildu eftir skilaboð