Efnisyfirlit[Fela][Sýna]
Það er ekki nýtt að hafa falsaðar myndir og myndbönd. Frá víðtækri notkun internetsins hafa einstaklingar verið að búa til fölsun sem ætlað er að blekkja eða skemmta allt frá því að myndir og kvikmyndir hafa verið til.
Hins vegar er til ný tegund af vélaframleiddum falsunum sem gætu einhvern tíma gert okkur erfitt fyrir að greina raunveruleikann frá skáldskapnum.
Þessar falsanir eru frábrugðnar einföldum myndumsjónum sem myndast með klippihugbúnaði eins og Photoshop eða snjallum kvikmyndum fyrri tíma.
Djúpfalsar eru þekktasta dæmið um „gervimiðla“ - myndir, hljóð og myndbönd sem virðast hafa verið framleidd með hefðbundnum aðferðum en voru í raun unnin með háþróuðum hugbúnaði.
Djúpfalsar hafa verið til í nokkurn tíma og þó að vinsælasta forritið þeirra hingað til hafi verið að setja höfuð fræga fólksins á líkama leikara í klámmyndum, þá hafa þeir getu til að framleiða sannfærandi myndefni af hverjum sem er að gera hvað sem er, hvar sem er.
Í þessari færslu munum við skoða Deepfakes, hvernig það virkar, hvernig þú getur búið þá til á eigin spýtur og margt fleira.
Svo, hvað er DeepFake?
Djúpfölsun—sambland af setningunum djúpt nám og falsað—er hluti af gervimiðlar þar sem líking annarrar manneskju er notuð í stað manns á ljósmynd eða myndbandi sem þegar er til.
Deepfakes notar háþróaða vélanám og gervigreindartækni til að breyta og búa til sjón- og hljóðupplýsingar sem hafa mikla möguleika á blekkingum.
Djúpnámsaðferðir eins og sjálfkóðarar og skapandi andstæðinganet eru aðalbúnaðurinn fyrir djúpfalsunarframleiðslu (GAN).
Þessi líkön eru notuð til að greina andlitstilfinningar og hreyfingar einstaklings og búa til andlitsmyndir af öðru fólki sem sýnir sambærilega svipbrigði og hreyfingar.
Notkun djúpfalsa í klámmyndböndum fræga fólksins, falsfrétta, gabbs og fjármálasvika hefur vakið töluverða athygli. Bæði iðnaður og stjórnvöld hafa brugðist við með því að reyna að finna þá og takmarka notkun þeirra.
First Order Motion Model
Þegar reynt var að þróa djúpar falsanir í fortíðinni var málið að við þurfum einhvers konar auka þekkingu, eða formenn, til að þessar aðferðir virki.
Til dæmis er þörf á andlitsmerkjum ef við viljum rekja hreyfingar höfuðsins. Nauðsynlegt var að meta líkamsstöðu ef við vildum kortleggja hreyfingu alls líkamans.
Það breyttist á NeurIPS ráðstefnunni í fyrra þegar rannsóknarhópurinn frá háskólanum í Toronto kynnti vinnu sína, "First Order Motion Model fyrir myndhreyfingar. "
Engin frekari þekking á hreyfimyndum er nauðsynleg fyrir þessa nálgun. Að auki, eftir að þetta líkan hefur verið þjálfað, er hægt að nota það til yfirfærslunáms og nota það á hvaða atriði sem falla undir sama flokk.
Við skulum skoða virkni þessarar aðferðar aðeins nánar. Motion Extraction og Generation mynda fyrri helminginn af öllu ferlinu. Akstursmyndbandið og upprunamyndirnar eru notaðar sem inntak.
Til að draga út fyrstu gráðu hreyfimynd, sem samanstendur af fáum lykilpunktum og staðbundnum skyldumbreytingum, notar hreyfiútdráttur sjálfvirkan kóða til að bera kennsl á lykilpunkta.
Til að búa til þétt sjónflæði og lokunarkort með þéttu hreyfinetinu eru þau notuð ásamt akstursmyndbandi. Rafallinn framleiðir síðan markmyndina með því að nota úttak frá þéttu hreyfinetinu og upprunamyndinni.
Á heildina litið skilar þetta verk sig betur en hið nýjasta. Það inniheldur líka eiginleika sem aðrar gerðir hafa bara ekki. Það virkar á nokkrar myndagerðir, svo þú getur notað það á myndir af andliti, líkama, teiknimyndum o.s.frv., sem er einstaklega frábært.
Mörg ný tækifæri skapast við þetta. Annar byltingarkenndur þáttur stefnu okkar er að hún gerir þér nú kleift að framleiða hágæða Deepfakes með því að nota aðeins eina mynd af markhlutnum, svipað og við gerum með YOLO fyrir hlut viðurkenningu.
Aðferð við að búa til Deepfake líkan
Þrír ferli eru nauðsynlegir fyrir djúpfalsaða kynslóð: útdráttur, þjálfun og sköpun. Farið verður yfir helstu atriði hvers þessara þrepa og hvernig þau tengjast heildarferlinu í þessum kafla.
Útdráttur
Deepfakes nota djúp tauganet til að skipta um andlit og þurfa mikið af gögnum (myndum) til að starfa rétt og sannfærandi. Útdráttarferlið er stigið þar sem allir rammar úr myndskeiðum eru dregnir út, andlitin eru þekkt og andlitin síðan stillt saman til að hámarka frammistöðu.
Þjálfun
Í þjálfunarstiginu er tauga net getur breytt einu andliti í annað. Það fer eftir stærð æfingasettsins og æfingagræjunnar, þjálfunin getur tekið nokkrar klukkustundir eða jafnvel daga.
Þjálfunin þarf bara að ljúka einu sinni, eins og flest önnur tauganetþjálfun. Eftir þjálfun myndi fyrirsætan geta breytt andliti frá einstaklingi A í einstakling B.
Creation
Eftir að líkanið hefur verið þjálfað gæti djúpfals verið framleidd. Rammar eru teknir úr myndbandi og síðan stilltir saman við öll andlit. Þjálfað tauganet er síðan notað til að umbreyta hverjum ramma.
Umbreytta andlitið verður að sameinast upprunalega rammanum sem síðasta skrefið.
Byggja Deepfake uppgötvunarlíkan
Uppsetning og klónun GitHub Repo
Það er hagkvæmt að geta notað Google GPU ókeypis á meðan þú vinnur hjá Colab djúpt nám. Annar kostur er möguleiki á að setja upp Google Drive á sýndarvél í skýi (VM).
Með greiðan aðgang að öllu dótinu sínu er notandinn virkur. Forritið sem þarf til að tengja Google Drive við sýndarvélina í skýinu er að finna í þessum hluta.
Flytja inn einingar
Nú munum við flytja inn allar nauðsynlegar einingar.
Að framkvæma líkanið
Við munum nota dæmi sem sameinar kyrrmynd af Pútín (upprunamynd) og myndbandi af Obama. Niðurstaðan er myndband af Pútín tala og handakast með nákvæmlega sömu svipbrigðum og Obama notaði við akstur.
Áður en niðurstöður líkansins eru sýndar verður miðillinn hlaðinn og aðgerðunum lýst yfir. Þá verða eftirlitsstöðvar hlaðnar og líkanið smíðað. Eftir að hafa búið til djúpa falsann munu tveir mismunandi stíll hreyfimynda birtast.
Pútín er líflegur af hreyfingum Obama sem notar hlutfallslegan tilfærslu lykilpunkta. Hvernig andlitstilfinningum og líkamstjáningu Obama er lýst fallega og skýrt fyrir Pútín á myndböndum hans er ótrúlegt.
Það eru nokkur smásæ mistök, sérstaklega þegar Obama lyftir augabrúnum og blikkar augunum. Þessi orðatiltæki eru ekki nákvæmlega endurtekin í ramma Pútíns.
Án djúpfalsaðs bakgrunns myndi Pútín myndin virðast vera nokkuð trúverðug og ekta ef hún væri skoðuð í sjónvarpi eða félagslega fjölmiðla.
Módelgerð
Nú munum við nota fyrirfram þjálfuðu eftirlitsstöðvarnar til að búa til fullkomið líkan.
Deepfake uppgötvun
Hlutfallsleg tilfærsla lyklapunkts er notuð til að lífga hlutina í reitnum fyrir neðan. Næsta hólf notar í staðinn algild hnit, en öll hlutföll verða tekin úr akstursmyndbandinu á þennan hátt.
Auka framleiðslu með því að nota alger hnit
Þú munt geta þróað deepfake uppgötvun á þennan hátt.
Hver er áhættan af Deepfake tækni?
Deepfake myndbönd eru nú grípandi og skemmtileg að horfa á vegna nýjungarinnar. Hins vegar er hætta á að það fari úr böndunum undir yfirborði þessarar að því er virðist fyndna tækni.
Það verður vissulega krefjandi að greina á milli fölsuðra og raunverulegra myndbanda sem djúp falsa tækni heldur áfram að sækja fram. Fyrir áberandi persónuleika og frægt fólk, sérstaklega, gæti þetta haft alvarleg áhrif. Djúpfalsar sem eru viljandi illgjarnir geta skaðað feril og líf algjörlega.
Þetta gæti verið notað af einhverjum með illgjarn ásetning til að fara framhjá öðrum og nýta vini sína, ættingja og vinnufélaga. Þeir eru líka færir um að kveikja deilur um allan heim og jafnvel stríð með því að nota svikamyndir af erlendum leiðtogum.
Niðurstaða
Í stuttu máli erum við í undarlegu tímabili og óvenjulegu umhverfi. Meira en nokkru sinni fyrr er einfalt að framleiða rangar fréttir og kvikmyndir og dreifa þeim. Það verður sífellt erfiðara að skilja hvað er satt og hvað ekki.
Í dag, að því er virðist, getum við ekki lengur treyst á okkar eigin skilningarvit.
Þrátt fyrir að falsmyndaskynjarar hafi verið þróaðir er aðeins tímaspursmál hvenær upplýsingabilið verði svo mjótt að jafnvel fínustu falsskynjarar geti ekki ákvarðað hvort myndbandið sé raunverulegt eða ekki.
Skildu eftir skilaboð