DeepFake uppgötvun með vélanámi og Python

Efnisyfirlit[Fela][Sýna]

Svo, hvað er DeepFake?
First Order Motion Model
Aðferð við að búa til Deepfake líkan+-
Byggja Deepfake uppgötvunarlíkan+-
Hver er áhættan af Deepfake tækni?
Niðurstaða

Það er ekki nýtt að hafa falsaðar myndir og myndbönd. Frá víðtækri notkun internetsins hafa einstaklingar verið að búa til fölsun sem ætlað er að blekkja eða skemmta allt frá því að myndir og kvikmyndir hafa verið til.

Hins vegar er til ný tegund af vélaframleiddum falsunum sem gætu einhvern tíma gert okkur erfitt fyrir að greina raunveruleikann frá skáldskapnum.

Þessar falsanir eru frábrugðnar einföldum myndumsjónum sem myndast með klippihugbúnaði eins og Photoshop eða snjallum kvikmyndum fyrri tíma.

Djúpfalsar eru þekktasta dæmið um „gervimiðla“ - myndir, hljóð og myndbönd sem virðast hafa verið framleidd með hefðbundnum aðferðum en voru í raun unnin með háþróuðum hugbúnaði.

Djúpfalsar hafa verið til í nokkurn tíma og þó að vinsælasta forritið þeirra hingað til hafi verið að setja höfuð fræga fólksins á líkama leikara í klámmyndum, þá hafa þeir getu til að framleiða sannfærandi myndefni af hverjum sem er að gera hvað sem er, hvar sem er.

Í þessari færslu munum við skoða Deepfakes, hvernig það virkar, hvernig þú getur búið þá til á eigin spýtur og margt fleira.

Svo, hvað er DeepFake?

Djúpfölsun—sambland af setningunum djúpt nám og falsað—er hluti af gervimiðlar þar sem líking annarrar manneskju er notuð í stað manns á ljósmynd eða myndbandi sem þegar er til.

Deepfakes notar háþróaða vélanám og gervigreindartækni til að breyta og búa til sjón- og hljóðupplýsingar sem hafa mikla möguleika á blekkingum.

Djúpnámsaðferðir eins og sjálfkóðarar og skapandi andstæðinganet eru aðalbúnaðurinn fyrir djúpfalsunarframleiðslu (GAN).

Þessi líkön eru notuð til að greina andlitstilfinningar og hreyfingar einstaklings og búa til andlitsmyndir af öðru fólki sem sýnir sambærilega svipbrigði og hreyfingar.

Notkun djúpfalsa í klámmyndböndum fræga fólksins, falsfrétta, gabbs og fjármálasvika hefur vakið töluverða athygli. Bæði iðnaður og stjórnvöld hafa brugðist við með því að reyna að finna þá og takmarka notkun þeirra.

First Order Motion Model

Þegar reynt var að þróa djúpar falsanir í fortíðinni var málið að við þurfum einhvers konar auka þekkingu, eða formenn, til að þessar aðferðir virki.

Til dæmis er þörf á andlitsmerkjum ef við viljum rekja hreyfingar höfuðsins. Nauðsynlegt var að meta líkamsstöðu ef við vildum kortleggja hreyfingu alls líkamans.

Það breyttist á NeurIPS ráðstefnunni í fyrra þegar rannsóknarhópurinn frá háskólanum í Toronto kynnti vinnu sína, "First Order Motion Model fyrir myndhreyfingar. "

Engin frekari þekking á hreyfimyndum er nauðsynleg fyrir þessa nálgun. Að auki, eftir að þetta líkan hefur verið þjálfað, er hægt að nota það til yfirfærslunáms og nota það á hvaða atriði sem falla undir sama flokk.

Við skulum skoða virkni þessarar aðferðar aðeins nánar. Motion Extraction og Generation mynda fyrri helminginn af öllu ferlinu. Akstursmyndbandið og upprunamyndirnar eru notaðar sem inntak.

First Order Motion Model í gangi

Til að draga út fyrstu gráðu hreyfimynd, sem samanstendur af fáum lykilpunktum og staðbundnum skyldumbreytingum, notar hreyfiútdráttur sjálfvirkan kóða til að bera kennsl á lykilpunkta.

Til að búa til þétt sjónflæði og lokunarkort með þéttu hreyfinetinu eru þau notuð ásamt akstursmyndbandi. Rafallinn framleiðir síðan markmyndina með því að nota úttak frá þéttu hreyfinetinu og upprunamyndinni.

Á heildina litið skilar þetta verk sig betur en hið nýjasta. Það inniheldur líka eiginleika sem aðrar gerðir hafa bara ekki. Það virkar á nokkrar myndagerðir, svo þú getur notað það á myndir af andliti, líkama, teiknimyndum o.s.frv., sem er einstaklega frábært.

Mörg ný tækifæri skapast við þetta. Annar byltingarkenndur þáttur stefnu okkar er að hún gerir þér nú kleift að framleiða hágæða Deepfakes með því að nota aðeins eina mynd af markhlutnum, svipað og við gerum með YOLO fyrir hlut viðurkenningu.

Aðferð við að búa til Deepfake líkan

Þrír ferli eru nauðsynlegir fyrir djúpfalsaða kynslóð: útdráttur, þjálfun og sköpun. Farið verður yfir helstu atriði hvers þessara þrepa og hvernig þau tengjast heildarferlinu í þessum kafla.

Útdráttur

Deepfakes nota djúp tauganet til að skipta um andlit og þurfa mikið af gögnum (myndum) til að starfa rétt og sannfærandi. Útdráttarferlið er stigið þar sem allir rammar úr myndskeiðum eru dregnir út, andlitin eru þekkt og andlitin síðan stillt saman til að hámarka frammistöðu.

Þjálfun

Í þjálfunarstiginu er tauga net getur breytt einu andliti í annað. Það fer eftir stærð æfingasettsins og æfingagræjunnar, þjálfunin getur tekið nokkrar klukkustundir eða jafnvel daga.

Þjálfunin þarf bara að ljúka einu sinni, eins og flest önnur tauganetþjálfun. Eftir þjálfun myndi fyrirsætan geta breytt andliti frá einstaklingi A í einstakling B.

Creation

Eftir að líkanið hefur verið þjálfað gæti djúpfals verið framleidd. Rammar eru teknir úr myndbandi og síðan stilltir saman við öll andlit. Þjálfað tauganet er síðan notað til að umbreyta hverjum ramma.

Umbreytta andlitið verður að sameinast upprunalega rammanum sem síðasta skrefið.

Byggja Deepfake uppgötvunarlíkan

Uppsetning og klónun GitHub Repo

Það er hagkvæmt að geta notað Google GPU ókeypis á meðan þú vinnur hjá Colab djúpt nám. Annar kostur er möguleiki á að setja upp Google Drive á sýndarvél í skýi (VM).

Með greiðan aðgang að öllu dótinu sínu er notandinn virkur. Forritið sem þarf til að tengja Google Drive við sýndarvélina í skýinu er að finna í þessum hluta.

Github fjall

Klónun The Repo

Að búa til möppu

Flytja inn einingar

Nú munum við flytja inn allar nauðsynlegar einingar.

Flytja inn einingar

Að framkvæma líkanið

Við munum nota dæmi sem sameinar kyrrmynd af Pútín (upprunamynd) og myndbandi af Obama. Niðurstaðan er myndband af Pútín tala og handakast með nákvæmlega sömu svipbrigðum og Obama notaði við akstur.

Áður en niðurstöður líkansins eru sýndar verður miðillinn hlaðinn og aðgerðunum lýst yfir. Þá verða eftirlitsstöðvar hlaðnar og líkanið smíðað. Eftir að hafa búið til djúpa falsann munu tveir mismunandi stíll hreyfimynda birtast.

Sameina og breyta stærð myndar og myndbands

Pútín er líflegur af hreyfingum Obama sem notar hlutfallslegan tilfærslu lykilpunkta. Hvernig andlitstilfinningum og líkamstjáningu Obama er lýst fallega og skýrt fyrir Pútín á myndböndum hans er ótrúlegt.

Það eru nokkur smásæ mistök, sérstaklega þegar Obama lyftir augabrúnum og blikkar augunum. Þessi orðatiltæki eru ekki nákvæmlega endurtekin í ramma Pútíns.

Án djúpfalsaðs bakgrunns myndi Pútín myndin virðast vera nokkuð trúverðug og ekta ef hún væri skoðuð í sjónvarpi eða félagslega fjölmiðla.

Módelgerð

Nú munum við nota fyrirfram þjálfuðu eftirlitsstöðvarnar til að búa til fullkomið líkan.

Módelsköpun

Deepfake uppgötvun

Hlutfallsleg tilfærsla lyklapunkts er notuð til að lífga hlutina í reitnum fyrir neðan. Næsta hólf notar í staðinn algild hnit, en öll hlutföll verða tekin úr akstursmyndbandinu á þennan hátt.

Deepfake uppgötvun

Auka framleiðslu með því að nota alger hnit

Auka afköst með því að nota Absolute Coordinated

Þú munt geta þróað deepfake uppgötvun á þennan hátt.

Hver er áhættan af Deepfake tækni?

Deepfake myndbönd eru nú grípandi og skemmtileg að horfa á vegna nýjungarinnar. Hins vegar er hætta á að það fari úr böndunum undir yfirborði þessarar að því er virðist fyndna tækni.

Það verður vissulega krefjandi að greina á milli fölsuðra og raunverulegra myndbanda sem djúp falsa tækni heldur áfram að sækja fram. Fyrir áberandi persónuleika og frægt fólk, sérstaklega, gæti þetta haft alvarleg áhrif. Djúpfalsar sem eru viljandi illgjarnir geta skaðað feril og líf algjörlega.

Þetta gæti verið notað af einhverjum með illgjarn ásetning til að fara framhjá öðrum og nýta vini sína, ættingja og vinnufélaga. Þeir eru líka færir um að kveikja deilur um allan heim og jafnvel stríð með því að nota svikamyndir af erlendum leiðtogum.

Niðurstaða

Í stuttu máli erum við í undarlegu tímabili og óvenjulegu umhverfi. Meira en nokkru sinni fyrr er einfalt að framleiða rangar fréttir og kvikmyndir og dreifa þeim. Það verður sífellt erfiðara að skilja hvað er satt og hvað ekki.

Í dag, að því er virðist, getum við ekki lengur treyst á okkar eigin skilningarvit.

Þrátt fyrir að falsmyndaskynjarar hafi verið þróaðir er aðeins tímaspursmál hvenær upplýsingabilið verði svo mjótt að jafnvel fínustu falsskynjarar geti ekki ákvarðað hvort myndbandið sé raunverulegt eða ekki.

DeepFake uppgötvun sem notar vélanám og Python

DeepFake uppgötvun með vélanámi og Python

Svo, hvað er DeepFake?

First Order Motion Model