Machine Learning සහ Python භාවිතා කරමින් DeepFake Detection

පටුන[සඟවන්න][පෙන්වන්න]

ඉතින්, DeepFake යනු කුමක්ද?
පළමු ඇණවුම් චලන ආකෘතිය
Deepfake ආකෘතියක් නිර්මාණය කිරීමේ ක්රියාවලිය+-
Deepfake Detection Model ගොඩනැගීම+-
Deepfake තාක්ෂණයේ අවදානම් මොනවාද?
නිගමනය

ව්‍යාජ ඡායාරූප සහ වීඩියෝ තිබීම අලුත් දෙයක් නොවේ. අන්තර්ජාලය පුලුල්ව භාවිතා කිරීම නිසා, පින්තූර සහ චිත්‍රපට ඇති වූ දා සිට පුද්ගලයන් රැවටීමට හෝ විනෝද වීමට ව්‍යාජ නිර්මාණ නිර්මාණය කර ඇත.

කෙසේ වෙතත්, යම් දිනක අපට යථාර්තය ප්‍රබන්ධයෙන් වෙන්කර හඳුනා ගැනීමට අපහසු විය හැකි යන්ත්‍ර මගින් නිපදවන ලද නව ආකාරයේ ව්‍යාජයක් තිබේ.

මෙම ව්‍යාජ ෆොටෝෂොප් වැනි මෘදුකාංග සංස්කරණය කිරීමෙන් හෝ අතීතයේ දක්ෂ ලෙස හසුරුවන ලද චිත්‍රපට මගින් ජනනය කරන ලද සරල පින්තූර හැසිරවීම් වලින් වෙනස් වේ.

ඩීප්ෆේක් යනු "කෘත්‍රිම මාධ්‍ය" සඳහා වඩාත්ම ප්‍රසිද්ධ උදාහරණයයි - සාම්ප්‍රදායික ක්‍රම භාවිතයෙන් නිපදවා ඇති බව පෙනෙන නමුත් සැබවින්ම නවීන මෘදුකාංග භාවිතයෙන් සාදන ලද රූප, ශබ්ද සහ වීඩියෝ.

Deepfakes කලක සිට පැවත එන අතර, ඔවුන්ගේ ජනප්‍රියම යෙදුම තවමත් අසභ්‍ය චිත්‍රපටවල නළුවන්ගේ සිරුරේ ප්‍රසිද්ධ පුද්ගලයින්ගේ හිස තැබීම වුවද, ඕනෑම අයෙකු ඕනෑම තැනක, ඕනෑම දෙයක් කරන බවට ඒත්තු ගැන්වෙන දර්ශන නිෂ්පාදනය කිරීමේ හැකියාව ඔවුන්ට ඇත.

මෙම ලිපියෙන්, අපි Deepfakes, එය ක්‍රියා කරන ආකාරය, ඔබට ඒවා ඔබම ජනනය කළ හැකි ආකාරය සහ තවත් බොහෝ දේ දෙස බලනු ඇත.

ඉතින්, DeepFake යනු කුමක්ද?

ගැඹුරු ඉගෙනීම සහ ව්‍යාජ යන වාක්‍ය ඛණ්ඩවල සංකලනයක් ගැඹුරු ව්‍යාජයකි කෘතිම මාධ්ය දැනටමත් පවතින ඡායාරූපයක හෝ වීඩියෝවක සිටින පුද්ගලයෙකුගේ සමානකම වෙනුවට වෙනත් පුද්ගලයෙකුගේ සමානකම භාවිතා කරයි.

රැවටීමට ඉහළ විභවයක් ඇති දෘශ්‍ය සහ ශ්‍රව්‍ය තොරතුරු වෙනස් කිරීමට සහ නිර්මාණය කිරීමට Deepfakes නවීන යන්ත්‍ර ඉගෙනුම් සහ කෘතිම බුද්ධි ශිල්පීය ක්‍රම භාවිතා කරයි.

ස්වයංක්‍රීය කේතක සහ උත්පාදක එදිරිවාදී ජාල වැනි ගැඹුරු ඉගෙනුම් ක්‍රම ගැඹුරු ව්‍යාජ නිෂ්පාදනය (GAN) සඳහා මූලික යාන්ත්‍රණය වේ.

මෙම ආකෘතීන් පුද්ගලයෙකුගේ මුහුණේ හැඟීම් සහ චලනයන් විශ්ලේෂණය කිරීමට සහ සංසන්දනාත්මක ප්‍රකාශන සහ චලනයන් ප්‍රදර්ශනය කරන වෙනත් පුද්ගලයින්ගේ මුහුණු පින්තූර සංස්ලේෂණය කිරීමට භාවිතා කරයි.

කීර්තිමත් පුද්ගලයින්ගේ අසභ්‍ය වීඩියෝ, ව්‍යාජ ප්‍රවෘත්ති, ප්‍රෝඩාවන් සහ මූල්‍ය වංචාවල ගැඹුරු ව්‍යාජ භාවිතය සැලකිය යුතු අවධානයක් යොමු කර ඇත. කර්මාන්තය සහ රජය යන දෙකම ප්‍රතිචාර දක්වා ඇත්තේ ඒවා සොයා ගැනීමට සහ ඒවායේ භාවිතය සීමා කිරීමට උත්සාහ කිරීමෙනි.

පළමු ඇණවුම් චලන ආකෘතිය

අතීතයේ ගැඹුරු ව්‍යාජයන් වර්ධනය කිරීමට උත්සාහ කරන විට, ගැටළුව වූයේ මෙම ප්‍රවේශයන් ක්‍රියාත්මක වීමට අපට යම් ආකාරයක අමතර දැනුමක් හෝ පෙරවරු අවශ්‍ය වීමයි.

නිදර්ශනයක් ලෙස, අපට හිස චලනය සොයා ගැනීමට අවශ්‍ය නම් මුහුණු සලකුණු අවශ්‍ය වේ. අපට සම්පූර්ණ ශරීර චලිතය සිතියම්ගත කිරීමට අවශ්‍ය නම් ඉරියව් ඇස්තමේන්තුව අවශ්‍ය විය.

පසුගිය වසරේ ටොරොන්ටෝ විශ්ව විද්‍යාලයේ පර්යේෂක කණ්ඩායම ඔවුන්ගේ කෘති ඉදිරිපත් කළ විට NeurIPS සමුළුවේදී එය වෙනස් විය.රූප සජීවිකරණය සඳහා පළමු ඇණවුම් චලන ආකෘතිය. "

මෙම ප්‍රවේශය සඳහා සජීවිකරණය පිළිබඳ වැඩිදුර දැනුමක් අවශ්‍ය නොවේ. මීට අමතරව, මෙම ආකෘතිය පුහුණු කිරීමෙන් පසුව, එය මාරු ඉගෙනීම සඳහා භාවිතා කළ හැකි අතර එම කාණ්ඩයට අයත් ඕනෑම අයිතමයකට යෙදිය හැකිය.

මෙම ක්‍රමයේ ක්‍රියාකාරිත්වය තව ටිකක් ඉදිරියට බලමු. චලන නිස්සාරණය සහ උත්පාදනය සමස්ත ක්‍රියාවලියේ පළමු භාගය සෑදී ඇත. ධාවන වීඩියෝ සහ මූලාශ්‍ර පින්තූර ආදාන ලෙස භාවිත කෙරේ.

පළමු ඇණවුම් චලන ආකෘතිය වැඩ කිරීම

විරල ප්‍රධාන ලක්ෂ්‍ය සහ දේශීය affine පරිවර්තනයන්ගෙන් සමන්විත පළමු පෙළ චලන නිරූපණය උපුටා ගැනීම සඳහා, චලන නිස්සාරකයක් ප්‍රධාන කරුණු හඳුනා ගැනීමට ස්වයංක්‍රීය කේතකයක් භාවිතා කරයි.

ඝන චලන ජාලය සමඟ ඝන දෘශ්‍ය ප්‍රවාහයක් සහ අවහිරතා සිතියමක් නිර්මාණය කිරීම සඳහා, ඔවුන් රියදුරු වීඩියෝ සමඟ සේවයේ යොදවා ඇත. එවිට උත්පාදක යන්ත්රය ඝන චලන ජාලයෙන් සහ මූලාශ්ර රූපයෙන් ලැබෙන ප්රතිදාන භාවිතයෙන් ඉලක්ක පින්තූරය ලබා දෙයි.

පුවරුව හරහා, මෙම කාර්යය නවීන තත්වයට වඩා හොඳින් ක්‍රියාත්මක වේ. අනෙකුත් මාදිලිවල නොමැති විශේෂාංග ද එහි අඩංගු වේ. එය පින්තූර වර්ග කිහිපයක ක්‍රියා කරයි, එබැවින් ඔබට එය මුහුණ, ශරීරය, කාටූන් යනාදිය සඳහා යෙදිය හැකිය, එය අතිශයින්ම විශිෂ්ටයි.

මෙමගින් නව අවස්ථා රැසක් නිර්මාණය වේ. අපගේ උපාය මාර්ගයේ තවත් වැදගත් අංගයක් නම්, එය දැන් ඔබට ඉලක්ක වස්තුවේ එක් රූපයක් පමණක් භාවිතා කරමින් උසස් තත්ත්වයේ Deepfakes නිෂ්පාදනය කිරීමට ඉඩ සලසයි. වස්තුව සඳහා YOLO පිළිගැනීම.

Deepfake ආකෘතියක් නිර්මාණය කිරීමේ ක්රියාවලිය

ගැඹුරු ව්‍යාජ උත්පාදනය සඳහා ක්‍රියාවලි තුනක් අවශ්‍ය වේ: නිස්සාරණය, පුහුණුව සහ නිර්මාණය. මෙම එක් එක් අදියරවල ප්‍රධාන කරුණු සහ ඒවා සමස්ත ක්‍රියාවලියට සම්බන්ධ වන ආකාරය මෙම කොටසින් ආවරණය කෙරේ.

උකහා ගැනීම

Deepfakes මුහුණු වෙනස් කිරීමට ගැඹුරු ස්නායුක ජාල භාවිතා කරන අතර නිවැරදිව හා ඒත්තු ගැන්වෙන ලෙස ක්‍රියා කිරීමට දත්ත (පින්තූර) විශාල ප්‍රමාණයක් අවශ්‍ය වේ. නිස්සාරණ ක්‍රියාවලිය යනු වීඩියෝ ක්ලිප් වලින් සියලුම රාමු උපුටාගෙන, මුහුණු හඳුනාගෙන, කාර්ය සාධනය උපරිම කිරීම සඳහා මුහුණු පෙළගස්වන අදියරයි.

පුහුණුව

පුහුණු අදියරේදී, ද ස්නායු ජාලය එක් මුහුණක් තවත් මුහුණකට වෙනස් කළ හැකිය. පුහුණුවීම් කට්ටලයේ විශාලත්වය සහ පුහුණු උපකරණය අනුව, පුහුණුව පැය කිහිපයක් හෝ දින කිහිපයක් ගත විය හැකිය.

අනෙකුත් බොහෝ ස්නායුක ජාල පුහුණුව මෙන් පුහුණුව එක් වරක් අවසන් කළ යුතුය. පුහුණුවෙන් පසු, ආකෘතියට A පුද්ගලයාගෙන් B පුද්ගලයාට මුහුණ වෙනස් කිරීමට හැකි වනු ඇත.

නිර්මාණය

ආකෘතිය පුහුණු කිරීමෙන් පසුව, ගැඹුරු ව්යාජයක් නිපදවිය හැකිය. රාමු වීඩියෝවකින් ලබාගෙන පසුව සියලු මුහුණුවලට පෙළගස්වා ඇත. එක් එක් රාමුව පරිවර්තනය කිරීම සඳහා පුහුණු වූ ස්නායුක ජාලය පසුව භාවිතා වේ.

අවසන් පියවර ලෙස පරිවර්තනය කළ මුහුණ මුල් රාමුව සමඟ ඒකාබද්ධ කළ යුතුය.

Deepfake Detection Model ගොඩනැගීම

GitHub Repo සවි කිරීම සහ ක්ලෝන කිරීම

Colab හි වැඩ කරන අතරතුර Google හි GPU නොමිලේ භාවිතා කිරීමට හැකි වීම වාසිදායක වේ ගැඹුරු ඉගෙනුම. අමතර වාසියක් වන්නේ වලාකුළු අතථ්‍ය යන්ත්‍රයක් (VM) මත Google Drive සවිකිරීමේ හැකියාවයි.

ඔහුගේ සියලුම දේවල් වෙත පහසුවෙන් ප්‍රවේශ වීමත් සමඟ, පරිශීලකයා සබල කර ඇත. වලාකුළෙහි ඇති අතථ්‍ය යන්ත්‍රයට Google Drive සවිකිරීමට අවශ්‍ය වැඩසටහන මෙම කොටසින් සොයාගනු ඇත.

ගිතුබ් කන්ද

Repo ක්ලෝන කිරීම

නාමාවලිය සෑදීම

මොඩියුල ආනයනය කිරීම

දැන්, අපි අවශ්‍ය සියලුම මොඩියුල ආනයනය කරන්නෙමු.

මොඩියුල ආනයනය කිරීම

ආකෘතිය ක්රියාත්මක කිරීම

අපි පුටින්ගේ නිශ්චල ඡායාරූපයක් (මූලාශ්‍ර පින්තූරය) ඔබාමාගේ වීඩියෝවක් ඒකාබද්ධ කරන උදාහරණයක් භාවිතා කරන්නෙමු. එහි ප්‍රතිඵලය වන්නේ ඔබාමා රිය පැදවීමේදී භාවිත කළ මුහුණේ ඉරියව්වලින්ම පුටින් කතා කරන සහ අභිනයන් කරන වීඩියෝවකි.

ආකෘතියේ ප්රතිඵලය ප්රදර්ශනය කිරීමට පෙර, මාධ්යය පටවනු ලබන අතර කාර්යයන් ප්රකාශ කරනු ලැබේ. එවිට මුරපොලවල් පටවනු ලබන අතර ආකෘතිය ඉදි කරනු ලැබේ. ගැඹුරු ව්‍යාජය නිර්මාණය කිරීමෙන් පසු, විවිධ සජීවිකරණ මෝස්තර දෙකක් දර්ශනය වේ.

රූපය සහ වීඩියෝ ඒකාබද්ධ කිරීම සහ ප්‍රමාණය වෙනස් කිරීම

සාපේක්ෂ ප්‍රධාන ලක්ෂ්‍ය විස්ථාපනය භාවිතා කරමින් ඔබාමාගේ චලනයන් මගින් පුටින් සජීවීකරණය කර ඇත. ඔබාමාගේ මුහුණේ හැඟීම් සහ ශරීර භාෂාව ඔහුගේ වීඩියෝ දර්ශන අතරතුර පුටින්ට ලස්සනට සහ පැහැදිලිව නිරූපණය කර ඇති ආකාරය විශ්මය ජනකයි.

විශේෂයෙන් ඔබාමා ඇහි බැම ඉහළට ඔසවා ඇස් ඇසිපිය හෙළන විට අන්වීක්ෂීය වැරදි කිහිපයක් තිබේ. මෙම ප්‍රකාශන පුටින්ගේ රාමු තුළ හරියටම ප්‍රතිනිර්මාණය නොවේ.

ගැඹුරු ව්‍යාජ පසුබිමකින් තොරව, පුටින් චිත්‍රපටය රූපවාහිනියෙන් නැරඹුවහොත් හෝ එය තරමක් විශ්වාසදායක සහ අව්‍යාජ එකක් ලෙස පෙනෙනු ඇත. සමාජ මාධ්ය.

ආකෘති නිර්මාණය

දැන්, අපි සම්පූර්ණ ආකෘතියක් නිර්මාණය කිරීමට පෙර-පුහුණු මුරපොලවල් භාවිතා කරන්නෙමු.

ආකෘති නිර්මාණය

Deepfake හඳුනාගැනීම

පහත කොටුවේ ඇති අයිතම සජීවීකරණය කිරීමට සාපේක්ෂ යතුරු ලක්ෂ්‍ය විස්ථාපනය භාවිතා කරයි. මීළඟ කොටුව ඒ වෙනුවට නිරපේක්ෂ ඛණ්ඩාංක භාවිතා කරයි, නමුත් සියලුම අයිතම අනුපාත මෙම මාදිලියේ රියදුරු වීඩියෝවෙන් ගනු ලැබේ.

Deepfake හඳුනාගැනීම

නිරපේක්ෂ ඛණ්ඩාංක භාවිතයෙන් ප්රතිදානය වැඩි දියුණු කිරීම

නිරපේක්ෂ සම්බන්ධීකරණය භාවිතයෙන් ප්‍රතිදානය වැඩි දියුණු කිරීම

මේ ආකාරයට ගැඹුරු ව්‍යාජ හඳුනාගැනීමක් වර්ධනය කර ගැනීමට ඔබට හැකි වනු ඇත.

Deepfake තාක්ෂණයේ අවදානම් මොනවාද?

ඩීප්ෆේක් වීඩියෝ දැන් ඒවායේ නව්‍යතාවය නිසා නැරඹීමට සිත් ඇදගන්නාසුළු සහ විනෝදජනකයි. කෙසේ වෙතත්, මෙම පෙනෙන පරිදි හාස්‍යජනක තාක්‍ෂණයේ මතුපිටට යටින් පාලනයෙන් බැහැර වීමේ අවදානමක් ඇත.

ව්‍යාජ සහ සැබෑ වීඩියෝ අතර වෙනස හඳුනා ගැනීම නිසැකවම අභියෝගාත්මක වනු ඇත ගැඹුරු තාක්‍ෂණය ඉදිරියට යනවා. ප්‍රමුඛ පුද්ගලයින්ට සහ ප්‍රසිද්ධ පුද්ගලයින්ට, විශේෂයෙන්, මෙය දරුණු බලපෑම් ඇති කළ හැකිය. චේතනාන්විතව ද්වේෂසහගත වන Deepfakes වෘත්තීය හා ජීවිත සම්පූර්ණයෙන්ම හානි කිරීමට හැකියාව ඇත.

මේවා අනිෂ්ට චේතනාවක් ඇති අයෙකු විසින් අන් අය වෙනුවෙන් සමත් වීමට සහ ඔවුන්ගේ මිතුරන්, ඥාතීන් සහ සගයන්ගෙන් ප්‍රයෝජන ගැනීමට භාවිතා කළ හැකිය. විදේශීය නායකයින්ගේ ව්‍යාජ චිත්‍රපට භාවිතා කරමින් ලොව පුරා මතභේද ඇති කිරීමට සහ යුද්ධ පවා ඇති කිරීමට ඔවුන්ට හැකියාව ඇත.

නිගමනය

සාරාංශයක් ලෙස, අප සිටින්නේ අමුතු කාල පරිච්ඡේදයක සහ අසාමාන්ය පරිසරයක ය. වෙන කවරදාකටත් වඩා බොරු ප්‍රවෘත්ති සහ චිත්‍රපට නිෂ්පාදනය කර ඒවා ප්‍රචාරය කිරීම සරල ය. සත්‍ය සහ අසත්‍ය දේ තේරුම් ගැනීම එන්න එන්නම අභියෝගාත්මක වෙමින් පවතී.

අද පෙනෙන්නේ, අපට තවදුරටත් අපගේම ඉන්ද්‍රියයන් මත විශ්වාසය තැබිය නොහැකි බවයි.

ව්‍යාජ වීඩියෝ අනාවරක නිපදවා ඇතත්, එම වීඩියෝව සත්‍යද නැද්ද යන්න තීරණය කිරීමට හොඳම ව්‍යාජ අනාවරකවලට පවා නොහැකි වන තරමට තොරතුරු පරතරය පටු වීමට පෙර කාලය පිළිබඳ ප්‍රශ්නයක් පමණි.

Machine Learning සහ Python භාවිතා කරමින් DeepFake Detection

Machine Learning සහ Python භාවිතයෙන් DeepFake Detection

ඉතින්, DeepFake යනු කුමක්ද?

පළමු ඇණවුම් චලන ආකෘතිය