Defnyddio Peiriant Dysgu i Chwarae Gemau Fideo

Tabl Cynnwys[Cuddio][Dangos]

Hanes Byr AI mewn Hapchwarae+-
- Dysgu Peiriannau mewn Gemau Fideo
Sut Mae'n Gweithio: Rhai Cysyniadau Allweddol+-
Ymchwil Enghreifftiol ar Ddysgu Peiriannau mewn Gemau Fideo+-
- OpenAI Pump
- Super Mario Bros
Pwysigrwydd
Casgliad

Mae gemau fideo yn parhau i fod yn her i biliynau o chwaraewyr ledled y byd. Efallai nad ydych yn ei wybod eto, ond mae algorithmau dysgu peirianyddol wedi dechrau ymateb i'r her hefyd.

Ar hyn o bryd mae cryn dipyn o ymchwil ym maes AI i weld a ellir cymhwyso dulliau dysgu peiriant i gemau fideo. Mae cynnydd sylweddol yn y maes hwn yn dangos hynny dysgu peiriant gellir defnyddio asiantau i efelychu neu hyd yn oed ddisodli'r chwaraewr dynol.

Beth mae hyn yn ei olygu i'r dyfodol gemau fideo?

Ai er hwyl yn unig yw’r prosiectau hyn, neu a oes rhesymau dyfnach pam fod cymaint o ymchwilwyr yn canolbwyntio ar gemau?

Bydd yr erthygl hon yn archwilio hanes AI mewn gemau fideo yn fyr. Wedi hynny, byddwn yn rhoi trosolwg cyflym i chi o rai technegau dysgu peiriant y gallwn eu defnyddio i ddysgu sut i guro gemau. Yna byddwn yn edrych ar rai ceisiadau llwyddiannus o rhwydi niwral i ddysgu a meistroli gemau fideo penodol.

Hanes Byr AI mewn Hapchwarae

Cyn i ni ddarganfod pam mae rhwydi niwral wedi dod yn algorithm delfrydol i ddatrys gemau fideo, gadewch i ni edrych yn fyr i sut mae gwyddonwyr cyfrifiadurol wedi defnyddio gemau fideo i ddatblygu eu hymchwil mewn AI.

Gallwch ddadlau bod gemau fideo, o'r cychwyn cyntaf, wedi bod yn faes ymchwil poeth i ymchwilwyr sydd â diddordeb mewn AI.

Er nad yw'n gêm fideo yn wreiddiol, mae gwyddbwyll wedi bod yn ffocws mawr yn nyddiau cynnar AI. Ym 1951, ysgrifennodd Dr Dietrich Prinz raglen chwarae gwyddbwyll gan ddefnyddio cyfrifiadur digidol Ferranti Mark 1. Roedd hyn ymhell yn ôl yn y cyfnod pan oedd yn rhaid i'r cyfrifiaduron swmpus hyn ddarllen rhaglenni oddi ar dâp papur.

algorithm gwyddbwyll

Nid AI gwyddbwyll cyflawn oedd y rhaglen ei hun. Oherwydd cyfyngiadau'r cyfrifiadur, dim ond rhaglen a oedd yn datrys problemau gwyddbwyll cymar-mewn-dau y gallai Prinz ei chreu. Ar gyfartaledd, cymerodd y rhaglen 15-20 munud i gyfrifo pob symudiad posibl ar gyfer y chwaraewyr Gwyn a Du.

Mae gwaith ar wella gwyddbwyll a gwirwyr AI wedi gwella'n gyson dros y degawdau. Cyrhaeddodd y cynnydd ei uchafbwynt yn 1997 pan drechodd Deep Blue o IBM, neiniau gwyddbwyll Rwseg, Garry Kasparov mewn pâr o gemau chwe gêm. Y dyddiau hyn, gall peiriannau gwyddbwyll y gallwch ddod o hyd iddynt ar eich ffôn symudol drechu Deep Blue.

Dechreuodd gwrthwynebwyr AI ennill poblogrwydd yn ystod oes aur gemau arcêd fideo. Mae Space Invaders 1978 a Pac-Man o'r 1980au yn rhai o arloeswyr y diwydiant wrth greu AI a all herio hyd yn oed y rhai mwyaf hynafol o chwaraewyr arcêd yn ddigonol.

Roedd Pac-Man, yn arbennig, yn gêm boblogaidd i ymchwilwyr AI arbrofi arni. Amryw cystadlaethau ar gyfer Ms Pac-Man wedi cael eu trefnu i benderfynu pa dîm allai ddod o hyd i'r AI gorau i guro'r gêm.

Parhaodd Game AI ac algorithmau hewristig i esblygu wrth i'r angen am wrthwynebwyr callach godi. Er enghraifft, cododd poblogrwydd ymladd AI wrth i genres fel saethwyr person cyntaf ddod yn fwy prif ffrwd.

Dysgu Peiriannau mewn Gemau Fideo

Wrth i dechnegau dysgu peiriannau gynyddu'n gyflym mewn poblogrwydd, ceisiodd amrywiol brosiectau ymchwil ddefnyddio'r technegau newydd hyn i chwarae gemau fideo.

Gall gemau fel Dota 2, StarCraft, a Doom fod yn broblemau i'r rhain algorithmau dysgu peiriannau i ddatrys. Algorithmau dysgu dwfn, yn arbennig, yn gallu cyflawni a hyd yn oed ragori ar berfformiad lefel ddynol.

Mae adroddiadau Amgylchedd Dysgu Arcêd neu ALE yn rhoi rhyngwyneb ymchwilwyr ar gyfer dros gant o gemau Atari 2600. Roedd y platfform ffynhonnell agored yn caniatáu i ymchwilwyr feincnodi perfformiad technegau dysgu peirianyddol ar gemau fideo clasurol Atari. Cyhoeddodd Google eu rhai eu hunain hyd yn oed papur defnyddio saith gêm o'r ALE

aLE a ddefnyddir i brofi dysgu peirianyddol mewn gemau fideo

Yn y cyfamser, mae prosiectau fel VizDoom rhoddodd gyfle i ymchwilwyr AI hyfforddi algorithmau dysgu peirianyddol i chwarae saethwyr person cyntaf 3D.

Mae VizDoom yn adnodd ardderchog ar gyfer hyfforddi ML i chwarae FPS

Sut Mae'n Gweithio: Rhai Cysyniadau Allweddol

Rhwydweithiau Niwral

Mae'r rhan fwyaf o ddulliau o ddatrys gemau fideo gyda dysgu peiriant yn cynnwys math o algorithm a elwir yn rhwydwaith niwral.

Gallwch feddwl am rwyd niwral fel rhaglen sy'n ceisio dynwared sut y gallai ymennydd weithredu. Yn debyg i sut mae ein hymennydd yn cynnwys niwronau sy'n trosglwyddo signal, mae rhwyd niwral hefyd yn cynnwys niwronau artiffisial.

Mae'r niwronau artiffisial hyn hefyd yn trosglwyddo signalau i'w gilydd, gyda phob signal yn rhif gwirioneddol. Mae rhwyd niwral yn cynnwys haenau lluosog rhwng yr haenau mewnbwn ac allbwn, a elwir yn rhwydwaith niwral dwfn.

Dysgu atgyfnerthu

Techneg dysgu peiriant cyffredin arall sy'n berthnasol i ddysgu gemau fideo yw'r syniad o ddysgu atgyfnerthu.

Y dechneg hon yw'r broses o hyfforddi asiant gan ddefnyddio gwobrau neu gosbau. Gyda'r dull hwn, dylai'r asiant allu dod o hyd i ateb i broblem trwy brofi a methu.

Gadewch i ni ddweud ein bod ni eisiau AI i ddarganfod sut i chwarae'r gêm Neidr. Mae amcan y gêm yn syml: mynnwch gymaint o bwyntiau â phosib trwy fwyta eitemau ac osgoi'ch cynffon sy'n tyfu.

dysgu atgyfnerthu ar Neidr

Gyda dysgu atgyfnerthu, gallwn ddiffinio swyddogaeth wobrwyo R. Mae'r swyddogaeth yn ychwanegu pwyntiau pan fydd Neidr yn defnyddio eitem ac yn tynnu pwyntiau pan fydd y Neidr yn taro rhwystr. O ystyried yr amgylchedd presennol a set o gamau gweithredu posibl, bydd ein model dysgu atgyfnerthu yn ceisio cyfrifo'r 'polisi' gorau posibl sy'n gwneud y gorau o'n swyddogaeth wobrwyo.

Neuroesblygiad

Gan gadw mewn thema gyda chael eu hysbrydoli gan natur, mae ymchwilwyr hefyd wedi cael llwyddiant wrth gymhwyso ML i gemau fideo trwy dechneg a elwir yn niwroesblygiad.

Yn lle defnyddio disgyniad graddiant i ddiweddaru niwronau mewn rhwydwaith, gallwn ddefnyddio algorithmau esblygiadol i gyflawni canlyniadau gwell.

Mae algorithmau esblygiadol fel arfer yn dechrau trwy gynhyrchu poblogaeth gychwynnol o unigolion ar hap. Yna byddwn yn gwerthuso'r unigolion hyn gan ddefnyddio meini prawf penodol. Mae’r unigolion gorau yn cael eu dewis fel “rhieni” ac yn cael eu magu gyda’i gilydd i ffurfio cenhedlaeth newydd o unigolion. Bydd yr unigolion hyn wedyn yn cymryd lle'r unigolion lleiaf ffit yn y boblogaeth.

Mae'r algorithmau hyn hefyd fel arfer yn cyflwyno rhyw fath o weithrediad treiglo yn ystod y cam croesi neu "fagu" i gynnal amrywiaeth genetig.

Ymchwil Enghreifftiol ar Ddysgu Peiriannau mewn Gemau Fideo

OpenAI Pump

Mae OpenAI Five yn chwarae Dota 2

OpenAI Pump yn rhaglen gyfrifiadurol gan OpenAI sy'n anelu at chwarae DOTA 2, gêm arena frwydr symudol aml-chwaraewr poblogaidd (MOBA).

Defnyddiodd y rhaglen dechnegau dysgu atgyfnerthu presennol, wedi'u graddio i ddysgu o filiynau o fframiau yr eiliad. Diolch i system hyfforddi ddosbarthedig, roedd OpenAI yn gallu chwarae gwerth 180 mlynedd o gemau bob dydd.

Ar ôl y cyfnod hyfforddi, llwyddodd OpenAI Five i gyflawni perfformiad ar lefel arbenigwr a dangos cydweithrediad â chwaraewyr dynol. Yn 2019, roedd OpenAI five yn gallu drechu 99.4% o chwaraewyr mewn gemau cyhoeddus.

dysgu peiriant dota 2 mewn gemau fideo

Pam penderfynodd OpenAI ar y gêm hon? Yn ôl yr ymchwilwyr, roedd gan DOTA 2 fecaneg gymhleth a oedd y tu allan i gyrraedd dwfn presennol dysgu atgyfnerthu algorithmau.

Super Mario Bros

Cymhwysiad diddorol arall o rwydi niwral mewn gemau fideo yw'r defnydd o niwroesblygiad i chwarae platfformwyr fel Super Mario Bros.

Er enghraifft, hyn mynediad hacathon yn dechrau heb unrhyw wybodaeth am y gêm ac yn araf yn adeiladu sylfaen o'r hyn sydd ei angen i symud ymlaen trwy lefel.

gall dysgu peirianyddol mewn gemau fideo fel super mario ddibynnu ar niwroesblygiad

Mae'r rhwyd niwral hunan-ddatblygol yn cymryd cyflwr presennol y gêm fel grid o deils. Ar y dechrau, nid oes gan y rhwyd neral unrhyw ddealltwriaeth o'r hyn y mae pob teils yn ei olygu, dim ond bod y teils “aer” yn wahanol i “teils daear” a “theils gelyn.”

Roedd gweithrediad y prosiect hacathon o niwroesblygiad yn defnyddio algorithm genetig NEAT i fridio gwahanol rwydi niwral yn ddetholus.

Pwysigrwydd

Nawr eich bod chi wedi gweld rhai enghreifftiau o rwydi niwral yn chwarae gemau fideo, efallai eich bod chi'n pendroni beth yw pwrpas hyn i gyd.

Gan fod gemau fideo yn cynnwys rhyngweithio cymhleth rhwng asiantau a'u hamgylcheddau, mae'n faes profi perffaith ar gyfer gwneud AI. Mae amgylcheddau rhithwir yn ddiogel ac yn rheoladwy ac yn darparu cyflenwad diddiwedd o ddata.

Mae ymchwil a wnaed yn y maes hwn wedi rhoi cipolwg i ymchwilwyr ar sut y gellir optimeiddio rhwydi niwral i ddysgu sut i ddatrys problemau yn y byd go iawn.

Rhwydweithiau niwral cael eu hysbrydoli gan sut mae ymennydd yn gweithio yn y byd naturiol. Trwy astudio sut mae niwronau artiffisial yn ymddwyn wrth ddysgu sut i chwarae gêm fideo, efallai y byddwn hefyd yn cael cipolwg ar sut y ymennydd dynol gwaith.

Casgliad

Mae tebygrwydd rhwng rhwydweithiau niwral a'r ymennydd wedi arwain at fewnwelediadau yn y ddau faes. Gall yr ymchwil parhaus ar sut y gall rhwydi niwral ddatrys problemau arwain at ffurfiau mwy datblygedig o deallusrwydd artiffisial.

Dychmygwch ddefnyddio AI wedi'i deilwra i'ch manylebau a all chwarae gêm fideo gyfan cyn i chi ei brynu i roi gwybod i chi a yw'n werth eich amser. A fyddai cwmnïau gemau fideo yn defnyddio rhwydi niwral i wella dyluniad gêm, lefel tweak, ac anhawster gwrthwynebwyr?

Beth ydych chi'n meddwl fydd yn digwydd pan fydd rhwydi niwral yn dod yn chwaraewyr eithaf?

Sut I Ddysgu Rhwyd Niwral I Chwarae Gemau Fideo

Defnyddio Dysgu Peiriannau i Chwarae Gemau Fideo - Trosolwg