Трансформеры штучнага інтэлекту - Дапаможнік для пачаткоўцаў

Сёння мы назіраем рэвалюцыю ў галіне апрацоўкі натуральнай мовы. І, безумоўна, няма будучыні без штучнага інтэлекту. Мы ўжо выкарыстоўваем розныя «памочнікі» штучнага інтэлекту.

Чат-боты - лепшы прыклад у нашым выпадку. Яны прадстаўляюць новую эру камунікацыі. Але што робіць іх такімі асаблівымі?

Сучасныя чат-боты могуць разумець запыты на натуральнай мове і адказваць на іх з такой жа дакладнасцю і дэталямі, што і эксперты-людзі. Цікава даведацца пра механізмы, якія ўваходзяць у гэты працэс.

Прышпіцеся і давайце адкрыем для сябе тэхналогію.

Апусканне ў тэхналогію

AI Transformers - галоўнае ключавое слова ў гэтай галіне. Яны падобныя нейронавыя сеткі якія зрабілі рэвалюцыю ў апрацоўцы натуральнай мовы. У рэчаіснасці паміж трансфарматарамі штучнага інтэлекту і нейронавымі сеткамі існуюць значныя паралелі.

Абодва складаюцца з некалькіх узроўняў працэсараў, якія выконваюць шэраг вылічэнняў для пераўтварэння ўваходных даных у прагнозы ў якасці выхаду. У гэтай публікацыі мы разгледзім моц AI Transformers і тое, як яны змяняюць свет вакол нас.

Патэнцыял апрацоўкі натуральнай мовы

Пачнем з асноў. Мы чуем гэта амаль усюды. Але што такое апрацоўка натуральнай мовы?

Гэта сегмент штучны інтэлект які факусуюць на ўзаемадзеянні людзей і машын праз выкарыстанне натуральнай мовы. Мэта складаецца ў тым, каб дазволіць кампутарам успрымаць, інтэрпрэтаваць і ствараць чалавечую мову значным і аўтэнтычным чынам.

Распазнаванне маўлення, моўны пераклад, аналіз настрояў, і рэзюмаванне тэксту - усё гэта прыклады прымянення НЛП. Традыцыйныя мадэлі НЛП, з іншага боку, з усіх сіл спрабавалі зразумець складаныя сувязі паміж словамі ў фразе. Гэта зрабіла немагчымым высокі ўзровень дакладнасці ў многіх задачах НЛП.

Гэта калі AI Transformers з'яўляецца карціна. Дзякуючы працэсу самаканцэнтрацыі трансфарматары могуць запісваць доўгатэрміновыя залежнасці і сувязі паміж словамі ў фразе. Гэты метад дазваляе мадэлі выбіраць наведванне розных раздзелаў паслядоўнасці ўводу. Такім чынам, ён можа зразумець кантэкст і значэнне кожнага слова ў фразе.

Якія менавіта мадэлі трансформераў

Трансфарматар AI - гэта a глыбокае вывучэнне архітэктура, якая разумее і апрацоўвае розныя тыпы інфармацыі. Ён выдатна вызначае, як некалькі бітаў інфармацыі суадносяцца адзін з адным, напрыклад, як розныя словы ў фразе звязаны паміж сабой або як розныя раздзелы выявы падыходзяць адзін да аднаго.

Ён працуе, падзяляючы інфармацыю на невялікія кавалкі, а потым разглядаючы ўсе гэтыя кампаненты адразу. Быццам бы мноства маленькіх робатаў супрацоўнічаюць, каб спасцігнуць дадзеныя. Далей, як толькі ён даведаецца ўсё, ён зноў збірае ўсе кампаненты, каб даць адказ або вывад.

Трансфарматары штучнага інтэлекту надзвычай каштоўныя. Яны могуць зразумець кантэкст і доўгатэрміновыя сувязі паміж разнастайнай інфармацыяй. Гэта вельмі важна для такіх задач, як моўны пераклад, абагульненне і адказы на пытанні. Такім чынам, яны з'яўляюцца мазгамі многіх цікавых рэчаў, якія можа зрабіць ІІ!

Увага - усё, што вам трэба

Падзагаловак «Увага - усё, што вам трэба» адносіцца да публікацыі 2017 года, у якой была прапанавана мадэль трансфарматара. Гэта зрабіла рэвалюцыю ў дысцыпліне апрацоўкі натуральнай мовы (NLP).

Аўтары гэтага даследавання заявілі, што механізм самаўвагі мадэлі-трансформера дастаткова моцны, каб узяць на сябе ролю звычайнага перыядычнага і згорткавыя нейронавыя сеткі выкарыстоўваецца для задач НЛП.

Што такое ўвага да сябе?

Гэта метад, які дазваляе мадэлі сканцэнтравацца на розных сегментах паслядоўнасці ўводу пры стварэнні прагнозаў.

Іншымі словамі, увага да сябе дазваляе мадэлі вылічваць набор балаў увагі для кожнага элемента адносна ўсіх астатніх кампанентаў, дазваляючы мадэлі збалансаваць значнасць кожнага ўваходнага элемента.

У падыходзе, заснаваным на трансфарматары, увага да сябе дзейнічае наступным чынам:

Уваходная паслядоўнасць спачатку ўбудоўваецца ў серыю вектараў, па адным для кожнага члена паслядоўнасці.

Для кожнага элемента паслядоўнасці мадэль стварае тры наборы вектараў: вектар запыту, вектар ключа і вектар значэння.

Вектар запыту параўноўваецца з усімі ключавымі вектарамі, і падабенства вылічваецца з дапамогай кропкавага здабытку.

Ацэнкі ўвагі ў выніку нармалізуюцца з дапамогай функцыі softmax, якая стварае набор вагаў, якія паказваюць адносную значнасць кожнай часткі ў паслядоўнасці.

Каб стварыць канчатковую выходную рэпрэзентацыю, вектары значэнняў памнажаюцца на каэфіцыенты ўвагі і сумуюцца.

Мадэлі, заснаваныя на трансфарматары, якія выкарыстоўваюць увагу да сябе, могуць паспяхова фіксаваць далёкія адносіны ва ўваходных паслядоўнасцях без залежнасці ад кантэкстных вокнаў фіксаванай даўжыні, што робіць іх асабліва карыснымі для прыкладанняў апрацоўкі натуральнай мовы.

Прыклад

Выкажам здагадку, што ў нас ёсць паслядоўнасць уводу з шасці знакаў: «Кот сеў на дыванок». Кожны токен можа быць прадстаўлены ў выглядзе вектара, а паслядоўнасць уводу можна ўбачыць наступным чынам:

лексемы

Вектары

Далей для кожнага токена мы пабудуем тры наборы вектараў: вектар запыту, вектар ключа і вектар значэння. Убудаваны вектар токена памнажаецца на тры вывучаныя вагавыя матрыцы, каб атрымаць гэтыя вектары.

Для першага токена "The", напрыклад, вектары запыту, ключа і значэння будуць:
Вектар запыту: [0.4, -0.2, 0.1]
Ключавы вектар: [0.2, 0.1, 0.5]
Вектар значэнняў: [0.1, 0.2, 0.3]

Ацэнкі ўвагі паміж кожнай парай токенаў ва ўваходнай паслядоўнасці вылічаюцца з дапамогай механізму ўвагі да сябе. Напрыклад, паказчык увагі паміж токенамі 1 і 2 "The" будзе разлічвацца як кропкавы здабытак іх запыту і ключавых вектараў:

Ацэнка ўвагі = dot_product(вектар запыту токена 1, вектар ключа токена 2)
= (0.4 * 0.8) + (-0.2 * 0.2) + (0.1 * 0.1)
= 0.31

Гэтыя паказчыкі ўвагі паказваюць адносную рэлевантнасць кожнага токена ў паслядоўнасці іншым.

Нарэшце, для кожнага токена выхаднае прадстаўленне ствараецца шляхам узважанай сумы вектараў значэнняў, вага якіх вызначаецца баламі ўвагі. Выхад для першага токена "The", напрыклад, будзе наступным:

Выхадны вектар для маркера 1 = (Ацэнка ўвагі з маркерам 1) * вектар значэння для маркера 2
+ (Ацэнка ўвагі з маркерам 3) * Вектар значэння для маркера 3
+ (Ацэнка ўвагі з маркерам 4) * Вектар значэння для маркера 4
+ (Ацэнка ўвагі з маркерам 5) * Вектар значэння для маркера 5
+ (Ацэнка ўвагі з маркерам 6) * Вектар значэння для маркера 6
= (0.31 * [0.1, 0.2, 0.3]) + (0.25 * [0.2, -0.1, 0.7]) + (0.08 * [0.3, 0.5, -0.1]) + (0.14 * [0.1, 0.3, -0.2] ) + (0.22 * [0.6, -0.3, 0.4])
= [0.2669, 0.1533, 0.2715]

У выніку самаканцэнтрацыі мадэль на аснове трансфарматара можа пры стварэнні выходнай паслядоўнасці звяртацца да розных раздзелаў уваходнай паслядоўнасці.

Прыкладанні больш, чым вы думаеце

Дзякуючы сваёй адаптыўнасці і здольнасці вырашаць шырокі спектр задач НЛП, такіх як машынны пераклад, аналіз пачуццяў, рэзюмаванне тэксту і многае іншае, у апошнія гады Трансфарматары штучнага інтэлекту набылі вялікую папулярнасць.

Трансфарматары штучнага інтэлекту выкарыстоўваліся ў розных галінах, уключаючы распазнаванне малюнкаў, рэкамендацыйныя сістэмы і нават адкрыццё лекаў, у дадатак да класічных моўных прыкладанняў.

Трансфарматары штучнага інтэлекту маюць амаль бязмежныя магчымасці выкарыстання, паколькі іх можна адаптаваць да шматлікіх праблемных абласцей і тыпаў даных. Трансфарматары штучнага інтэлекту з іх здольнасцю аналізаваць складаныя паслядоўнасці даных і фіксаваць доўгатэрміновыя ўзаемаадносіны стануць важным рухаючым фактарам у развіцці прыкладанняў штучнага інтэлекту ў наступныя гады.

Параўнанне з іншымі архітэктурамі нейронных сетак

Паколькі яны могуць аналізаваць паслядоўнасці ўводу і ўлоўліваць далёкія сувязі ў тэксце, трансфарматары штучнага інтэлекту асабліва добра падыходзяць для апрацоўкі натуральнай мовы ў параўнанні з іншымі прылажэннямі нейронных сетак.

З іншага боку, некаторыя архітэктуры нейронных сетак, такія як згорткавыя нейронавыя сеткі (CNN) і рэкурэнтныя нейронавыя сеткі (RNN), лепш падыходзяць для задач, звязаных з апрацоўкай структураваных уваходных дадзеных, такіх як малюнкі або даныя часовых шэрагаў.

Будучыня глядзіцца ярка

Будучыня трансфарматараў штучнага інтэлекту здаецца светлай. Адным з напрамкаў бягучых даследаванняў з'яўляецца распрацоўка ўсё больш магутных мадэляў, здольных вырашаць усё больш складаныя задачы.

Больш за тое, робяцца спробы злучыць трансфарматары AI з іншымі тэхналогіямі AI, такімі як навучанне з падмацаваньнем, каб забяспечыць больш прасунутыя магчымасці прыняцця рашэнняў.

Кожная галіна спрабуе выкарыстоўваць патэнцыял штучнага інтэлекту для прасоўвання інавацый і дасягнення канкурэнтнай перавагі. Такім чынам, трансфарматары штучнага інтэлекту, хутчэй за ўсё, будуць паступова ўключацца ў розныя дадаткі, уключаючы ахову здароўя, фінансы і іншыя.

З пастаянным удасканаленнем тэхналогіі трансфарматара штучнага інтэлекту і патэнцыялам гэтых магутных інструментаў штучнага інтэлекту зрабіць рэвалюцыю ў тым, як людзі апрацоўваюць і разумеюць мову, будучыня здаецца светлай.

Трансформеры штучнага інтэлекту - Дапаможнік для пачаткоўцаў

Апусканне ў тэхналогію

Патэнцыял апрацоўкі натуральнай мовы

Якія менавіта мадэлі трансформераў

Увага - усё, што вам трэба

Што такое ўвага да сябе?

Прыклад

Прыкладанні больш, чым вы думаеце

Параўнанне з іншымі архітэктурамі нейронных сетак

Будучыня глядзіцца ярка

аб Ільке Кандан Бенгі

Іншыя артыкулы на HashDork:

Як паменшыць галюцынацыі ў вашым AI

Каласян супраць Хейгена

Гэты інфармацыйны бюлетэнь будучых тэхналогій не адстой

Трансформеры штучнага інтэлекту - Дапаможнік для пачаткоўцаў

Апусканне ў тэхналогію

Патэнцыял апрацоўкі натуральнай мовы

Якія менавіта мадэлі трансформераў

Увага - усё, што вам трэба

Што такое ўвага да сябе?

Прыклад

Прыкладанні больш, чым вы думаеце

Параўнанне з іншымі архітэктурамі нейронных сетак

Будучыня глядзіцца ярка

аб Ільке Кандан Бенгі

Іншыя артыкулы на HashDork:

Як паменшыць галюцынацыі ў вашым AI

10 лепшых інструментаў AI для сацыяльных сетак

Каласян супраць Хейгена

10 лепшых інструментаў для стварэння анімаваных відэа са штучным інтэлектам

чытач узаемадзеянняў

Пакінуць каментар адмяніць адказ

Гэты інфармацыйны бюлетэнь будучых тэхналогій не адстой