Гүнзгий суралцах шилдэг 10 загвар (2024)

Гарчиг[Нуух][Үзүүлэх]

1. Convolutional Neural Networks (CNNs)
2. Урт богино хугацааны санах ой (LSTM) сүлжээнүүд
3. Үүсгэх сөрөг сүлжээнүүд (GANs)+-

Ирээдүй энд байна. Ирээдүйд машинууд эргэн тойрныхоо ертөнцийг хүмүүстэй адилхан ойлгодог. Компьютер нь машин жолоодох, өвчнийг оношлох, ирээдүйг зөв таамаглах боломжтой.

Энэ нь шинжлэх ухааны зөгнөлт мэт санагдаж болох ч гүнзгий суралцах загварууд үүнийг бодит болгож байна.

Эдгээр нарийн алгоритмууд нь нууцыг илчилж байна хиймэл оюун, компьютерт бие даан суралцах, хөгжүүлэх боломжийг олгодог. Энэ нийтлэлд бид гүнзгий суралцах загваруудын талаар судлах болно.

Мөн бидний амьдралд хувьсгал хийх асар их боломжийг бид судлах болно. Хүн төрөлхтний ирээдүйг өөрчилж буй хамгийн сүүлийн үеийн технологийн талаар суралцахад бэлтгэ.

Гүнзгий суралцах 1

Гүнзгий суралцах загварууд яг юу вэ?

Та хоёр зургийн ялгааг олж мэдэх тоглоом тоглож байсан уу?

Энэ нь хөгжилтэй, гэхдээ бас хэцүү байж болно, тийм ээ? Компьютерт тэр тоглоомыг тоглож, тэр болгонд хожих боломжтой гэж төсөөлөөд үз дээ. Гүнзгий суралцах загварууд үүнийг л биелүүлдэг!

Гүнзгий суралцах загварууд нь маш олон тооны зургийг шалгаж, тэдгээрт юу нийтлэг байгааг тодорхойлох чадвартай супер ухаалаг машинтай төстэй юм. Тэд зургийг задалж, тус бүрийг тусад нь судлах замаар үүнийг хийдэг.

Дараа нь тэд сурсан зүйлээ ашиглан хэв маягийг тодорхойлж, урьд өмнө хэзээ ч харж байгаагүй шинэ зургуудын талаар таамаглал дэвшүүлдэг.

Гүнзгий сургалтын ажлын урсгал

Гүн сургалтын загварууд нь асар том мэдээллийн багцаас нарийн төвөгтэй хэв маяг, шинж чанаруудыг сурч, гаргаж авах боломжтой хиймэл мэдрэлийн сүлжээ юм. Эдгээр загварууд нь гаралт үүсгэхийн тулд ирж буй өгөгдөлд дүн шинжилгээ хийж, өөрчилдөг хэд хэдэн давхаргаар холбогдсон зангилаа буюу мэдрэлийн эсүүдээс бүрддэг.

Гүнзгий суралцах загварууд нь дүрсийг таних, яриа таних, байгалийн хэлийг боловсруулах, робот техник гэх мэт өндөр нарийвчлал, нарийвчлал шаардсан ажилд маш сайн тохирдог.

Эдгээрийг өөрөө жолооддог машинаас авахуулаад эмнэлгийн оношлогоо, зөвлөмж өгөх систем болон бусад бүх зүйлд ашигласан. урьдчилан таамаглах аналитик.

Гүнзгий сургалтын загварт өгөгдлийн урсгалыг харуулах дүрслэлийн хялбаршуулсан хувилбарыг энд оруулав.

Оролтын өгөгдөл нь загварын оролтын давхарга руу урсаж, дараа нь гаралтын таамаглалыг өгөхөөс өмнө өгөгдлийг хэд хэдэн далд давхаргуудаар дамжуулдаг.

Далд давхарга бүр нь дараагийн давхарга руу дамжуулахын өмнө оролтын өгөгдөл дээр хэд хэдэн математикийн үйлдлүүдийг гүйцэтгэдэг бөгөөд энэ нь эцсийн таамаглалыг өгдөг.

Одоо гүнзгий суралцах загвар гэж юу болох, тэдгээрийг амьдралдаа хэрхэн ашиглах талаар харцгаая.

1. Convolutional Neural Networks (CNNs)

CNN нь компьютерийн алсын харааг өөрчилсөн гүнзгий суралцах загвар юм. CNN нь зургийг ангилах, объектыг таних, дүрсийг сегментчлэх зэрэгт ашиглагддаг. Хүний харааны кортексийн бүтэц, үйл ажиллагаа нь CNN-ийн дизайныг мэдээлсэн.

Тэд хэрхэн ажилладаг вэ?

CNN нь хэд хэдэн эргэлтийн давхарга, нэгтгэх давхарга, бүрэн холбогдсон давхаргуудаас бүрддэг. Оролт нь зураг, гаралт нь зургийн ангийн шошгоны таамаглал юм.

CNN-ийн эргэлтийн давхаргууд нь оролтын зураг болон шүүлтүүрүүдийн хооронд цэгийн бүтээгдэхүүнийг гүйцэтгэх замаар онцлог газрын зургийг бүтээдэг. Цөөрөмжүүлэгч давхаргууд нь онцлог газрын зургийн хэмжээг доош түүвэрлэх замаар багасгадаг.

Эцэст нь, зургийн ангиллын шошгыг урьдчилан таамаглахад бүрэн холбогдсон давхаргууд нь онцлог газрын зургийг ашигладаг.

CNN

CNN яагаад чухал вэ?

CNN нь хүмүүст анзаарахад хэцүү байдаг зургуудын хэв маяг, шинж чанарыг олж мэдэж чаддаг тул маш чухал юм. CNN-д том мэдээллийн багц ашиглан ирмэг, булан, бүтэц зэрэг шинж чанаруудыг танихыг зааж болно. Эдгээр шинж чанаруудыг олж мэдсэнийхээ дараа CNN шинэ зураг дээрх объектуудыг тодорхойлоход ашиглаж болно. CNN нь дүрс таних янз бүрийн программууд дээр хамгийн сүүлийн үеийн гүйцэтгэлийг харуулсан.

Бид CNN-г хаана ашигладаг вэ

Эрүүл мэнд, автомашины үйлдвэрлэл, жижиглэн худалдаа зэрэг нь CNN-ийг ажиллуулдаг хэдхэн салбар юм. Эрүүл мэндийн салбарт эдгээр нь өвчний оношлогоо, эм боловсруулах, эмнэлгийн зургийн дүн шинжилгээ хийхэд тустай байж болно.

Автомашины салбарт тэд эгнээ илрүүлэхэд тусалдаг. объект илрүүлэх, мөн бие даасан жолоодлоготой. Тэдгээрийг жижиглэнгийн худалдаанд харааны хайлт, зураг дээр суурилсан бүтээгдэхүүний зөвлөмж, бараа материалын хяналт зэрэгт ихээхэн ашигладаг.

Жишээлбэл; Google нь CNN-ийг янз бүрийн программуудад ашигладаг Google Линз, маш их таалагдсан дүрсийг таних хэрэгсэл. Хөтөлбөр нь CNN ашиглан гэрэл зургийг үнэлж, хэрэглэгчдэд мэдээлэл өгдөг.

Жишээлбэл, Google Lens нь зурган дээрх зүйлсийг таньж, цэцгийн төрөл гэх мэт дэлгэрэнгүй мэдээллийг санал болгодог.

Google линз

Энэ нь зурагнаас гаргаж авсан текстийг олон хэл рүү орчуулж болно. Google Lens нь CNN-ийн тусламжтай зүйлсийг үнэн зөв тодорхойлж, зурагнаас шинж чанарыг нь гаргаж авдаг тул хэрэглэгчдэд хэрэгтэй мэдээлэл өгөх боломжтой.

2. Урт богино хугацааны санах ой (LSTM) сүлжээнүүд

Урт богино хугацааны санах ой (LSTM) сүлжээг тогтмол давтагдах мэдрэлийн сүлжээний (RNN) дутагдлыг арилгах зорилгоор бүтээдэг. LSTM сүлжээ нь өгөгдлийн дарааллыг цаг хугацааны явцад боловсруулах шаардлагатай ажлуудад тохиромжтой.

Эдгээр нь тодорхой санах ойн эс болон гурван хаалганы механизм ашиглан ажилладаг.

Тэд эсийн доторх болон гадагшлах мэдээллийн урсгалыг зохицуулдаг. Оролтын хаалга, мартах хаалга, гаралтын хаалга нь гурван хаалга юм.

Оролтын хаалга нь санах ойн нүд рүү өгөгдлийн урсгалыг, мартах хаалга нь нүднээсээ өгөгдлийг устгахыг, гаралтын хаалга нь нүднээс гарах мэдээллийн урсгалыг зохицуулдаг.

Тэдний ач холбогдол юу вэ?

LSTM сүлжээ нь урт хугацааны харилцаатай өгөгдлийн дарааллыг амжилттай төлөөлж, урьдчилан таамаглаж чаддаг тул ашигтай байдаг. Тэд өмнөх оролтын талаарх мэдээллийг бүртгэж, хадгалах боломжтой бөгөөд ингэснээр ирээдүйн оролтын талаар илүү үнэн зөв таамаглал гаргах боломжтой болно.

Яриа таних, гар бичмэлийг таних, байгалийн хэлээр боловсруулах, зургийн тайлбар бичих зэрэг нь LSTM сүлжээг ашигласан цөөн хэдэн программ юм.

Lstm 1

Бид LSTM сүлжээг хаана ашигладаг вэ?

Олон программ хангамж, технологийн програмууд нь яриа таних систем, байгалийн хэл боловсруулах хэрэгслүүд зэрэг LSTM сүлжээг ашигладаг. сэтгэл хөдлөлийн шинжилгээ, машин орчуулгын систем, текст болон зураг үүсгэх системүүд.

Эдгээрийг автомат жолоодлоготой машин, робот бүтээхэд, түүнчлэн санхүүгийн салбарт залилан мэхлэх гэмт хэргийг илрүүлэх, урьдчилан таамаглах зорилгоор ашигласан. хувьцааны зах зээл хөдөлгөөн.

3. Үүсгэх сөрөг сүлжээнүүд (GANs)

GAN нь a гүн гүнзгий суралцах Өгөгдсөн өгөгдлийн багцтай төстэй шинэ өгөгдлийн дээжийг бий болгоход ашигладаг техник. GAN нь хоёроос бүрдэнэ мэдрэлийн сүлжээ: нэг нь шинэ дээж гаргаж сурдаг, нөгөө нь жинхэнэ болон үүссэн дээжийг ялгаж сурдаг.

Үүнтэй төстэй арга барилаар генератор нь бодит байдлаас ялгагдахааргүй дээжийг үүсгэх хүртэл эдгээр хоёр сүлжээг хамтад нь сургадаг.

Бид яагаад GAN ашигладаг вэ?

GAN нь өндөр чанартай бүтээгдэхүүн үйлдвэрлэх хүчин чадлаараа чухал ач холбогдолтой юм синтетик өгөгдөл Энэ нь зураг, видео үйлдвэрлэх, текст үүсгэх, тэр ч байтугай хөгжим үүсгэх зэрэг төрөл бүрийн хэрэглээнд ашиглагдаж болно.

GAN-г мөн өгөгдлийг нэмэгдүүлэхэд ашигласан бөгөөд энэ нь үүсэлтэй синтетик өгөгдөл бодит мэдээллийг нөхөж, машин сургалтын загваруудын гүйцэтгэлийг сайжруулах.

Цаашилбал, загваруудыг сургах, туршилтыг дуурайхад ашиглаж болох синтетик өгөгдлийг бий болгосноор GANs нь анагаах ухаан, эмийн хөгжил зэрэг салбарыг өөрчлөх боломжтой юм.

Ганс 1

GAN-ийн хэрэглээ

GAN нь өгөгдлийн багцыг нөхөж, шинэ зураг, кино бүтээх, тэр ч байтугай шинжлэх ухааны загварчлалд зориулж синтетик өгөгдөл үүсгэх боломжтой. Цаашилбал, GAN нь зугаа цэнгэлээс эхлээд анагаах ухаан хүртэлх төрөл бүрийн хэрэглээнд ажиллах боломжтой.

нас, видео. Жишээлбэл, NVIDIA-ийн StyleGAN2 нь алдартнуудын өндөр чанартай гэрэл зураг, урлагийн бүтээлүүдийг бүтээхэд хэрэглэгддэг.

4. Гүн итгэл үнэмшлийн сүлжээ (DBNs)

Гүн итгэл үнэмшлийн сүлжээ (DBNs) нь хиймэл оюун өгөгдлийн хэв маягийг олж сурах боломжтой системүүд. Тэд өгөгдлүүдийг жижиг, жижиг хэсгүүдэд хувааж, түвшин тус бүр дээр илүү нарийн ойлголттой болох замаар үүнийг хийдэг.

DBN нь өгөгдлөөс юу болохыг мэдэгдэхгүйгээр суралцаж болно (үүнийг "хяналтгүй сургалт" гэж нэрлэдэг). Энэ нь тухайн хүнд танихад хэцүү эсвэл боломжгүй өгөгдлийн хэв маягийг илрүүлэхэд маш үнэ цэнэтэй болгодог.

DBN-ийг юу чухал болгодог вэ?

DBN нь шаталсан өгөгдлийн дүрслэлийг сурах чадвартай тул чухал ач холбогдолтой. Эдгээр дүрслэлийг ангилал, гажиг илрүүлэх, хэмжээсийг багасгах гэх мэт төрөл бүрийн хэрэглээнд ашиглаж болно.

DBN-ийн хяналтгүй урьдчилсан сургалт явуулах чадавхи нь хамгийн бага шошготой өгөгдөл бүхий гүнзгий сургалтын загваруудын гүйцэтгэлийг нэмэгдүүлэх боломжтой юм.

Токен 1 4

DBN-ийн хэрэглээ юу вэ?

Хамгийн чухал хэрэглээний нэг нь объект илрүүлэх, үүнд DBN-г онгоц, шувуу, хүн гэх мэт тодорхой төрлийн зүйлийг танихад ашигладаг. Эдгээрийг мөн дүрс үүсгэх, ангилах, киноны хөдөлгөөнийг илрүүлэх, дуу хоолойг боловсруулахад байгалийн хэлээр ойлгоход ашигладаг.

Цаашилбал, DBN-ийг хүний байршлыг үнэлэхийн тулд мэдээллийн багцад ихэвчлэн ашигладаг. DBN нь эрүүл мэнд, банк санхүү, технологи зэрэг олон төрлийн салбаруудад зориулсан гайхалтай хэрэгсэл юм.

5. Гүн гүнзгийрүүлэх сургалтын сүлжээ (DRLs)

Deep Бататгах сургалт Сүлжээ (DRLs) нь гүнзгий мэдрэлийн сүлжээг бэхжүүлэх сургалтын арга техниктэй нэгтгэж, агентуудад туршилт, алдааны тусламжтайгаар төвөгтэй орчинд суралцах боломжийг олгодог.

DRL нь агентуудад хүрээлэн буй орчинтойгоо харилцаж, алдаанаасаа суралцах замаар шагналын дохиог хэрхэн оновчтой болгохыг заахад ашиглагддаг.

Тэднийг юу гайхалтай болгодог вэ?

Эдгээрийг тоглоом, робот техник, бие даасан жолоодлого зэрэг олон төрлийн хэрэглээнд үр дүнтэй ашиглаж ирсэн. DRL нь мэдрэхүйн эх сурвалжаас шууд суралцаж, агентуудад хүрээлэн буй орчинтойгоо харьцахдаа үндэслэн шийдвэр гаргах боломжийг олгодог учраас чухал юм.

Чухал програмууд

DRL нь хэцүү асуудлыг шийдэж чаддаг тул бодит нөхцөл байдалд ажилладаг.

DRL нь OpenAI-ийн биеийн тамирын заал зэрэг хэд хэдэн алдартай програм хангамж, технологийн платформд багтсан болно. Unity-ийн ML-агентууд, болон Google-ийн DeepMind Lab. AlphaGo, Google-ийн бүтээсэн Deepmindжишээлбэл, Go тоглоомыг дэлхийн аваргын түвшинд тоглохын тулд DRL ажиллуулдаг.

Альфаго

DRL-ийн өөр нэг хэрэглээ нь робот техникт байдаг бөгөөд энэ нь роботын гарны хөдөлгөөнийг удирдахад ашигладаг зүйл юм шүүрэх, блокуудыг овоолох зэрэг ажлыг гүйцэтгэхэд ашиглагддаг. DRL нь олон төрлийн хэрэглээтэй бөгөөд хэрэгтэй хэрэгсэл юм сурах агентууд нарийн төвөгтэй нөхцөлд шийдвэр гаргах.

6. Автомат кодлогч

Автомат кодлогч нь сонирхолтой төрөл юм мэдрэлийн сүлжээ Энэ нь эрдэмтэд болон өгөгдөл судлаачдын сонирхлыг татсан. Эдгээр нь үндсэндээ өгөгдлийг хэрхэн шахаж, сэргээх талаар сурах зорилготой юм.

Оролтын өгөгдөл нь оролтын болон гаралтын давхаргуудаас цөөн тооны зангилаа бүхий гацах давхарга болгон шахах хүртэл өгөгдлийн хэмжээсийг аажмаар бууруулдаг давхаргуудын дарааллаар тэжээгддэг.

Энэхүү шахсан дүрслэлийг дараа нь өгөгдлийн хэмжээст байдлыг анхны хэлбэрт нь аажмаар нэмэгдүүлэх давхаргын дарааллыг ашиглан анхны оролтын өгөгдлийг дахин бүтээхэд ашигладаг.

Энэ нь яагаад чухал вэ?

Автомат кодлогч нь чухал бүрэлдэхүүн хэсэг юм гүн гүнзгий суралцах Учир нь тэдгээр нь шинж чанарыг задлах, өгөгдлийг багасгах боломжтой болгодог.

Тэд ирж буй өгөгдлийн гол элементүүдийг тодорхойлж, тэдгээрийг шахсан хэлбэрт хөрвүүлэн ангилах, бүлэглэх, шинэ өгөгдөл үүсгэх зэрэг бусад ажлуудад ашиглах боломжтой.

Компьютерийн харааны систем

Бид автомат кодлогчийг хаана ашигладаг вэ?

Аномали илрүүлэх, байгалийн хэлний боловсруулалт ба компьютерийн алсын хараа Эдгээр нь автомат кодлогчийг ашигладаг цөөн хэдэн салбар юм. Жишээлбэл, автомат кодлогчийг компьютерийн хараанд дүрсийг шахах, дүрсийг арилгах, зургийн синтез хийхэд ашиглаж болно.

Бид Autoencoder-ийг текст үүсгэх, текстийг ангилах, байгалийн хэлээр боловсруулахад текстийг нэгтгэн дүгнэх зэрэг ажлуудад ашиглаж болно. Энэ нь гажиг тодорхойлох нормоос гажсан өгөгдөл дэх хэвийн бус үйл ажиллагааг тодорхойлох боломжтой.

7. Капсул сүлжээ

Capsule Networks нь Convolutional Neural Networks (CNN)-ийг орлуулах зорилгоор боловсруулсан гүн гүнзгий сургалтын шинэ архитектур юм.

Капсул сүлжээ нь зураг дээрх тодорхой зүйл байгаа эсэхийг таних, чиг баримжаа, байрлал зэрэг шинж чанаруудыг нь гаралтын вектор болгон кодлох үүрэгтэй капсул гэж нэрлэгддэг тархины нэгжүүдийг бүлэглэх ойлголт дээр суурилдаг. Тиймээс капсул сүлжээ нь орон зайн харилцан үйлчлэл, хэтийн төлөвийн хэлбэлзлийг CNN-ээс илүү сайн удирдаж чаддаг.

Бид яагаад CNN-ээс илүү капсул сүлжээг сонгодог вэ?

Капсул сүлжээ нь зураг дээрх зүйлсийн хоорондын шаталсан харилцааг олж тогтооход CNN-ийн бэрхшээлийг даван туулж чаддаг тул ашигтай байдаг. CNN нь янз бүрийн хэмжээтэй зүйлсийг таньж чаддаг ч эдгээр зүйлс хоорондоо хэрхэн холбогдож байгааг ойлгоход хэцүү байдаг.

Нөгөөтэйгүүр, капсул сүлжээ нь аливаа зүйл, тэдгээрийн хэсгүүдийг таньж сурахаас гадна тэдгээрийг зураг дээр орон зайн байдлаар хэрхэн байрлуулж байгааг мэдэж, компьютерийн харааны хэрэглээний программуудад өрсөлдөх чадвартай болгодог.

Хэрэглээний талбарууд

Capsule Networks нь зургийн ангилал, объектыг таних, зургийн сегментчилэл зэрэг олон төрлийн хэрэглээнд ирээдүйтэй үр дүнг аль хэдийн харуулсан.

Эмнэлгийн зураг дээрх зүйлсийг ялгах, кинон дээрх хүмүүсийг таних, 3D зургаас 2D загвар бүтээхэд ашигладаг.

Тэдний гүйцэтгэлийг нэмэгдүүлэхийн тулд Capsule Networks-ийг Generative Adversarial Networks (GANs) болон Variational Autoencoders (VAEs) зэрэг бусад гүнзгий сургалтын архитектуруудтай хослуулсан. Капсул сүлжээ нь гүнзгий суралцах шинжлэх ухаан хөгжихийн хэрээр компьютерийн харааны технологийг сайжруулахад улам чухал үүрэг гүйцэтгэх болно гэж таамаглаж байна.

НиБабаел

Жишээлбэл; Нибабел нь мэдрэлийн дүрслэлийн файлын төрлийг уншиж бичих алдартай Python хэрэгсэл юм. Зургийн сегментчиллийн хувьд капсул сүлжээг ашигладаг.

8. Анхаарал дээр суурилсан загварууд

Анхаарал дээр суурилсан загвар гэж нэрлэгддэг, мөн анхаарлын механизм гэгддэг гүнзгий суралцах загварууд нь мэдээллийн нарийвчлалыг нэмэгдүүлэхийг хичээдэг. машин сургалтын загварууд. Эдгээр загварууд нь ирж буй өгөгдлийн тодорхой шинж чанарууд дээр төвлөрч ажилладаг бөгөөд ингэснээр илүү үр дүнтэй, үр дүнтэй боловсруулалт хийдэг.

Машины орчуулга, мэдрэмжийн шинжилгээ зэрэг байгалийн хэлийг боловсруулах даалгавруудад анхаарал хандуулах аргууд нэлээд амжилттай болох нь харагдаж байна.

Тэдний ач холбогдол юу вэ?

Анхаарал дээр суурилсан загварууд нь нарийн төвөгтэй өгөгдлийг илүү үр дүнтэй, үр дүнтэй боловсруулах боломжийг олгодог тул ашигтай байдаг.

Уламжлалт мэдрэлийн сүлжээ Бүх оролтын өгөгдлийг адилхан чухал гэж үнэлдэг бөгөөд ингэснээр боловсруулалт удааширч, нарийвчлал буурдаг. Анхаарал татах үйл явц нь оролтын өгөгдлийн чухал тал дээр төвлөрч, илүү хурдан бөгөөд үнэн зөв таамаглал гаргах боломжийг олгодог.

Ашиглалтын талбарууд

Хиймэл оюун ухааны салбарт анхаарал хандуулах механизмууд нь байгалийн хэл боловсруулах, зураг, дууг таних, тэр ч байтугай жолоочгүй тээврийн хэрэгсэл зэрэг өргөн хүрээний хэрэглээтэй байдаг.

Жишээлбэл, анхаарал хандуулах аргууд нь тухайн контекст чухал ач холбогдолтой зарим үг, хэллэгт анхаарлаа төвлөрүүлэх боломжийг системд олгох замаар байгалийн хэлний боловсруулалт дахь машины орчуулгыг сайжруулахад ашиглаж болно.

Автономит машинд анхаарал хандуулах аргыг системд хүрээлэн буй орчны зарим зүйл эсвэл сорилтод анхаарлаа төвлөрүүлэхэд туслах зорилгоор ашиглаж болно.

9. Трансформаторын сүлжээ

Трансформаторын сүлжээ нь өгөгдлийн дарааллыг судалж, гаргадаг гүнзгий суралцах загварууд юм. Эдгээр нь оролтын дарааллыг нэг удаад нэг элементээр боловсруулж, ижил эсвэл өөр урттай гаралтын дарааллыг гаргах замаар ажилладаг.

Трансформаторын сүлжээнүүд нь стандарт дараалал хоорондын загвараас ялгаатай нь давтагдах мэдрэлийн сүлжээ (RNN) ашиглан дарааллыг боловсруулдаггүй. Үүний оронд тэд дарааллын хэсгүүдийн хоорондын холбоосыг сурахын тулд өөртөө анхаарал хандуулах үйл явцыг ашигладаг.

Трансформаторын сүлжээний ач холбогдол юу вэ?

Трансформаторын сүлжээнүүд нь сүүлийн жилүүдэд байгалийн хэлээр боловсруулах ажилд илүү сайн ажилласны үр дүнд түгээмэл болж байна.

Эдгээр нь ялангуяа хэлний орчуулга, текстийг нэгтгэн дүгнэх, харилцан яриа үүсгэх зэрэг текст бүтээх ажилд маш тохиромжтой.

Трансформаторын сүлжээнүүд нь RNN-д суурилсан загваруудаас хамаагүй илүү үр ашигтай байдаг тул том хэмжээний хэрэглээнд илүү тохиромжтой сонголт болдог.

Компьютерийн харааны систем 2

Трансформаторын сүлжээг хаанаас олох вэ?

Трансформаторын сүлжээг өргөн хүрээний хэрэглээнд, ялангуяа байгалийн хэлээр боловсруулахад өргөн ашигладаг.

GPT (Generative Pre-trained Transformer) цуврал нь хэлний орчуулга, текстийг нэгтгэн дүгнэх, чатбот үүсгэх зэрэг ажлуудад ашиглагдаж ирсэн алдартай трансформаторт суурилсан загвар юм.

BERT (Transformers-ийн хоёр чиглэлтэй кодлогчийн төлөөлөл) нь асуултанд хариулах, сэтгэл хөдлөлийн дүн шинжилгээ хийх зэрэг байгалийн хэлийг ойлгоход ашигладаг өөр нэг нийтлэг трансформаторт суурилсан загвар юм.

аль аль нь GPT болон BERT-тай хамт бүтээгдсэн ПиТорч, Трансформаторт суурилсан загваруудыг хөгжүүлэхэд түгээмэл болсон нээлттэй эхийн гүнзгий сургалтын тогтолцоо.

10. Хязгаарлагдмал Больцман машинууд (RBMs)

Хязгаарлагдмал Больцман машинууд (RBMs) нь генерацийн хэлбэрээр суралцдаг нэг төрлийн хяналтгүй мэдрэлийн сүлжээ юм. Өндөр хэмжээст өгөгдлөөс чухал шинж чанаруудыг сурч, гаргаж авах чадвартай тул тэдгээрийг машин сургалтын болон гүнзгий сургалтын салбарт өргөнөөр ашигладаг.

RBM нь харагдах ба далд хоёр давхаргаас бүрдэх бөгөөд давхарга бүр нь жинтэй ирмэгээр холбогдсон мэдрэлийн эсүүдээс бүрддэг. RBM нь оролтын өгөгдлийг тодорхойлсон магадлалын хуваарилалтыг сурахад зориулагдсан.

Хязгаарлагдмал Больцман машин гэж юу вэ?

RBM нь generative сургалтын стратегийг ашигладаг. RBM-д харагдах давхарга нь оролтын өгөгдлийг тусгадаг бол булсан давхарга нь оролтын өгөгдлийн шинж чанарыг кодлодог. Үзэгдэх ба далд давхаргын жин нь тэдгээрийн холбоосын хүчийг харуулдаг.

RBM нь сургалтын явцад давхрагын хоорондох жин ба хэвийлтийг ялгаатай ялгаа гэж нэрлэдэг техникийг ашиглан тохируулдаг. Ялгаатай ялгаа нь загварын таамаглах магадлалыг дээд зэргээр нэмэгдүүлдэг хараа хяналтгүй сургалтын стратеги юм.

Хязгаарлагдмал Больцман машинуудын ач холбогдол юу вэ?

RBM нь чухал ач холбогдолтой машин суралцах мөн их хэмжээний өгөгдлөөс холбогдох шинж чанаруудыг сурч, гаргаж чаддаг учраас гүнзгий суралцах боломжтой.

Эдгээр нь зураг болон яриа танихад маш үр дүнтэй бөгөөд зөвлөмж өгөх систем, гажиг илрүүлэх, хэмжээсийг багасгах гэх мэт олон төрлийн хэрэглээнд ашиглагдаж ирсэн. RBMs нь асар том өгөгдлийн багцаас хэв маягийг олж чаддаг бөгөөд ингэснээр дээд зэргийн таамаглал, ойлголтыг бий болгодог.

Хязгаарлагдмал Boltzmann Machines RBMs

Хязгаарлагдмал Больцман машиныг хаана ашиглаж болох вэ?

RBM-ийн хэрэглээнд хэмжээстийг багасгах, гажиг илрүүлэх, зөвлөмж өгөх систем орно. RBM нь сэтгэл хөдлөлийн шинжилгээнд ялангуяа тустай байдаг сэдвийн загварчлал байгалийн хэлний боловсруулалтын хүрээнд.

Гүн итгэлийн сүлжээ, дуу хоолой, дүрсийг танихад ашигладаг мэдрэлийн сүлжээ нь мөн RBM ашигладаг. Гүн итгэл үнэмшлийн сүлжээний хэрэгслийн хайрцаг, TensorFlowБолон Теано Эдгээр нь RBM ашигладаг програм хангамж эсвэл технологийн зарим жишээ юм.

Дуусгах

Гүн сургалтын загварууд нь яриа таних, байгалийн хэлийг боловсруулах, компьютерийн хараа зэрэг төрөл бүрийн салбарт улам бүр чухал болж байна.

Convolutional Neural Networks (CNNs) болон Recurrent Neural Networks (RNNs) нь хамгийн их амлалтыг харуулсан бөгөөд олон хэрэглээнд өргөн хэрэглэгддэг боловч гүнзгий суралцах бүх загварууд нь давуу болон сул талуудтай байдаг.

Гэсэн хэдий ч судлаачид Хязгаарлагдмал Больцман машинууд (RBMs) болон бусад төрлийн Deep Learning загваруудыг судалж байна, учир нь тэдгээр нь бас онцгой давуу талтай байдаг.

Хүнд хэцүү асуудлуудыг шийдвэрлэхийн тулд гүнзгий суралцах чиглэл үргэлжлэн хөгжиж байгаа тул шинэ, бүтээлч загварууд бий болно гэж найдаж байна.