Гарчиг[Нуух][Үзүүлэх]
- 1. Гүн суралцах гэж яг юу вэ?
- 2. Гүнзгий суралцах нь машин сургалтаас юугаараа ялгаатай вэ?
- 3. Та мэдрэлийн сүлжээний талаар ямар ойлголттой байна вэ?
- 4. Перцептрон гэж яг юу вэ?
- 5. Гүн мэдрэлийн сүлжээ гэж яг юу вэ?
- 6. Олон давхаргат перцептрон (MLP) гэж яг юу вэ?
- 7. Мэдрэлийн сүлжээнд идэвхжүүлэх функцууд ямар зорилгоор ажилладаг вэ?
- 8. Градиент уналт гэж яг юу вэ?
- 9. Зардлын функц нь яг юу вэ?
- 10. Гүн сүлжээ нь гүехэн сүлжээнээс хэрхэн илүү сайн ажиллах вэ?
- 11. Урагшаа тархалтыг тайлбарла.
- 12. Буцах тархалт гэж юу вэ?
- 13. Гүнзгий сургалтын хүрээнд градиент хайчилбарыг хэрхэн ойлгох вэ?
- 14. Softmax болон ReLU функцууд юу вэ?
- 15. Мэдрэлийн сүлжээний загварыг бүх жинг 0 болгож сургаж чадах уу?
- 16. Эрин үеийг багц болон давталтаас юугаараа ялгадаг вэ?
- 17. Багцыг хэвийн болгох ба завсарлага гэж юу вэ?
- 18. Стохастик градиент удмыг багцын градиент удмаас юу ялгадаг вэ?
- 19. Мэдрэлийн сүлжээнд шугаман бус байдлыг оруулах нь яагаад чухал вэ?
- 20. Гүнзгий суралцахад тензор гэж юу вэ?
- 21. Та гүнзгий суралцах загварын идэвхжүүлэх функцийг хэрхэн сонгох вэ?
- 22. CNN гэж юуг хэлээд байна вэ?
- 23. CNN-ийн олон давхарга гэж юу вэ?
- 24. Хэт болон дутуу зохицох нь ямар үр дагавартай вэ, та үүнээс хэрхэн зайлсхийх вэ?
- 25. Гүнзгий суралцахад RNN гэж юу вэ?
- 26. Adam Optimizer-ийг тайлбарла
- 27. Гүн автокодерууд: тэдгээр нь юу вэ?
- 28. Тензор урсгал дахь тензор гэдэг нь юу гэсэн үг вэ?
- 29. Тооцооллын графикийн тайлбар
- 30. Генератив өрсөлдөгчийн сүлжээ (GANs): тэдгээр нь юу вэ?
- 31. Архитектурыг төлөвлөхдөө мэдрэлийн сүлжээнд оруулах мэдрэлийн эсүүд болон далд давхаргын тоог хэрхэн сонгох вэ?
- 32. Гүн гүнзгийрүүлэх сургалтанд ямар төрлийн мэдрэлийн сүлжээг ашигладаг вэ?
- Дүгнэлт
Гүнзгий суралцах нь цоо шинэ санаа биш юм. Хиймэл мэдрэлийн сүлжээ нь гүн гүнзгий суралцах гэж нэрлэгддэг машин сургалтын дэд бүлгийн цорын ганц үндэс суурь болдог.
Гүнзгий суралцах нь хүний тархийг дуурайх зорилгоор бүтээгдсэн мэдрэлийн сүлжээтэй адил хүний тархийг дуурайдаг.
Хэсэг хугацааны турш ийм зүйл байсан. Өнөөгийнх шиг боловсруулах чадвар, өгөгдөл бараг байхгүй тул энэ өдрүүдэд хүн бүр энэ тухай ярьж байна.
Сүүлийн 20 жилийн хугацаанд боловсруулах хүчин чадал эрс нэмэгдсэний үр дүнд гүн гүнзгий суралцах болон машин сургалт бий болсон.
Мөрөөдлийн ажлаа хайж байхдаа тулгарч болох аливаа асуултад бэлдэхэд тань туслах үүднээс энэхүү нийтлэл нь энгийнээс эхлээд төвөгтэй хүртэл гүнзгийрүүлэн суралцах ярилцлагын хэд хэдэн асуултанд хөтлөх болно.
1. Гүн суралцах гэж яг юу вэ?
Хэрэв та оролцох бол а гүн гүнзгий суралцах ярилцлагын үеэр та гүнзгий суралцах гэж юу болохыг ойлгосон нь дамжиггүй. Гэсэн хэдий ч ярилцлага авагч таныг энэ асуултын хариуд тайлбарын хамт дэлгэрэнгүй хариулт өгөхийг хүлээж байна.
Бэлтгэл хийхийн тулд мэдрэлийн сүлжээ гүнзгий суралцахын тулд зохион байгуулалттай эсвэл бүтэцгүй их хэмжээний өгөгдлийг ашиглах ёстой. Далд хэв маяг, шинж чанарыг олохын тулд нарийн төвөгтэй процедурыг (жишээлбэл, муурны дүр төрхийг нохойноос ялгах) хийдэг.
2. Гүнзгий суралцах нь машин сургалтаас юугаараа ялгаатай вэ?
Машины сургалт гэж нэрлэгддэг хиймэл оюун ухааны нэг салбар болохын хувьд бид компьютерийг өгөгдөл, статистик болон алгоритмын аргуудыг ашиглан сургаж, цаг хугацаа өнгөрөх тусам сайжирдаг.
Нэг талдаа машин суралцах, гүнзгий суралцах нь хүний тархинд харагддаг мэдрэлийн сүлжээний архитектурыг дуурайдаг.
3. Та мэдрэлийн сүлжээний талаар ямар ойлголттой байна вэ?
Мэдрэлийн сүлжээ гэж нэрлэгддэг хиймэл системүүд нь хүний биед байдаг органик мэдрэлийн сүлжээнүүдтэй маш төстэй байдаг.
-тэй төстэй техникийг ашиглах хүний тархи Мэдрэлийн сүлжээ нь өгөгдлийн үндсэн хамаарлыг тодорхойлох зорилготой алгоритмуудын цуглуулга юм.
Эдгээр системүүд нь даалгаврын тусгай дүрмийг дагаж мөрдөхөөс илүүтэйгээр олон тооны өгөгдлийн багц болон жишээн дээр өөрсдийгөө харуулах замаар даалгаврын тусгай мэдлэгийг олж авдаг.
Уг санаа нь эдгээр өгөгдлийн багцын талаар урьдчилан програмчлагдсан ойлголттой байхын оронд систем нь тэжээгддэг өгөгдлөөсөө ялгах шинж чанаруудыг сурдаг.
Мэдрэлийн сүлжээнд хамгийн түгээмэл хэрэглэгддэг гурван сүлжээний давхарга нь дараах байдалтай байна.
- Оролтын давхарга
- Нуугдсан давхарга
- Гаралтын давхарга
4. Перцептрон гэж яг юу вэ?
Хүний тархинд олдсон биологийн нейрон нь перцептронтой адил юм. Перцептрон нь олон тооны оролтыг хүлээн авдаг бөгөөд дараа нь олон тооны хувиргалт, функцүүдийг гүйцэтгэж, гаралт үүсгэдэг.
Хоёртын ангилалд перцептрон гэж нэрлэгддэг шугаман загварыг ашигладаг. Энэ нь янз бүрийн оролт бүхий нейроныг дуурайдаг бөгөөд тус бүр нь өөр жинтэй байдаг.
Нейрон нь эдгээр жинтэй оролтуудыг ашиглан функцийг тооцоолж, үр дүнг гаргадаг.
5. Гүн мэдрэлийн сүлжээ гэж яг юу вэ?
Гүн мэдрэлийн сүлжээ нь оролт, гаралтын давхаргууд (DNN) хооронд хэд хэдэн давхаргатай хиймэл мэдрэлийн сүлжээ (ANN) юм.
Гүн мэдрэлийн сүлжээ нь гүн архитектурын мэдрэлийн сүлжээ юм. "Гүн" гэдэг үг нь нэг давхаргад олон түвшин, нэгж бүхий функцуудыг хэлдэг. Илүү өндөр түвшний хэв маягийг авахын тулд илүү их, том давхаргууд нэмснээр илүү нарийвчлалтай загваруудыг үүсгэж болно.
6. Олон давхаргат перцептрон (MLP) гэж яг юу вэ?
Оролтын, далд, гаралтын давхаргууд нь мэдрэлийн сүлжээнүүдийн нэгэн адил MLP-д байдаг. Энэ нь нэг буюу хэд хэдэн далд давхарга бүхий нэг давхаргат перцептронтой төстэй байдлаар бүтээгдсэн.
Нэг давхаргын перцептроны хоёртын гаралт нь зөвхөн шугаман салж болох ангиллыг (0,1) ангилж чаддаг бол MLP нь шугаман бус ангиллыг ангилж чаддаг.
7. Мэдрэлийн сүлжээнд идэвхжүүлэх функцууд ямар зорилгоор ажилладаг вэ?
Идэвхжүүлэх функц нь нейрон хамгийн үндсэн түвшинд идэвхжих эсэхийг тодорхойлдог. Ямар ч идэвхжүүлэх функц нь оролтын жигнэсэн нийлбэр болон хэвийсэн утгыг оролт болгон хүлээн авах боломжтой. Идэвхжүүлэх функцууд нь алхамын функц, Sigmoid, ReLU, Tanh, Softmax зэрэг орно.
8. Градиент уналт гэж яг юу вэ?
Зардлын функц эсвэл алдааг багасгах хамгийн сайн арга бол градиент уналт юм. Функцийн локал-глобал минимумыг олох нь зорилго юм. Энэ нь алдааг багасгахын тулд загвар дагаж мөрдөх замыг зааж өгдөг.
9. Зардлын функц нь яг юу вэ?
Зардлын функц нь таны загвар хэр сайн ажиллаж байгааг үнэлэх хэмжүүр юм; Үүнийг заримдаа "алдагдал" эсвэл "алдаа" гэж нэрлэдэг. Буцах тархалтын үед гаралтын давхаргын алдааг тооцоолоход ашигладаг.
Бид энэ алдааг ашиглан мэдрэлийн сүлжээний сургалтын үйл явцыг мэдрэлийн сүлжээгээр буцааж түлхэж өгдөг.
10. Гүн сүлжээ нь гүехэн сүлжээнээс хэрхэн илүү сайн ажиллах вэ?
Оролтын болон гаралтын давхаргаас гадна далд давхаргууд нь мэдрэлийн сүлжээнд нэмэгддэг. Оролт ба гаралтын давхаргын хооронд гүехэн мэдрэлийн сүлжээ нь нэг далд давхаргыг ашигладаг бол гүн мэдрэлийн сүлжээ нь олон түвшнийг ашигладаг.
Гүехэн сүлжээ нь ямар ч функцэд тохирохын тулд хэд хэдэн параметрүүдийг шаарддаг. Гүн сүлжээнүүд нь хэд хэдэн давхаргыг агуулдаг тул цөөн тооны параметртэй ч гэсэн функцүүдэд илүү сайн тохирох боломжтой.
Хэл яриа, зураг таних гэх мэт ямар ч төрлийн өгөгдлийн загварчлалтай ажиллах олон талт шинж чанартай тул гүн сүлжээг одоо илүүд үздэг.
11. Урагшаа тархалтыг тайлбарла.
Оролтыг туухайны хамт булсан давхарга руу дамжуулж, дамжуулах тархалт гэж нэрлэдэг.
Идэвхжүүлэх функцийн гаралтыг дараагийн давхаргад боловсруулахаас өмнө булсан давхарга бүрт тооцдог.
Процесс нь оролтын давхаргаас эхэлж эцсийн гаралтын давхаргад шилжинэ, ингэснээр урагш тархах гэж нэрлэнэ.
12. Буцах тархалт гэж юу вэ?
Мэдрэлийн сүлжээнд жин ба хазайлтыг тохируулах үед үнэ цэнэ хэрхэн өөрчлөгдөж байгааг ажиглах замаар зардлын функцийг бууруулахын тулд буцах тархалтыг ашигладаг.
Далд давхарга бүрийн градиентийг ойлгох нь энэ өөрчлөлтийг тооцоолоход хялбар болгодог.
Буцах тархалт гэж нэрлэгддэг процесс нь гаралтын давхаргаас эхэлж, оролтын давхарга руу буцаж шилждэг.
13. Гүнзгий сургалтын хүрээнд градиент хайчилбарыг хэрхэн ойлгох вэ?
Gradient Clipping нь буцаан тархалтын үед үүсдэг тэсрэх градиент (цаг хугацааны явцад ихээхэн буруу градиент хуримтлагдаж, сургалтын явцад мэдрэлийн сүлжээний загварын жинд мэдэгдэхүйц өөрчлөлт оруулах нөхцөл) асуудлыг шийдвэрлэх арга юм.
Тэсрэх градиент нь сургалтын явцад градиент хэт том болж загварыг тогтворгүй болгоход үүсдэг асуудал юм. Хэрэв градиент хүлээгдэж буй мужийг давсан бол градиент утгуудыг элемент тус бүрээр нь урьдчилан тодорхойлсон хамгийн бага эсвэл дээд утга руу шилжүүлнэ.
Градиент хайчилбар нь сургалтын явцад мэдрэлийн сүлжээний тоон тогтвортой байдлыг сайжруулдаг боловч энэ нь загварын гүйцэтгэлд хамгийн бага нөлөө үзүүлдэг.
14. Softmax болон ReLU функцууд юу вэ?
Softmax нэртэй идэвхжүүлэх функц нь 0-ээс 1-ийн хооронд гаралт үүсгэдэг. Гаралт бүрийг бүх гаралтын нийлбэр нь нэг байхаар хуваадаг. Гаралтын давхаргын хувьд Softmax-ийг ихэвчлэн ашигладаг.
Шулуутгагдсан шугаман нэгж, заримдаа ReLU гэгддэг бөгөөд хамгийн их ашиглагддаг идэвхжүүлэх функц юм. Хэрэв X эерэг байвал X гарна, үгүй бол тэг гарна. ReLU нь булсан давхаргад тогтмол хэрэглэдэг.
15. Мэдрэлийн сүлжээний загварыг бүх жинг 0 болгож сургаж чадах уу?
Мэдрэлийн сүлжээ хэзээ ч өгөгдсөн ажлыг дуусгаж сурахгүй тул бүх жинг 0 болгож загварчлах боломжгүй.
Хэрэв бүх жинг тэг болгож эхлүүлбэл W [1] дэх жин бүрд деривативууд ижил хэвээр байх бөгөөд энэ нь нейронууд давталттайгаар ижил шинж чанаруудыг сурахад хүргэдэг.
Жинг зүгээр л 0-ээр эхлүүлээд зогсохгүй аливаа тогтмол хэлбэрт оруулах нь доод түвшний үр дүнд хүргэх магадлалтай.
16. Эрин үеийг багц болон давталтаас юугаараа ялгадаг вэ?
Мэдээллийн багц боловсруулах янз бүрийн хэлбэрүүд болон градиент удмын техникт багц, давталт, эрин үе орно. Эрин үе нь урагш болон хойшоо чиглэсэн бүрэн мэдээллийн багц бүхий мэдрэлийн сүлжээгээр нэг удаа дамждаг.
Найдвартай үр дүнг гаргахын тулд өгөгдлийн багц нь нэг оролдлогоор дамжихад хэтэрхий том тул хэд хэдэн удаа дамждаг.
Мэдрэлийн сүлжээгээр бага хэмжээний өгөгдлүүдийг дахин дахин ажиллуулах энэ практикийг давталт гэж нэрлэдэг. Өгөгдлийн багц нь мэдрэлийн сүлжээг амжилттай даван туулахын тулд үүнийг багц гэж нэрлэдэг хэд хэдэн багц эсвэл дэд бүлэгт хувааж болно.
Мэдээлэл цуглуулах хэмжээнээс хамааран эрин үе, давталт, багцын хэмжээ гэсэн гурван арга нь үндсэндээ мэдээллийг ашиглах арга замууд юм. градиент буурах алгоритм.
17. Багцыг хэвийн болгох ба завсарлага гэж юу вэ?
Dropout нь харагдах ба далд сүлжээний нэгжүүдийг (ихэвчлэн зангилааны 20 хувийг хасдаг) санамсаргүй байдлаар устгаснаар өгөгдлийг хэт тохируулахаас сэргийлдэг. Энэ нь сүлжээг нэгтгэхэд шаардагдах давталтын тоог хоёр дахин нэмэгдүүлдэг.
Давхарга тус бүрийн оролтыг хэвийн болгох замаар дундаж гаралтын идэвхжилтийг тэг, стандарт хазайлтыг нэг болгохын тулд багц хэвийн болгох нь мэдрэлийн сүлжээний гүйцэтгэл, тогтвортой байдлыг сайжруулах стратеги юм.
18. Стохастик градиент удмыг багцын градиент удмаас юу ялгадаг вэ?
Багцын градиент буурах:
- Багцын градиентийн градиентийг бүтээхэд бүрэн өгөгдлийн багцыг ашигладаг.
- Асар их хэмжээний өгөгдөл, аажмаар шинэчлэгдэж буй жин нь нийлэлтийг хэцүү болгодог.
Стохастик градиент уналт:
- Стохастик градиент нь градиентыг тооцоолохдоо нэг дээжийг ашигладаг.
- Жин нь илүү олон удаа өөрчлөгддөг тул энэ нь багцын градиентаас хамаагүй хурдан нийлдэг.
19. Мэдрэлийн сүлжээнд шугаман бус байдлыг оруулах нь яагаад чухал вэ?
Хичнээн давхаргатай байсан ч шугаман бус байдал байхгүй үед мэдрэлийн сүлжээ нь перцептрон шиг ажиллах бөгөөд гаралтыг оролтоос шугаман хамааралтай болгоно.
Өөрөөр хэлбэл, n давхарга, m далд нэгж, шугаман идэвхжүүлэх функц бүхий мэдрэлийн сүлжээ нь далд давхаргагүй, зөвхөн шугаман тусгаарлах хил хязгаарыг илрүүлэх чадвартай шугаман мэдрэлийн сүлжээтэй адил юм.
Шугаман бус байдалгүйгээр мэдрэлийн сүлжээ нь нарийн төвөгтэй асуудлыг шийдэж, оролтыг үнэн зөв ангилах боломжгүй юм.
20. Гүнзгий суралцахад тензор гэж юу вэ?
Тензор гэж нэрлэгддэг олон хэмжээст массив нь матриц ба векторуудын ерөнхий ойлголт юм. Энэ нь гүнзгий суралцахад чухал мэдээллийн бүтэц юм. Үндсэн өгөгдлийн төрлүүдийн N хэмжээст массивуудыг тензоруудыг төлөөлөхөд ашигладаг.
Тензорын бүрэлдэхүүн хэсэг бүр ижил төрлийн өгөгдлийн төрөлтэй бөгөөд энэ өгөгдлийн төрөл үргэлж мэдэгддэг. Хэрхэн хэмжээсүүд, тус бүр нь хэр том болохыг зөвхөн дүрсний хэсэг л мэдэх боломжтой.
Орцууд нь бүрэн мэдэгдэж байгаа тохиолдолд ихэнх үйлдлүүд нь бүрэн мэдэгдэж буй тензоруудыг үүсгэдэг; бусад тохиолдолд тензорын хэлбэрийг зөвхөн график гүйцэтгэх явцад тогтоож болно.
21. Та гүнзгий суралцах загварын идэвхжүүлэх функцийг хэрхэн сонгох вэ?
- Урьдчилан таамаглах ёстой үр дүн бодитой бол шугаман идэвхжүүлэх функцийг ашиглах нь утга учиртай.
- Урьдчилан таамаглах гарц нь хоёртын ангиллын магадлал бол Sigmoid функцийг ашиглах ёстой.
- Төлөвлөсөн гаралт нь хоёр ангиллыг агуулсан бол Tanh функцийг ашиглаж болно.
- Тооцоолоход хялбар учраас ReLU функц нь өргөн хүрээний нөхцөлд хэрэглэгдэх боломжтой.
22. CNN гэж юуг хэлээд байна вэ?
Харааны дүрслэлийг үнэлэх чиглэлээр мэргэшсэн гүн мэдрэлийн сүлжээнүүд нь конволюцийн мэдрэлийн сүлжээг (CNN эсвэл ConvNet) агуулдаг. Энд вектор нь оролтыг илэрхийлдэг мэдрэлийн сүлжээнд биш, оролт нь олон сувагт зураг юм.
Олон давхаргат перцептроныг CNN-д тусгай аргаар ашигладаг бөгөөд энэ нь маш бага урьдчилсан боловсруулалт шаарддаг.
23. CNN-ийн олон давхарга гэж юу вэ?
Convolutional Layer: Үндсэн давхарга нь янз бүрийн сурах боломжтой шүүлтүүрүүд, хүлээн авах талбартай эвхэгддэг давхарга юм. Энэ эхний давхарга нь оролтын өгөгдлийг авч шинж чанарыг нь гаргаж авдаг.
ReLU давхарга: Сүлжээг шугаман бус болгосноор энэ давхарга нь сөрөг пикселүүдийг тэг болгон хувиргадаг.
Цөөрөм давхарга: Боловсруулалт болон сүлжээний тохиргоог багасгаснаар нэгтгэх давхарга нь дүрслэлийн орон зайн хэмжээг аажмаар багасгадаг. Макс цуглуулах нь хамгийн их ашиглагддаг нэгдлүүдийн арга юм.
24. Хэт болон дутуу зохицох нь ямар үр дагавартай вэ, та үүнээс хэрхэн зайлсхийх вэ?
Загвар өмсөгч сургалтын өгөгдлийн нарийн төвөгтэй байдал, чимээ шуугианыг сурч мэдсэнээр шинэ өгөгдлийг ашиглахад сөргөөр нөлөөлсөн тохиолдолд үүнийг хэт тохируулга гэж нэрлэдэг.
Зорилгын функцийг сурах явцад илүү дасан зохицох чадвартай шугаман бус загваруудад тохиолдох магадлал өндөр. Загварыг автомашин, ачааны машиныг илрүүлэхэд сургаж болох боловч энэ нь зөвхөн тодорхой хайрцаг хэлбэртэй тээврийн хэрэгслийг таних боломжтой.
Энэ нь зөвхөн нэг төрлийн ачааны машин дээр бэлтгэгдсэн байсан тул хавтгай ачааны машиныг илрүүлэх боломжгүй байж магадгүй юм. Сургалтын өгөгдөл дээр загвар нь сайн ажилладаг боловч бодит ертөнцөд тийм биш юм.
Дутуу суурилуулсан загвар гэдэг нь өгөгдөлд хангалттай сургагдаагүй эсвэл шинэ мэдээллийг нэгтгэх чадваргүй загварыг хэлдэг. Энэ нь ихэвчлэн загвар нь хангалтгүй эсвэл буруу өгөгдөлд сургагдсан үед тохиолддог.
Тохиромжгүй байдлаас болж нарийвчлал, гүйцэтгэл хоёулаа мууддаг.
Загварын нарийвчлалыг тооцоолохын тулд өгөгдлийг дахин загварчлах (K- дахин хөндлөн баталгаажуулалт) болон загварыг үнэлэхийн тулд баталгаажуулалтын өгөгдлийн багцыг ашиглах нь хэт тохирох, дутуу тохирохоос зайлсхийх хоёр арга юм.
25. Гүнзгий суралцахад RNN гэж юу вэ?
Давтагдах мэдрэлийн сүлжээ (RNN) нь нийтлэг төрөл бүрийн хиймэл мэдрэлийн сүлжээнүүд нь RNN товчлолоор явагддаг. Эдгээрийг геном, гар бичмэл, текст, өгөгдлийн дарааллыг боловсруулахад ашигладаг. Шаардлагатай сургалтанд RNN нь буцаан тархалтыг ашигладаг.
26. Adam Optimizer-ийг тайлбарла
Дасан зохицох момент гэж нэрлэгддэг Адам оптимизатор нь сийрэг градиент бүхий чимээ шуугиантай нөхцөл байдлыг зохицуулахад зориулагдсан оновчлолын техник юм.
Илүү хурдан нэгдэхийн тулд параметр бүрийг шинэчлэхээс гадна Adam optimizer нь эрч хүчийг ашиглан нэгдмэл байдлыг сайжруулж, загвар нь эмээлийн цэгт баригдахгүй байх боломжийг олгодог.
27. Гүн автокодерууд: тэдгээр нь юу вэ?
Гүн автомат кодлогч гэдэг нь сүлжээний кодчилолын хагаст XNUMX-XNUMX гүехэн давхарга, код тайлах тал нь XNUMX-XNUMX давхаргын өөр багцыг багтаасан хоёр тэгш хэмтэй гүн итгэлийн сүлжээний хамтын нэр юм.
Эдгээр давхаргууд нь гүн гүнзгий итгэл үнэмшлийн сүлжээний үндэс суурийг бүрдүүлдэг бөгөөд Больцманы машинуудаар хязгаарлагддаг. RBM бүрийн дараа гүн автомат кодлогч нь MNIST өгөгдлийн багцад хоёртын өөрчлөлтийг хэрэгжүүлдэг.
Эдгээрийг RBM-ээс Гауссын засварласан хувиргалтыг илүүд үздэг бусад өгөгдлийн багцад ашиглаж болно.
28. Тензор урсгал дахь тензор гэдэг нь юу гэсэн үг вэ?
Энэ бол байнга асуудаг өөр нэг гүнзгий суралцах ярилцлагын асуулт юм. Тензор бол өндөр хэмжээст массив хэлбэрээр дүрслэгдсэн математикийн ойлголт юм.
Тензорууд нь мэдрэлийн сүлжээнд оролт болгон өгдөг, янз бүрийн хэмжээс, зэрэглэл бүхий эдгээр мэдээллийн массивууд юм.
29. Тооцооллын графикийн тайлбар
TensorFlow-ийн үндэс нь тооцооллын график байгуулах явдал юм. Зангилаа бүр нь зангилааны сүлжээнд ажилладаг бөгөөд зангилаа нь математикийн үйлдлийг, ирмэг нь тензорыг илэрхийлдэг.
Өгөгдөл нь график хэлбэрээр урсдаг тул үүнийг заримдаа "DataFlow Graph" гэж нэрлэдэг.
30. Генератив өрсөлдөгчийн сүлжээ (GANs): тэдгээр нь юу вэ?
Deep Learning-д generative загварчлалыг generative adversarial network ашиглан хийдэг. Энэ нь оролтын өгөгдлийн хэв маягийг тодорхойлох замаар үр дүнг гаргадаг хяналтгүй ажил юм.
Дискриминаторыг генераторын үүсгэсэн тохиолдлуудыг ангилахад ашигладаг бол генераторыг шинэ жишээ гаргахад ашигладаг.
31. Архитектурыг төлөвлөхдөө мэдрэлийн сүлжээнд оруулах мэдрэлийн эсүүд болон далд давхаргын тоог хэрхэн сонгох вэ?
Бизнесийн сорилтыг харгалзан мэдрэлийн сүлжээний архитектурыг бий болгоход шаардагдах нейрон ба далд давхаргын нарийн тоог ямар ч хатуу дүрмээр тодорхойлох боломжгүй юм.
Мэдрэлийн сүлжээнд далд давхаргын хэмжээ нь оролтын болон гаралтын давхаргын хэмжээсийн дунд хаа нэгтээ унах ёстой.
Мэдрэлийн сүлжээний дизайныг бий болгох эхлэлийг хэд хэдэн энгийн аргаар хийж болно:
Бодит ертөнцийн ижил төстэй нөхцөлд мэдрэлийн сүлжээг ашиглах өмнөх туршлага дээр үндэслэн аливаа тодорхой өгөгдлийн багцад юу хамгийн сайн ажиллахыг олж мэдэхийн тулд зарим үндсэн системчилсэн туршилтаас эхлэх нь бодит ертөнцийг урьдчилан таамаглах загварчлалын өвөрмөц сорилтуудыг даван туулах хамгийн сайн арга юм.
Сүлжээний тохиргоог тухайн асуудлын домэйны талаарх мэдлэг болон мэдрэлийн сүлжээний өмнөх туршлага дээр үндэслэн сонгож болно. Мэдрэлийн сүлжээний тохиргоог үнэлэхдээ холбогдох асуудалд ашигласан давхарга болон нейроны тоо нь эхлэхэд тохиромжтой газар юм.
Мэдрэлийн сүлжээний нарийн төвөгтэй байдлыг энгийн мэдрэлийн сүлжээний загвараас эхлээд төлөвлөсөн гаралт, нарийвчлалд үндэслэн аажмаар нэмэгдүүлэх хэрэгтэй.
32. Гүн гүнзгийрүүлэх сургалтанд ямар төрлийн мэдрэлийн сүлжээг ашигладаг вэ?
- Арматурын сургалт гэж нэрлэгддэг машин сургалтын парадигмд загвар нь амьд зүйлсийн нэгэн адил хуримтлагдсан шагналын санааг нэмэгдүүлэхийн тулд ажилладаг.
- Тоглоом болон өөрөө жолоодлоготой тээврийн хэрэгслийг хоёуланг нь холбоотой асуудал гэж тодорхойлдог бэхжүүлэх сургалт.
- Хэрэв төлөөлөх асуудал нь тоглоом бол дэлгэцийг оролт болгон ашигладаг. Дараагийн үе шатуудын гаралтыг гаргахын тулд алгоритм нь пикселүүдийг оролт болгон авч, олон давхаргат мэдрэлийн сүлжээгээр дамжуулан боловсруулдаг.
- Загварын үйл ажиллагааны үр дүн нь эерэг эсвэл муу аль нь ч байсан бататгах үүрэг гүйцэтгэдэг.
Дүгнэлт
Гүнзгий суралцах нь олон жилийн туршид түгээмэл болж, бараг бүх салбарт хэрэглэгдэх болсон.
Компаниуд гүнзгий суралцах болон машин сургалтын арга барилыг ашиглан хүний зан төлөвийг хуулбарлах загвар зохион бүтээх чадвартай мэргэжилтнүүдийг хайж байна.
Ур чадвараа дээшлүүлж, эдгээр дэвшилтэт технологийн талаархи мэдлэгээ хадгалсан нэр дэвшигчид сонирхол татахуйц цалин хөлстэй олон төрлийн ажлын боломжийг олж авах боломжтой.
Та хамгийн их асуудаг гүн гүнзгий ярилцлагын асуултуудын заримд хэрхэн хариулах талаар хүчтэй ойлголттой болсон тул ярилцлагаа эхлүүлж болно. Зорилгодоо тулгуурлан дараагийн алхамаа хийгээрэй.
Хашдоркийнд зочилно уу Ярилцлагын цуврал ярилцлагад бэлтгэх.
хариу үлдээх