Гарчиг[Нуух][Үзүүлэх]
- 1. Титаник
- 2. Ирландын цэцгийн ангилал
- 3. Бостоны байшингийн үнийн таамаглал
- 4. Дарсны чанарын туршилт
- 5. Хөрөнгийн зах зээлийн таамаглал
- 6. Киноны зөвлөмж
- 7. Ачааллын шалгуурыг урьдчилан таамаглах
- 8. Твиттерийн өгөгдлийг ашиглан мэдрэмжийн шинжилгээ
- 9. Ирээдүйн борлуулалтын таамаглал
- 10. Хуурамч мэдээ илрүүлэх
- 11. Купон худалдан авалтын таамаглал
- 12. Хэрэглэгчийн алдагдлыг урьдчилан таамаглах
- 13. Wallmart борлуулалтын таамаглал
- 14. Uber мэдээллийн шинжилгээ
- 15. Ковид-19-ийн шинжилгээ
- Дүгнэлт
Машины сургалт гэдэг нь өндөр түвшинд танилцуулсан тодорхой ажил дээр аажмаар сайжруулахын тулд компьютерийн програм эсвэл алгоритмыг хэрхэн сургах энгийн судалгаа юм. Зургийг таних, залилан илрүүлэх, зөвлөмж өгөх систем болон бусад машин сургалтын програмууд аль хэдийн алдартай болсон.
ML ажлын байр нь хүний ажлыг энгийн бөгөөд үр дүнтэй болгож, цаг хэмнэж, өндөр чанартай үр дүнг баталгаажуулдаг. Дэлхийн хамгийн алдартай хайлтын систем болох Google хүртэл ашигладаг машин суралцах.
Хэрэглэгчийн асуулгад дүн шинжилгээ хийх, үр дүнд үндэслэн үр дүнг өөрчлөхөөс эхлээд асуулгатай холбоотой чиг хандлагатай сэдэв, зар сурталчилгааг харуулах хүртэл олон янзын сонголтууд байдаг.
Ойлгомжтой, өөрийгөө засч залруулах чадвартай технологи ирээдүйд тийм ч хол биш юм.
Эхлэх хамгийн сайн аргуудын нэг бол практик дээр ажиллаж, төсөл боловсруулах явдал юм. Тиймээс бид таныг эхлүүлэхийн тулд эхлэгчдэд зориулсан машин сургалтын шилдэг 15 төслийн жагсаалтыг гаргалаа.
1. Титаник
Энэ нь ихэвчлэн машин сургалтын талаар илүү ихийг мэдэхийг сонирхож буй хүмүүсийн хувьд хамгийн агуу бөгөөд хамгийн тааламжтай ажлуудын нэг гэж тооцогддог. Титаник сорилт бол Kaggle мэдээллийн шинжлэх ухааны платформтой танилцах сайн арга зам болох алдартай машин сургалтын төсөл юм. Титаникийн өгөгдлийн багц нь осолд өртсөн хөлөг онгоцны живэх үеийн жинхэнэ мэдээллээс бүрддэг.
Үүнд тухайн хүний нас, нийгэм эдийн засгийн байдал, хүйс, бүхээгийн дугаар, хөөрөх боомт, хамгийн чухал нь амьд үлдсэн эсэх гэх мэт дэлгэрэнгүй мэдээллийг багтаасан болно!
K-En ойрын хөршийн техник, шийдвэрийн модны ангилагч нь энэ төслийн хамгийн сайн үр дүнг гаргахаар тогтоогдсон. Хэрэв та амралтын өдрүүдээ сайжруулахын тулд хурдан сорилт хайж байгаа бол Машин сурах чадвар, Kaggle дээрх энэ нь танд зориулагдсан.
2. Ирландын цэцгийн ангилал
Эхлэн суралцагчид цахилдаг цэцгийн ангиллын төсөлд дуртай бөгөөд хэрэв та машин сурахад шинээр орж байгаа бол энэ нь эхлэхэд тохиромжтой газар юм. Шавар болон дэлбээний урт нь цахилдаг цэцэглэлтийг бусад зүйлээс ялгадаг. Энэхүү төслийн зорилго нь цэцэгсийг Виржиниа, сетоза, Версиколор гэсэн гурван зүйлд хуваах явдал юм.
Ангилах дасгалын хувьд төсөл нь Цахилдаг цэцгийн өгөгдлийн багцыг ашигладаг бөгөөд энэ нь суралцагчдад тоон утга, өгөгдөлтэй харьцах үндсийг сурахад тусалдаг. Цахилдаг цэцгийн өгөгдлийн багц нь хэмжээсийг өөрчлөх шаардлагагүйгээр санах ойд хадгалах боломжтой жижигхэн зүйл юм.
3. Бостоны байшингийн үнийн таамаглал
Өөр нэг алдартай машин сургалтын шинэхэн өгөгдлийн багц нь Бостоны орон сууцны мэдээлэл юм. Үүний зорилго нь Бостоны янз бүрийн хороолол дахь байшингийн үнэ цэнийг урьдчилан таамаглах явдал юм. Үүнд нас, үл хөдлөх хөрөнгийн татварын хувь хэмжээ, гэмт хэргийн түвшин, тэр байтугай ажлын байртай ойр байх зэрэг амин чухал статистикууд багтсан бөгөөд энэ бүхэн нь орон сууцны үнэд нөлөөлж болзошгүй юм.
Өгөгдлийн багц нь энгийн бөгөөд жижигхэн тул шинэхэн хүмүүст туршилт хийхэд хялбар болгодог. Бостон дахь үл хөдлөх хөрөнгийн үнэд ямар хүчин зүйл нөлөөлж байгааг олж мэдэхийн тулд регрессийн аргуудыг янз бүрийн параметрүүдэд ихээхэн ашигладаг. Энэ нь регрессийн арга техникийг дадлагажуулах, хэр сайн ажиллаж байгааг үнэлэх сайхан газар юм.
4. Дарсны чанарын туршилт
Дарс бол олон жил исгэхийг шаарддаг ер бусын согтууруулах ундаа юм. Үүний үр дүнд эртний лонх дарс нь үнэтэй, өндөр чанартай дарс юм. Тохиромжтой шил дарсыг сонгоход олон жилийн дарс амтлах мэдлэг шаардагддаг бөгөөд энэ нь амжилтгүй болох эсвэл алдаж магадгүй юм.
Дарсны чанарын туршилтын төсөл нь архины түвшин, тогтмол хүчиллэг, нягтрал, рН болон бусад хүчин зүйлс зэрэг физик-химийн туршилтуудыг ашиглан дарсыг үнэлдэг. Төсөл нь дарсны чанарын шалгуур үзүүлэлт, хэмжээг тодорхойлдог. Үүний үр дүнд дарс худалдан авах нь сэвшээ салхи болдог.
5. Хөрөнгийн зах зээлийн таамаглал
Энэ санаачилга таныг санхүүгийн салбарт ажилладаг эсэхээс үл хамааран анхаарал татаж байна. Хөрөнгийн зах зээлийн мэдээллийг эрдэмтэн судлаачид, бизнес эрхлэгчид, тэр байтугай хоёрдогч орлогын эх үүсвэр болгон өргөнөөр судалдаг. Мэдээлэл судлаачийн цаг хугацааны цувааны өгөгдлийг судлах, судлах чадвар нь бас чухал юм. Хөрөнгийн зах зээлийн мэдээлэл нь эхлэхэд маш тохиромжтой газар юм.
Энэхүү хүчин чармайлтын мөн чанар нь хувьцааны ирээдүйн үнэ цэнийг урьдчилан таамаглах явдал юм. Энэ нь одоогийн зах зээлийн гүйцэтгэл болон өмнөх жилүүдийн статистикт үндэслэсэн болно. Kaggle нь 50 оноос хойш NIFTY-2000 индексийн мэдээллийг цуглуулж байгаа бөгөөд одоогоор долоо хоног бүр шинэчлэгдэж байна. 1 оны 2000-р сарын 50-ээс хойш XNUMX гаруй байгууллагын хувьцааны үнийг багтаасан.
6. Киноны зөвлөмж
Чамд сайхан кино үзээд ийм мэдрэмж төрсөн гэдэгт итгэлтэй байна. Та ижил төстэй кинонуудыг хэтрүүлэн үзээд мэдрэмжээ хөдөлгөх хүсэл төрж байсан уу?
Netflix зэрэг OTT үйлчилгээнүүд нь зөвлөмжийн системээ ихээхэн сайжруулсныг бид мэднэ. Машинаар суралцаж буй оюутны хувьд та ийм алгоритмууд нь үйлчлүүлэгчдийн сонголт, үнэлгээнд үндэслэн хэрхэн зорилтот түвшинд хүрч байгааг ойлгох хэрэгтэй.
Kaggle дээрх IMDB өгөгдлийн багц нь киноны нэр, хэрэглэгчийн үнэлгээ, төрөл болон бусад хүчин зүйлээс хамааран зөвлөмжийн загварыг гаргах боломжийг олгодог хамгийн бүрэн гүйцэд мэдээллийн нэг байж магадгүй юм. Энэ нь Агуулгад суурилсан шүүлтүүр ба онцлог инженерчлэлийн талаар суралцах маш сайн арга юм.
7. Ачаалах эрхтэй байдлын таамаглал
Дэлхий ертөнц зээлийг тойрон эргэдэг. Банкуудын ашгийн гол эх үүсвэр нь зээлийн хүүгээс бүрддэг. Тиймээс тэд тэдний үндсэн бизнес юм.
Хувь хүмүүс эсвэл хэсэг бүлэг хүмүүс ирээдүйд үнэ цэнэ нь өснө гэсэн итгэл найдвараар пүүст хөрөнгө оруулалт хийснээр л эдийн засгаа тэлэх боломжтой. Ийм эрсдэлийг үүрэх, тэр байтугай дэлхийн зарим таашаалд оролцох чадвартай байхын тулд зээл хайх нь заримдаа чухал байдаг.
Зээлийг хүлээн авахаас өмнө банкууд ихэвчлэн нэлээд хатуу үйл явцыг дагаж мөрдөх ёстой. Зээл бол олон хүний амьдралын чухал хэсэг учраас хэн нэгний хүсэлт гаргаж буй зээлд хамрагдах эсэхийг урьдчилан таамаглах нь зээлийг хүлээн авах эсвэл татгалзахаас илүү сайн төлөвлөлт хийх боломжийг олгоход маш их ашиг тустай байх болно.
8. Твиттерийн өгөгдлийг ашиглан мэдрэмжийн шинжилгээ
Баярлалаа нийгмийн мэдээллийн сүлжээ Twitter, Facebook, Reddit зэрэг нь үзэл бодол, чиг хандлагыг экстраполяци хийх нь маш хялбар болсон. Энэ мэдээллийг үйл явдал, хүмүүс, спорт болон бусад сэдвүүдийн талаархи санал бодлыг арилгахад ашигладаг. Улс төрийн кампанит ажил, Амазоны бүтээгдэхүүний үнэлгээ зэрэг олон янзын орчинд үзэл бодлын уул уурхайтай холбоотой машин сургалтын санаачлагуудыг хэрэгжүүлж байна.
Энэ төсөл таны багцад гайхалтай харагдах болно! Сэтгэл хөдлөлийг илрүүлэх, тал дээр суурилсан дүн шинжилгээ хийхэд дэмжлэгийн вектор машин, регресс, ангиллын алгоритм зэрэг аргуудыг өргөнөөр ашиглаж болно (баримт, үзэл бодлыг олох).
9. Ирээдүйн борлуулалтын таамаглал
Томоохон B2C бизнес эрхлэгчид болон худалдаачид өөрсдийн бараа материал дахь бүтээгдэхүүн бүр хэр их зарагдахыг мэдэхийг хүсдэг. Борлуулалтын таамаглал нь бизнес эрхлэгчдэд аль бараа нь эрэлт ихтэй байгааг тодорхойлоход тусалдаг. Борлуулалтын урьдчилсан таамаглал нь алдагдлыг мэдэгдэхүйц бууруулахын зэрэгцээ ирээдүйн төсөвт үзүүлэх нөлөөллийг тодорхойлох болно.
Walmart, IKEA, Big Basket, Big Bazaar зэрэг жижиглэнгийн худалдаачид бүтээгдэхүүний эрэлтийг тооцоолохдоо борлуулалтын таамаглалыг ашигладаг. Ийм ML төслүүдийг бүтээхийн тулд та түүхий өгөгдлийг цэвэрлэх янз бүрийн арга техникийг мэддэг байх ёстой. Мөн регрессийн шинжилгээ, ялангуяа энгийн шугаман регрессийн талаар сайн мэдлэгтэй байх шаардлагатай.
Ийм төрлийн ажлыг хийхийн тулд та Dora, Scrubadub, Pandas, NumPy болон бусад номын санг ашиглах хэрэгтэй болно.
10. Хуурамч мэдээ илрүүлэх
Энэ бол сургуулийн сурагчдад чиглэсэн өөр нэг дэвшилтэт машин сургалтын хүчин чармайлт юм. Хуурамч мэдээ нь түймэр шиг тархаж байгаа нь бид бүгдийн мэдэж байгаа. Хувь хүмүүсийг холбохоос эхлээд өдөр тутмын мэдээ унших хүртэл бүх зүйл олон нийтийн сүлжээнд байдаг.
Үүний үр дүнд өнөө үед худал мэдээг илрүүлэх нь улам хэцүү болж байна. Фэйсбүүк, Твиттер зэрэг олон нийтийн мэдээллийн хэрэгслүүдэд нийтлэл, мэдээллийн хэрэгслээр худал мэдээг илрүүлэх алгоритмууд аль хэдийн бий болсон.
Хуурамч мэдээг илрүүлэхийн тулд энэ төрлийн ML төсөл нь олон NLP арга барил, ангиллын алгоритмуудыг (PassiveAggressiveClassifier эсвэл Naive Bayes ангилагч) сайтар ойлгох шаардлагатай.
11. Купон худалдан авах таамаглал
2020 онд коронавирус дэлхий даяар дайрах үед үйлчлүүлэгчид онлайнаар худалдан авалт хийх талаар бодох болсон. Үүний үр дүнд худалдааны байгууллагууд бизнесээ онлайнаар шилжүүлэхээс өөр аргагүй болсон.
Нөгөөтэйгүүр, үйлчлүүлэгчид дэлгүүрт байсан шигээ гайхалтай саналуудыг эрэлхийлсээр байгаа бөгөөд хэт хэмнэлттэй купонуудыг хайж байна. Ийм үйлчлүүлэгчдэд зориулсан купон үүсгэх зорилготой вэбсайтууд хүртэл байдаг. Та энэ төслөөр өгөгдлийг дүрслэн харуулахын тулд баганан график, дугуй диаграмм, гистограммыг гаргах, машин сургалтын явцад өгөгдөл олборлох талаар суралцах боломжтой.
Урьдчилан таамаглахын тулд та NA утгууд болон хувьсагчдын косинусын ижил төстэй байдлыг удирдахад зориулсан өгөгдлийн тооцооллын аргуудыг судалж болно.
12. Хэрэглэгчийн алдагдлыг урьдчилан таамаглах
Хэрэглэгчид бол компанийн хамгийн чухал хөрөнгө бөгөөд орлогоо нэмэгдүүлэх, тэдэнтэй урт хугацааны утга учиртай холбоо тогтоох зорилготой аливаа бизнесийн хувьд тэдгээрийг хадгалах нь амин чухал юм.
Цаашилбал, шинэ үйлчлүүлэгч олж авах зардал нь одоо байгаа үйлчлүүлэгчээ тогтвортой байлгах зардлаас тав дахин их байдаг. Хэрэглэгчийн хагарал/Үлэгдэлт нь үйлчлүүлэгч эсвэл захиалагчид үйлчилгээ эсвэл компанитай бизнес хийхээ больдог бизнесийн алдартай асуудал юм.
Тэд цаашид төлбөр төлдөг үйлчлүүлэгч байхаа болино. Үйлчлүүлэгч компанитай хамгийн сүүлд харилцсанаас хойш тодорхой хугацаа өнгөрсөн бол үйлчлүүлэгчийг цуцалсанд тооцно. Үйлчлүүлэгч гацах эсэхийг тодорхойлох, түүнчлэн үйлчлүүлэгчийг хадгалахад чиглэсэн холбогдох мэдээллийг шуурхай өгөх нь алдагдлыг бууруулахад маш чухал юм.
Бидний тархи сая сая үйлчлүүлэгчдийн үйлчлүүлэгчдийн эргэлтийг урьдчилан таамаглах чадваргүй; Энд машин суралцах нь тусалж чадна.
13. Wallmart борлуулалтын таамаглал
Машин сургалтын хамгийн алдартай хэрэглээний нэг бол борлуулалтын таамаглал бөгөөд бүтээгдэхүүний борлуулалтад нөлөөлж буй шинж чанаруудыг илрүүлэх, ирээдүйн борлуулалтын хэмжээг урьдчилан таамаглах явдал юм.
Энэхүү машин сургалтын судалгаанд 45 байршлын борлуулалтын мэдээллийг агуулсан Walmart мэдээллийн багцыг ашигласан. Дэлгүүрт ногдох борлуулалтыг категориар нь долоо хоног бүр өгөгдлийн багцад оруулсан болно. Энэхүү машин сургалтын төслийн зорилго нь салбар бүрийн борлуулалтыг урьдчилан таамаглах бөгөөд ингэснээр өгөгдөлд суурилсан сувгийг оновчтой болгох, бараа материалын төлөвлөлтийн шийдвэр гаргах боломжтой болно.
Walmart өгөгдлийн багцтай ажиллахад хэцүү байдаг, учир нь энэ нь борлуулалтад нөлөө үзүүлэх сонгосон бууралтын үйл явдлуудыг агуулдаг бөгөөд үүнийг анхаарч үзэх хэрэгтэй.
14. Uber мэдээллийн шинжилгээ
Автомашины сургалт, гүнзгий сургалтыг өөрсдийн аппликейшнд нэвтрүүлэх, нэгтгэх тухай ярихад алдартай унаа хуваалцах үйлчилгээ тийм ч хол биш юм. Жил бүр олон тэрбум аяллыг боловсруулж, зорчигчдод өдөр, шөнийн аль ч цагт аялах боломжийг олгодог.
Энэ нь маш том үйлчлүүлэгчийн баазтай учраас хэрэглэгчийн гомдлыг аль болох хурдан шийдвэрлэхийн тулд үйлчлүүлэгчдэд онцгой үйлчилгээ хэрэгтэй.
Uber нь олон сая хүлээн авагчийн мэдээллийн багцтай бөгөөд үүгээрээ үйлчлүүлэгчийн аялалд дүн шинжилгээ хийх, харуулах, ойлголтыг олж авах, хэрэглэгчийн туршлагыг сайжруулахад ашиглаж болно.
15. Ковид-19 шинжилгээ
COVID-19 өнөөдөр дэлхийг хамарсан бөгөөд зөвхөн тахал гэдэг утгаараа биш. Эмнэлгийн мэргэжилтнүүд үр дүнтэй вакцин бий болгож, дэлхийг дархлаажуулахад анхаарлаа хандуулж байна. мэдээллийн эрдэмтэд хоцрохгүй байна.
Шинэ тохиолдол, өдөр тутмын идэвхтэй тоо, нас баралт, шинжилгээний статистик мэдээг олон нийтэд ил болгож байна. Өмнөх зуунд гарсан SARS-ын дэгдэлт дээр үндэслэн урьдчилсан мэдээг өдөр бүр гаргадаг. Үүний тулд та регрессийн шинжилгээг ашиглаж, вектор машин дээр суурилсан таамаглалын загваруудыг дэмжих боломжтой.
Дүгнэлт
Дүгнэж хэлэхэд бид Machine Learning програмчлалыг турших, түүний санаа, хэрэгжилтийг ойлгоход тань туслах шилдэг ML төслүүдийн талаар ярилцлаа. Machine Learning-ийг хэрхэн нэгтгэх талаар мэдэх нь технологи нь салбар бүрт нэвтэрч байгаа тул мэргэжлээрээ ахихад тусална.
Машины сургалтанд суралцаж байхдаа бид танд өөрийн үзэл баримтлалыг дадлагажуулж, бүх алгоритмаа бичихийг зөвлөж байна. Сурах явцдаа алгоритм бичих нь төсөл хэрэгжүүлэхээс илүү чухал бөгөөд хичээлийг зөв ойлгоход давуу тал болно.
хариу үлдээх