Змест[Схаваць][Паказаць]
- 1. Тытанік
- 2. Ірландская кветкавая класіфікацыя
- 3. Прагноз коштаў на дом у Бостане
- 4. Тэст якасці віна
- 5. Прадказанне фондавага рынку
- 6. Рэкамендацыя фільма
- 7. Прагноз прыдатнасці нагрузкі
- 8. Аналіз настрояў з выкарыстаннем дадзеных Twitter
- 9. Прадказанне будучых продажаў
- 10. Выяўленне фальшывых навін
- 11. Прадказанне куплі купонаў
- 12. Прагноз адтоку кліентаў
- 13. Прагназаванне продажаў Wallmart
- 14. Аналіз дадзеных Uber
- 15. Аналіз Covid-19
- заключэнне
Машынае навучанне - гэта простае даследаванне таго, як навучыць кампутарную праграму або алгарытм для паступовага ўдасканалення канкрэтнай працы, прадстаўленай на высокім узроўні. Ідэнтыфікацыя малюнкаў, выяўленне махлярстваў, сістэмы рэкамендацый і іншыя прыкладання для машыннага навучання ўжо апынуліся папулярнымі.
Вакансіі ML робяць працу чалавека простай і эфектыўнай, эканомячы час і забяспечваючы высакаякасны вынік. Нават Google, самая папулярная ў свеце пошукавая сістэма, выкарыстоўвае навучанне з дапамогай машыны.
Ад аналізу запыту карыстальніка і змены вынікаў на аснове вынікаў да паказу папулярных тэм і рэкламы ў адносінах да запыту, існуе мноства даступных варыянтаў.
Тэхналогія, якая адначасова ўспрымальная і самакарэктуецца, не за гарамі ў будучыні.
Адзін з найлепшых спосабаў пачаць працу - гэта авалодаць і распрацаваць праект. Таму мы склалі спіс з 15 лепшых праектаў машыннага навучання для пачаткоўцаў, каб вы маглі пачаць.
1. Тытанічная
Гэта часта лічыцца адной з самых вялікіх і прыемных задач для тых, хто хоча даведацца больш аб машынным навучанні. Выклік Titanic - папулярны праект машыннага навучання, які таксама служыць добрым спосабам пазнаёміцца з платформай для навукі аб даных Kaggle. Набор даных "Тытаніка" складаецца з сапраўдных дадзеных патаплення злашчаснага карабля.
Яна ўключае ў сябе такія дэталі, як узрост чалавека, сацыяльна-эканамічны статус, пол, нумар каюты, порт адпраўлення і, самае галоўнае, ці выжылі яны!
Тэхніка K-Nearest Neighbor і класіфікатар дрэва рашэнняў былі вызначаны для атрымання найлепшых вынікаў для гэтага праекта. Калі вы шукаеце хуткае заданне на выходных, каб палепшыць свой Здольнасці машыннага навучання, гэта на Kaggle для вас.
2. Класіфікацыя ірландскіх кветак
Пачаткоўцам падабаецца праект класіфікацыі кветак касача, і гэта выдатнае месца для пачатку, калі вы пачатковец у машынным навучанні. Даўжыня чашалісцікаў і пялёсткаў адрознівае суквецці касача ад іншых відаў. Мэта гэтага праекта - падзяліць кветкі на тры віды: Virginia, Setosa і Versicolor.
Для практыкаванняў па класіфікацыі ў праекце выкарыстоўваецца набор дадзеных кветак касача, які дапамагае навучэнцам вывучыць асновы працы з лікавымі значэннямі і дадзенымі. Набор дадзеных кветкі касача - гэта малюсенькі набор, які можна захоўваць у памяці без неабходнасці маштабавання.
3. Прагноз коштаў на дом у Бостане
Яшчэ адзін вядомы набор даных для пачаткоўцаў у машынным навучанні гэта дадзеныя Boston Housing. Яго мэта - прагназаваць кошты дома ў розных раёнах Бостана. Яна ўключае ў сябе такія статыстычныя дадзеныя, як узрост, стаўка падатку на маёмасць, узровень злачыннасці і нават блізкасць да цэнтраў занятасці, што можа паўплываць на цэны на жыллё.
Набор даных просты і малюсенькі, што робіць яго простым эксперыментаваць для пачаткоўцаў. Каб высветліць, якія фактары ўплываюць на кошт нерухомасці ў Бостане, шырока выкарыстоўваюцца метады рэгрэсіі па розных параметрах. Гэта выдатнае месца, каб практыкаваць метады рэгрэсіі і ацаніць, наколькі яны працуюць.
4. Тэст якасці віна
Віно - незвычайны алкагольны напой, які патрабуе шматгадовага закісання. У выніку старадаўняя бутэлька віна - дарагое і якаснае віно. Выбар ідэальнай бутэлькі віна патрабуе шматгадовых ведаў у дэгустацыі віна, і гэта можа быць працэсам хіт-або прамах.
Праект тэсту якасці віна ацэньвае віно з дапамогай фізіка-хімічных тэстаў, такіх як узровень алкаголю, фіксаваная кіслотнасць, шчыльнасць, pH і іншыя фактары. Праект таксама вызначае крытэрыі якасці і колькасці віна. У выніку купля віна становіцца лёгкай.
5. Прагноз на фондавым рынку
Гэтая ініцыятыва інтрыгуе, працуеце вы ў фінансавым сектары ці не. Дадзеныя фондавага рынку шырока вывучаюцца навукоўцамі, прадпрыемствамі і нават у якасці крыніцы другаснага даходу. Здольнасць навукоўца дадзеных вывучаць і даследаваць дадзеныя часавых шэрагаў таксама вельмі важная. Дадзеныя з фондавага рынку - гэта выдатнае месца для пачатку.
Сутнасць спробы заключаецца ў прагназаванні будучага кошту акцыі. Гэта заснавана на бягучых паказчыках рынку, а таксама на статыстыцы мінулых гадоў. Kaggle збірае даныя па індэксе NIFTY-50 з 2000 года, і ў цяперашні час ён абнаўляецца штотыдзень. З 1 студзеня 2000 г. ён змяшчае цэны акцый больш за 50 арганізацый.
6. Рэкамендацыя фільма
Я ўпэўнены, што ў вас было такое пачуццё пасля таго, як вы паглядзелі добры фільм. Ці адчувалі вы калі-небудзь жаданне падбадзёрыць свае пачуцці, праглядаючы падобныя фільмы?
Мы ведаем, што OTT-сэрвісы, такія як Netflix, значна палепшылі свае сістэмы рэкамендацый. Як студэнт машыннага навучання, вы павінны разумець, як такія алгарытмы арыентаваны на кліентаў на аснове іх пераваг і водгукаў.
Набор дадзеных IMDB на Kaggle, верагодна, з'яўляецца адным з найбольш поўных, што дазваляе выводзіць мадэлі рэкамендацый на аснове назвы фільма, рэйтынгу кліентаў, жанру і іншых фактараў. Гэта таксама выдатны метад, каб даведацца аб фільтрацыі на аснове кантэнту і распрацоўцы функцый.
7. Прагноз прыдатнасці нагрузкі
Свет круціцца вакол крэдытаў. Асноўная крыніца прыбытку банкаў - гэта працэнты па крэдытах. Таму яны з'яўляюцца іх асноўнай справай.
Асобы або групы асобаў могуць пашырыць эканоміку, толькі ўкладваючы грошы ў фірму ў надзеі на тое, што яна вырасце ў кошце ў будучыні. Часам важна шукаць пазыку, каб мець магчымасць рызыкаваць такога роду і нават удзельнічаць у пэўных свецкіх задавальненняў.
Перад тым як крэдыт можа быць прыняты, банкі звычайна павінны прытрымлівацца даволі строгага працэсу. Паколькі пазыкі з'яўляюцца такім важным аспектам жыцця многіх людзей, прагназаванне права на атрыманне пазыкі, на якую хто-небудзь звяртаецца, было б надзвычай выгадным, дазваляючы лепш планаваць, акрамя таго, што пазыка будзе прынята або адмоўлена.
8. Аналіз настрояў з дапамогай дадзеных Twitter
Дзякуючы сеткі сацыяльных медыя як Twitter, Facebook і Reddit, экстрапаляваць меркаванні і тэндэнцыі стала значна лёгка. Гэтая інфармацыя выкарыстоўваецца для ліквідацыі меркаванняў на падзеі, людзей, спорт і іншыя тэмы. Ініцыятывы машыннага навучання, звязаныя з здабычай меркавання, прымяняюцца ў розных умовах, уключаючы палітычныя кампаніі і ацэнку прадуктаў Amazon.
Гэты праект будзе выглядаць фантастычна ў вашым партфоліо! Для выяўлення эмоцый і аналізу на аснове аспектаў могуць шырока выкарыстоўвацца такія метады, як машыны апорных вектараў, рэгрэсія і алгарытмы класіфікацыі (знаходжанне фактаў і меркаванняў).
9. Прагноз будучых продажаў
Вялікія прадпрыемствы і прадпрыемствы B2C хочуць ведаць, колькі будзе прададзены кожны прадукт у іх інвентары. Прагназаванне продажаў дапамагае ўладальнікам бізнесу вызначыць, якія тавары карыстаюцца вялікім попытам. Дакладнае прагназаванне продажаў значна знізіць страты, а таксама вызначыць дадатковы ўплыў на будучыя бюджэты.
Такія рознічныя гандляры, як Walmart, IKEA, Big Basket і Big Bazaar, выкарыстоўваюць прагназаванне продажаў для ацэнкі попыту на прадукцыю. Вы павінны быць знаёмыя з рознымі метадамі ачысткі сырых даных, каб пабудаваць такія праекты ML. Акрамя таго, неабходна добрае разуменне рэгрэсійнага аналізу, асабліва простай лінейнай рэгрэсіі.
Для выканання такіх задач вам трэба будзе выкарыстоўваць такія бібліятэкі, як Dora, Scrubadub, Pandas, NumPy і іншыя.
10. Выяўленне фальшывых навін
Гэта яшчэ адна перадавая праграма машыннага навучання, накіраваная на школьнікаў. Падробленыя навіны распаўсюджваюцца як лясны пажар, як мы ўсе ведаем. Усё даступна ў сацыяльных сетках, ад падключэння асоб да чытання штодзённых навін.
У выніку выяўляць ілжывыя навіны ў нашы дні становіцца ўсё цяжэй. Многія буйныя сацыяльныя сеткі, такія як Facebook і Twitter, ужо маюць алгарытмы для выяўлення ілжывых навін у публікацыях і стужках.
Каб ідэнтыфікаваць ілжывыя навіны, гэты тып праекта ML мае патрэбу ў глыбокім разуменні розных падыходаў НЛП і алгарытмаў класіфікацыі (PassiveAggressiveClassifier або Naive Bayes classifier).
11. Прадказанне куплі купонаў
Кліенты ўсё часцей задумваюцца аб пакупках у Інтэрнэце, калі каранавірус напаў на планету ў 2020 годзе. У выніку гандлёвыя ўстановы былі вымушаныя перанесці свой бізнес у Інтэрнет.
З іншага боку, кліенты па-ранейшаму шукаюць выдатныя прапановы, як і ў крамах, і ўсё часцей шукаюць купоны суперэканоміі. Ёсць нават сайты, прысвечаныя стварэнні купонаў для такіх кліентаў. З дапамогай гэтага праекта вы можаце даведацца пра інтэлектуальны аналіз даных у машынным навучанні, ствараючы гістограмы, кругавыя дыяграмы і гістаграмы для візуалізацыі даных і распрацоўку функцый.
Каб генераваць прагнозы, вы таксама можаце разгледзець падыходы да ўменні дадзеных для кіравання значэннямі NA і косінусным падабенствам зменных.
12. Прагноз адтоку кліентаў
Спажыўцы з'яўляюцца самым важным актывам кампаніі, і іх захаванне жыццёва важна для любога бізнесу, які імкнецца павялічыць даход і наладзіць з імі доўгатэрміновыя значныя сувязі.
Акрамя таго, кошт набыцця новага кліента ў пяць разоў вышэй, чым кошт падтрымання існуючага. Адток/знікненне кліентаў - гэта добра вядомая бізнес-праблема, пры якой кліенты або абаненты перастаюць супрацоўнічаць з паслугай або кампаніяй.
У ідэале яны больш не будуць плаціць кліентам. Кліент лічыцца скінутым, калі з моманту апошняга ўзаемадзеяння кліента з кампаніяй прайшло пэўнае колькасць часу. Вызначэнне таго, ці будзе кліент адтоку, а таксама хуткае прадастаўленне адпаведнай інфармацыі, накіраванай на ўтрыманне кліентаў, маюць вырашальнае значэнне для зніжэння адтоку.
Нашы мазгі не здольныя прадбачыць абарот кліентаў для мільёнаў кліентаў; тут можа дапамагчы машыннае навучанне.
13. Прагназаванне продажаў Wallmart
Адным з найбольш прыкметных прыкладанняў машыннага навучання з'яўляецца прагназаванне продажаў, якое ўключае ў сябе выяўленне характарыстык, якія ўплываюць на продаж прадукцыі, і прадбачанне аб'ёму продажаў у будучыні.
У гэтым даследаванні машыннага навучання выкарыстоўваецца набор даных Walmart, які змяшчае даныя аб продажах з 45 месцаў. Продажы на краму па катэгорыях на штотыднёвай аснове ўключаны ў набор даных. Мэтай гэтага праекта машыннага навучання з'яўляецца прагназаванне продажаў для кожнага аддзела ў кожнай гандлёвай кропцы, каб яны маглі прымаць лепшыя рашэнні па аптымізацыі каналаў на аснове дадзеных і планаванні запасаў.
Працаваць з наборам даных Walmart складана, паколькі ён змяшчае выбраныя падзеі ўцэнкі, якія аказваюць уплыў на продажы і павінны быць разгледжаны.
14. Аналіз даных Uber
Калі справа даходзіць да ўкаранення і інтэграцыі машыннага навучання і глыбокага навучання ў іх прыкладаннях, папулярны сэрвіс абмену паездкамі не адстае. Кожны год ён апрацоўвае мільярды паездак, што дазваляе пасажырам падарожнічаць у любы час дня і ночы.
Паколькі яна мае такую вялікую кліенцкую базу, яна патрабуе выключнага абслугоўвання кліентаў, каб як мага хутчэй разглядаць скаргі спажыўцоў.
Uber мае набор даных з мільёнаў пікапаў, якія ён можа выкарыстоўваць для аналізу і адлюстравання паездак кліентаў, каб раскрыць інфармацыю і палепшыць карыстацкі досвед.
15. Аналіз Covid-19
COVID-19 ахапіў зямны шар сёння, і не проста ў сэнсе пандэміі. У той час як медыцынскія эксперты засяроджваюцца на стварэнні эфектыўных вакцынацый і імунізацыі свету, навукоўцы дадзеных не адстаюць.
Новыя выпадкі, штодзённая актыўная колькасць, смяротнасць і статыстыка тэставання публікуюцца. Штодзённа робяцца прагнозы на падставе ўспышкі ВРВІ ў мінулым стагоддзі. Для гэтага можна выкарыстоўваць рэгрэсійны аналіз і падтрымліваць вектарныя машынныя мадэлі прагназавання.
заключэнне
Падводзячы вынік, мы абмеркавалі некаторыя з лепшых праектаў ML, якія дапамогуць вам праверыць праграмаванне машыннага навучання, а таксама зразумець яго ідэі і рэалізацыю. Веданне аб інтэграцыі машыннага навучання можа дапамагчы вам прасунуцца ў вашай прафесіі, паколькі тэхналогія бярэ верх у кожнай галіны.
Падчас вывучэння машыннага навучання мы рэкамендуем вам практыкаваць свае канцэпцыі і напісаць усе вашыя алгарытмы. Напісанне алгарытмаў падчас навучання важней, чым выкананне праекта, і гэта таксама дае вам перавагу ў правільным разуменні прадметаў.
Пакінуць каментар