สารบัญ[ซ่อน][แสดง]
- 1 มหึมา
- 2. การจำแนกดอกไม้ไอริช
- 3. การทำนายราคาบ้านบอสตัน
- 4. การทดสอบคุณภาพไวน์
- 5. การทำนายตลาดหุ้น
- 6. แนะนำหนัง
- 7. โหลดการทำนายคุณสมบัติ
- 8. การวิเคราะห์ความเชื่อมั่นโดยใช้ Twitter Data
- 9. การคาดการณ์ยอดขายในอนาคต
- 10. การตรวจจับข่าวปลอม
- 11. การคาดการณ์การซื้อคูปอง
- 12. การทำนายการปั่นของลูกค้า
- 13. การพยากรณ์การขายของ Wallmart
- 14. การวิเคราะห์ข้อมูล Uber
- 15. การวิเคราะห์ Covid-19
- สรุป
แมชชีนเลิร์นนิงเป็นการศึกษาง่ายๆ เกี่ยวกับวิธีให้ความรู้โปรแกรมคอมพิวเตอร์หรืออัลกอริทึมเพื่อค่อยๆ ปรับปรุงในงานเฉพาะที่นำเสนอในระดับสูง การระบุรูปภาพ การตรวจจับการฉ้อโกง ระบบการแนะนำ และแอปพลิเคชันการเรียนรู้ของเครื่องอื่น ๆ ได้รับการพิสูจน์แล้วว่าได้รับความนิยม
งาน ML ทำให้งานของมนุษย์ง่ายและมีประสิทธิภาพ ประหยัดเวลาและรับประกันผลลัพธ์คุณภาพสูง แม้แต่ Google ซึ่งเป็นเสิร์ชเอ็นจิ้นที่ได้รับความนิยมมากที่สุดในโลกก็ยังใช้ เรียนรู้เครื่อง.
ตั้งแต่การวิเคราะห์คำค้นหาของผู้ใช้และการเปลี่ยนแปลงผลลัพธ์ตามผลลัพธ์ ไปจนถึงการแสดงหัวข้อที่กำลังเป็นที่นิยมและโฆษณาที่สัมพันธ์กับการสืบค้น มีตัวเลือกมากมายให้เลือก
เทคโนโลยีที่มีทั้งการรับรู้และแก้ไขตัวเองอยู่ไม่ไกลนักในอนาคต
วิธีที่ยอดเยี่ยมที่สุดวิธีหนึ่งในการเริ่มต้นคือการลงมือทำและออกแบบโครงการ ดังนั้นเราจึงได้รวบรวมรายการ 15 โครงการแมชชีนเลิร์นนิงชั้นนำสำหรับผู้เริ่มต้นเพื่อให้คุณเริ่มต้นได้
1. มหึมา
นี้มักจะถือว่าเป็นหนึ่งในงานที่ยิ่งใหญ่ที่สุดและสนุกสนานที่สุดสำหรับทุกคนที่สนใจเรียนรู้เพิ่มเติมเกี่ยวกับแมชชีนเลิร์นนิง การแข่งขันเรือไททานิคเป็นโปรเจ็กต์แมชชีนเลิร์นนิงยอดนิยม และยังเป็นวิธีที่ดีในการทำความคุ้นเคยกับแพลตฟอร์มวิทยาศาสตร์ข้อมูล Kaggle ชุดข้อมูลไททานิคประกอบด้วยข้อมูลจริงจากการจมของเรือที่โชคร้าย
รวมถึงรายละเอียดต่างๆ เช่น อายุของบุคคล สถานะทางเศรษฐกิจและสังคม เพศ หมายเลขห้องโดยสาร ท่าเรือขาออก และที่สำคัญที่สุดคือไม่ว่าจะรอดหรือไม่!
เทคนิค K-Nearest Neighbor และตัวแยกประเภทต้นไม้ตัดสินใจ มุ่งมั่นที่จะสร้างผลลัพธ์ที่ดีที่สุดสำหรับโครงการนี้ หากคุณกำลังมองหาความท้าทายในช่วงสุดสัปดาห์ที่รวดเร็วเพื่อปรับปรุงของคุณ ความสามารถในการเรียนรู้ของเครื่องหนึ่งนี้ใน Kaggle เหมาะสำหรับคุณ
2. การจำแนกดอกไม้ไอริช
ผู้เริ่มต้นชอบโครงการจัดหมวดหมู่ดอกไอริส และเป็นสถานที่ที่ดีในการเริ่มต้นหากคุณเพิ่งเริ่มใช้แมชชีนเลิร์นนิง ความยาวของกลีบเลี้ยงและกลีบดอกทำให้ไอริสบุปผาแตกต่างจากสายพันธุ์อื่น วัตถุประสงค์ของโครงการนี้คือเพื่อแยกบุปผาออกเป็นสามสายพันธุ์: เวอร์จิเนีย เซโตซ่า และเวอร์ซิคัลเลอร์
สำหรับแบบฝึกหัดการจัดหมวดหมู่ โครงงานใช้ชุดข้อมูลดอกไอริส ซึ่งช่วยผู้เรียนในการเรียนรู้พื้นฐานของการจัดการกับค่าตัวเลขและข้อมูล ชุดข้อมูลดอกไอริสเป็นชุดข้อมูลขนาดเล็กที่สามารถเก็บไว้ในหน่วยความจำโดยไม่ต้องปรับขนาด
3. การทำนายราคาบ้านบอสตัน
รู้จักกันดีอีกราย ชุดข้อมูลสำหรับมือใหม่ในการเรียนรู้ของเครื่อง คือข้อมูลที่อยู่อาศัยของบอสตัน เป้าหมายคือการคาดการณ์มูลค่าบ้านในย่านต่างๆ ของบอสตัน รวมถึงสถิติที่สำคัญ เช่น อายุ อัตราภาษีทรัพย์สิน อัตราการเกิดอาชญากรรม และแม้กระทั่งความใกล้ชิดกับศูนย์จัดหางาน ซึ่งอาจส่งผลต่อราคาที่อยู่อาศัย
ชุดข้อมูลมีขนาดเล็กและเรียบง่าย ทำให้ง่ายต่อการทดลองกับมือใหม่ หากต้องการทราบปัจจัยที่มีอิทธิพลต่อราคาอสังหาริมทรัพย์ในบอสตัน เทคนิคการถดถอยถูกนำมาใช้อย่างมากกับพารามิเตอร์ต่างๆ เป็นสถานที่ที่ดีในการฝึกเทคนิคการถดถอยและประเมินว่าพวกมันทำงานได้ดีเพียงใด
4. การทดสอบคุณภาพไวน์
ไวน์เป็นเครื่องดื่มแอลกอฮอล์ที่ไม่ธรรมดาซึ่งต้องใช้เวลาหมักนานหลายปี ส่งผลให้ขวดไวน์โบราณเป็นไวน์ที่มีราคาแพงและมีคุณภาพสูง การเลือกขวดไวน์ในอุดมคตินั้นต้องใช้ความรู้ในการชิมไวน์นานหลายปี และอาจเป็นกระบวนการที่พลาดไม่ได้
โครงการทดสอบคุณภาพไวน์ประเมินไวน์โดยใช้การทดสอบทางเคมีกายภาพ เช่น ระดับแอลกอฮอล์ ความเป็นกรดคงที่ ความหนาแน่น pH และปัจจัยอื่นๆ โครงการนี้ยังกำหนดเกณฑ์คุณภาพและปริมาณของไวน์อีกด้วย เป็นผลให้การซื้อไวน์กลายเป็นเรื่องง่าย
5. การทำนายตลาดหุ้น
ความคิดริเริ่มนี้น่าสนใจว่าคุณทำงานในภาคการเงินหรือไม่ ข้อมูลตลาดหุ้นได้รับการศึกษาอย่างกว้างขวางโดยนักวิชาการ ธุรกิจ และแม้กระทั่งในฐานะแหล่งรายได้รอง ความสามารถของนักวิทยาศาสตร์ข้อมูลในการศึกษาและสำรวจข้อมูลอนุกรมเวลาก็มีความสำคัญเช่นกัน ข้อมูลจากตลาดหุ้นเป็นจุดเริ่มต้นที่ดี
สาระสำคัญของความพยายามคือการคาดการณ์มูลค่าหุ้นในอนาคต ทั้งนี้ขึ้นอยู่กับประสิทธิภาพของตลาดในปัจจุบันตลอดจนสถิติจากปีก่อนหน้า Kaggle ได้รวบรวมข้อมูลในดัชนี NIFTY-50 มาตั้งแต่ปี 2000 และปัจจุบันมีการอัปเดตทุกสัปดาห์ ตั้งแต่วันที่ 1 มกราคม พ.ศ. 2000 ได้มีการควบคุมราคาหุ้นสำหรับองค์กรต่างๆ กว่า 50 แห่ง
6. แนะนำหนัง
ฉันแน่ใจว่าคุณมีความรู้สึกนั้นหลังจากได้ดูหนังดีๆ คุณเคยรู้สึกถึงแรงกระตุ้นที่จะกระตุ้นประสาทสัมผัสของคุณด้วยการชมภาพยนตร์ที่คล้ายคลึงกันหรือไม่?
เราทราบดีว่าบริการ OTT เช่น Netflix ได้ปรับปรุงระบบแนะนำอย่างมาก ในฐานะนักเรียนแมชชีนเลิร์นนิง คุณจะต้องเข้าใจว่าอัลกอริทึมดังกล่าวกำหนดเป้าหมายลูกค้าตามความชอบและความเห็นของพวกเขาอย่างไร
ชุดข้อมูล IMDB บน Kaggle นั้นน่าจะเป็นหนึ่งในชุดข้อมูลที่สมบูรณ์ที่สุด ซึ่งช่วยให้สามารถอนุมานแบบจำลองคำแนะนำตามชื่อภาพยนตร์ การให้คะแนนของลูกค้า ประเภท และปัจจัยอื่นๆ นอกจากนี้ยังเป็นวิธีที่ยอดเยี่ยมในการเรียนรู้เกี่ยวกับการกรองตามเนื้อหาและวิศวกรรมคุณลักษณะ
7. โหลดการคาดการณ์คุณสมบัติ
โลกหมุนรอบสินเชื่อ แหล่งกำไรหลักของธนาคารมาจากดอกเบี้ยเงินกู้ ดังนั้นพวกเขาจึงเป็นธุรกิจพื้นฐานของพวกเขา
บุคคลหรือกลุ่มบุคคลสามารถขยายเศรษฐกิจได้โดยการลงทุนเงินในบริษัทโดยหวังว่าจะเห็นมูลค่าเพิ่มขึ้นในอนาคต บางครั้งก็เป็นสิ่งสำคัญที่จะแสวงหาเงินกู้เพื่อให้สามารถรับความเสี่ยงในลักษณะนี้และแม้กระทั่งมีส่วนร่วมในความสุขทางโลกบางอย่าง
ก่อนที่เงินกู้จะได้รับการยอมรับ โดยปกติธนาคารจะมีขั้นตอนที่เข้มงวดในการปฏิบัติตาม เนื่องจากเงินกู้เป็นส่วนสำคัญในชีวิตของผู้คนจำนวนมาก การคาดการณ์การมีสิทธิ์ได้รับเงินกู้ที่มีผู้ยื่นขอจะเป็นประโยชน์อย่างยิ่ง ซึ่งช่วยให้สามารถวางแผนได้ดีขึ้นนอกเหนือจากการรับหรือปฏิเสธเงินกู้
8. การวิเคราะห์ความเชื่อมั่นโดยใช้ Twitter Data
ด้วย เครือข่ายโซเชียลมีเดีย เช่น Twitter, Facebook และ Reddit การคาดการณ์ความคิดเห็นและแนวโน้มนั้นง่ายมาก ข้อมูลนี้ใช้เพื่อขจัดความคิดเห็นเกี่ยวกับเหตุการณ์ ผู้คน กีฬา และหัวข้ออื่นๆ ความคิดริเริ่มของแมชชีนเลิร์นนิงที่เกี่ยวข้องกับการทำเหมืองความคิดเห็นถูกนำไปใช้ในสภาพแวดล้อมที่หลากหลาย รวมถึงแคมเปญทางการเมืองและการประเมินผลิตภัณฑ์ของ Amazon
โครงการนี้จะดูยอดเยี่ยมในพอร์ตโฟลิโอของคุณ! สำหรับการตรวจจับอารมณ์และการวิเคราะห์ตามมุมมอง สามารถใช้เทคนิคต่างๆ เช่น เครื่องสนับสนุนเวกเตอร์ การถดถอย และอัลกอริธึมการจำแนกประเภทได้อย่างกว้างขวาง (ค้นหาข้อเท็จจริงและความคิดเห็น)
9. การคาดการณ์ยอดขายในอนาคต
ธุรกิจ B2C และผู้ค้ารายใหญ่ต้องการทราบว่าผลิตภัณฑ์แต่ละรายการในสินค้าคงคลังจะขายได้เท่าใด การพยากรณ์ยอดขายช่วยเจ้าของธุรกิจในการพิจารณาว่ารายการใดเป็นที่ต้องการสูง การคาดการณ์ยอดขายที่แม่นยำจะช่วยลดการสูญเสียได้อย่างมาก ในขณะเดียวกันก็กำหนดผลกระทบที่เพิ่มขึ้นต่องบประมาณในอนาคตด้วย
ผู้ค้าปลีกเช่น Walmart, IKEA, Big Basket และ Big Bazaar ใช้การคาดการณ์ยอดขายเพื่อประเมินความต้องการผลิตภัณฑ์ คุณต้องคุ้นเคยกับเทคนิคต่างๆ ในการล้างข้อมูลดิบเพื่อสร้างโปรเจ็กต์ ML ดังกล่าว นอกจากนี้ จำเป็นต้องมีความเข้าใจที่ดีเกี่ยวกับการวิเคราะห์การถดถอย โดยเฉพาะการถดถอยเชิงเส้นอย่างง่าย
สำหรับงานประเภทนี้ คุณจะต้องใช้ห้องสมุดเช่น Dora, Scrubadub, Pandas, NumPy และอื่นๆ
10. การตรวจจับข่าวปลอม
เป็นอีกหนึ่งความพยายามในการเรียนรู้ของเครื่องที่ล้ำสมัยซึ่งมุ่งเป้าไปที่เด็กนักเรียน ข่าวปลอมกำลังแพร่กระจายเหมือนไฟป่าอย่างที่เรารู้ ทุกอย่างพร้อมใช้งานบนโซเชียลมีเดีย ตั้งแต่การเชื่อมโยงบุคคลไปจนถึงการอ่านข่าวประจำวัน
ด้วยเหตุนี้ การตรวจหาข่าวเท็จจึงยากขึ้นในทุกวันนี้ เครือข่ายโซเชียลมีเดียขนาดใหญ่หลายแห่ง เช่น Facebook และ Twitter มีอัลกอริทึมสำหรับตรวจจับข่าวปลอมในการโพสต์และฟีด
เพื่อระบุข่าวเท็จ โปรเจ็กต์ ML ประเภทนี้จำเป็นต้องมีความเข้าใจอย่างถี่ถ้วนเกี่ยวกับแนวทาง NLP ที่หลากหลายและอัลกอริธึมการจัดหมวดหมู่ (PassiveAggressiveClassifier หรือ Naive Bayes classifier)
11. ทำนายการซื้อคูปอง
ลูกค้าใคร่ครวญการซื้อทางออนไลน์มากขึ้นเมื่อโคโรนาไวรัสโจมตีโลกในปี 2020 ด้วยเหตุนี้ สถานประกอบการช้อปปิ้งจึงถูกบังคับให้เปลี่ยนธุรกิจออนไลน์
ในทางกลับกัน ลูกค้ายังคงมองหาข้อเสนอดีๆ เช่นเดียวกับในร้านค้า และกำลังมองหาคูปองที่ประหยัดสุดๆ มากขึ้นเรื่อยๆ มีแม้กระทั่งเว็บไซต์ที่ทุ่มเทให้กับการสร้างคูปองสำหรับลูกค้าดังกล่าว คุณสามารถเรียนรู้เกี่ยวกับการขุดข้อมูลในแมชชีนเลิร์นนิง การสร้างกราฟแท่ง แผนภูมิวงกลม และฮิสโตแกรมเพื่อแสดงข้อมูลเป็นภาพ และวิศวกรรมคุณลักษณะด้วยโปรเจ็กต์นี้
ในการสร้างการคาดคะเน คุณยังสามารถดูวิธีการใส่ข้อมูลเพื่อจัดการค่า NA และความคล้ายคลึงของโคไซน์ของตัวแปรได้
12. การทำนายการปั่นของลูกค้า
ผู้บริโภคเป็นทรัพย์สินที่สำคัญที่สุดของบริษัท และการรักษาไว้นั้นเป็นสิ่งสำคัญสำหรับธุรกิจใดๆ ที่มุ่งหวังที่จะเพิ่มรายได้และสร้างความสัมพันธ์ที่มีความหมายในระยะยาวกับพวกเขา
นอกจากนี้ ต้นทุนในการหาลูกค้าใหม่ยังสูงกว่าต้นทุนการรักษาลูกค้าเดิมถึงห้าเท่า Customer Churn/Attrition เป็นปัญหาทางธุรกิจที่รู้จักกันดีซึ่งลูกค้าหรือสมาชิกหยุดทำธุรกิจกับบริการหรือบริษัท
พวกเขาจะไม่เป็นลูกค้าที่จ่ายเงินอีกต่อไป ลูกค้าจะถือว่าปั่นป่วนหากเป็นเวลาที่กำหนดตั้งแต่ลูกค้าโต้ตอบกับบริษัทครั้งล่าสุด การระบุว่าลูกค้าจะเลิกใช้งานหรือไม่ รวมถึงการให้ข้อมูลที่เกี่ยวข้องโดยมุ่งเป้าไปที่การรักษาลูกค้าอย่างรวดเร็วหรือไม่ มีความสำคัญต่อการลดการเลิกรา
สมองของเราไม่สามารถคาดการณ์การหมุนเวียนของลูกค้าสำหรับลูกค้าหลายล้านราย ที่นี่เป็นที่ที่การเรียนรู้ของเครื่องสามารถช่วยได้
13. การพยากรณ์การขายของ Wallmart
แอปพลิเคชั่นที่โดดเด่นที่สุดของแมชชีนเลิร์นนิงคือการคาดการณ์ยอดขาย ซึ่งเกี่ยวข้องกับการตรวจจับลักษณะเฉพาะที่มีอิทธิพลต่อการขายผลิตภัณฑ์และการคาดการณ์ปริมาณการขายในอนาคต
ชุดข้อมูล Walmart ซึ่งประกอบด้วยข้อมูลการขายจาก 45 แห่ง ใช้ในการศึกษาแมชชีนเลิร์นนิงนี้ ยอดขายต่อร้านค้า ตามหมวดหมู่ เป็นรายสัปดาห์รวมอยู่ในชุดข้อมูล วัตถุประสงค์ของโครงการแมชชีนเลิร์นนิงนี้คือการคาดการณ์ยอดขายสำหรับแต่ละแผนกในแต่ละร้าน เพื่อให้พวกเขาสามารถเพิ่มประสิทธิภาพช่องทางที่ขับเคลื่อนด้วยข้อมูลและการตัดสินใจวางแผนสินค้าคงคลังได้ดีขึ้น
การทำงานกับชุดข้อมูลของ Walmart นั้นทำได้ยาก เนื่องจากมีการเลือกเหตุการณ์ลดราคาที่มีผลกระทบต่อยอดขายและควรพิจารณา
14. การวิเคราะห์ข้อมูล Uber
เมื่อพูดถึงการใช้งานและการบูรณาการแมชชีนเลิร์นนิงและการเรียนรู้เชิงลึกในแอปของพวกเขา บริการแชร์รถยอดนิยมนั้นอยู่ไม่ไกลหลัง ทุกปีจะมีการประมวลผลการเดินทางหลายพันล้านครั้ง ทำให้ผู้สัญจรสามารถเดินทางได้ตลอดเวลาทั้งกลางวันและกลางคืน
เนื่องจากมีฐานลูกค้าขนาดใหญ่ จึงต้องการการบริการลูกค้าที่ยอดเยี่ยมเพื่อจัดการกับข้อร้องเรียนของผู้บริโภคโดยเร็วที่สุด
Uber มีชุดข้อมูลการรับส่งนับล้านที่สามารถใช้ในการวิเคราะห์และแสดงการเดินทางของลูกค้าเพื่อเปิดเผยข้อมูลเชิงลึกและปรับปรุงประสบการณ์ของลูกค้า
15. การวิเคราะห์ Covid-19
โควิด-19 ได้แพร่กระจายไปทั่วโลกในวันนี้ ไม่ใช่แค่ในแง่ของการระบาดใหญ่ ในขณะที่ผู้เชี่ยวชาญทางการแพทย์กำลังจดจ่ออยู่กับการสร้างวัคซีนที่มีประสิทธิภาพและสร้างภูมิคุ้มกันให้กับโลก นักวิทยาศาสตร์ข้อมูล อยู่ไม่ไกลหลัง
ผู้ป่วยรายใหม่ จำนวนแอคทีฟรายวัน ผู้เสียชีวิต และสถิติการทดสอบทั้งหมดถูกเปิดเผยต่อสาธารณะ การคาดการณ์จะทำในแต่ละวันโดยอิงจากการระบาดของโรคซาร์สในศตวรรษก่อนหน้า สำหรับสิ่งนี้ คุณสามารถใช้การวิเคราะห์การถดถอยและสนับสนุนแบบจำลองการทำนายแบบเวกเตอร์โดยใช้เครื่อง
สรุป
โดยสรุป เราได้พูดถึงโปรเจ็กต์ ML ชั้นนำบางโปรเจ็กต์ที่จะช่วยคุณในการทดสอบการเขียนโปรแกรมแมชชีนเลิร์นนิง รวมถึงการทำความเข้าใจแนวคิดและการนำไปใช้ การรู้วิธีผสานรวม Machine Learning สามารถช่วยให้คุณก้าวหน้าในอาชีพได้เนื่องจากเทคโนโลยีเข้ามาแทนที่ในทุกอุตสาหกรรม
ในขณะที่เรียนรู้แมชชีนเลิร์นนิง เราขอแนะนำให้คุณฝึกฝนแนวคิดและเขียนอัลกอริทึมทั้งหมดของคุณ การเขียนอัลกอริธึมในขณะที่เรียนรู้มีความสำคัญมากกว่าการทำโครงงาน และยังช่วยให้คุณเข้าใจวิชาต่างๆ ได้อย่างถูกต้องอีกด้วย
เขียนความเห็น