Mục lục[Ẩn giấu][Chỉ]
- 1. Theo bạn MLOps có nghĩa là gì?
- 2. Các nhà khoa học dữ liệu, kỹ sư dữ liệu và kỹ sư ML khác nhau như thế nào?
- 3. Điều gì phân biệt MLOps với ModelOps và AIOps?
- 4. Bạn có thể cho tôi biết một số lợi ích của MLOps?
- 5. Bạn có thể cho tôi biết các thành phần của MLOps?
- 6. Những rủi ro nào xảy ra với việc sử dụng khoa học dữ liệu?
- 7. Bạn có thể giải thích, mô hình drift là gì?
- 8. Theo bạn, có bao nhiêu cách MLO khác nhau có thể được áp dụng?
- 9. Điều gì ngăn cách giữa triển khai tĩnh và triển khai động?
- 10. Bạn biết những kỹ thuật kiểm tra sản xuất nào?
- 11. Điều gì phân biệt xử lý luồng với xử lý hàng loạt?
- 12. Bạn có nghĩa là gì khi Đào tạo Phục vụ Skew?
- 13. Bạn hiểu Model Registry là gì?
- 14. Bạn có thể nói rõ hơn về những lợi ích của Đăng ký Mô hình?
- 15. Bạn có thể giải thích các hoạt động của kỹ thuật Champion-Challenger?
- 16. Mô tả các ứng dụng cấp doanh nghiệp của vòng đời MLOps?
- Kết luận
Các công ty đang sử dụng các công nghệ mới nổi như trí tuệ nhân tạo (AI) và máy học (ML) thường xuyên hơn để tăng khả năng tiếp cận thông tin và dịch vụ của công chúng.
Những công nghệ này ngày càng được sử dụng rộng rãi trong nhiều lĩnh vực, bao gồm ngân hàng, tài chính, bán lẻ, sản xuất và thậm chí là chăm sóc sức khỏe.
Các nhà khoa học dữ liệu, kỹ sư học máy và kỹ sư về trí tuệ nhân tạo đang có nhu cầu ngày càng nhiều từ các công ty.
Biết điều có thể học máy Các câu hỏi phỏng vấn hoạt động mà các nhà quản lý tuyển dụng và nhà tuyển dụng có thể đặt ra cho bạn là điều cần thiết nếu bạn muốn làm việc trong lĩnh vực ML hoặc MLOps.
Bạn có thể học cách trả lời một số câu hỏi phỏng vấn MLOps trong bài đăng này khi bạn nỗ lực để có được công việc mơ ước của mình.
1. Theo bạn MLOps có nghĩa là gì?
Chủ đề vận hành các mô hình ML là trọng tâm của MLOps, còn được gọi là Hoạt động học máy, một lĩnh vực đang phát triển trong lĩnh vực AI / DS / ML lớn hơn.
Mục tiêu chính của phương pháp tiếp cận và văn hóa kỹ thuật phần mềm được gọi là MLOps là tích hợp việc tạo ra các mô hình học máy / khoa học dữ liệu và quá trình vận hành (Ops) sau đó của chúng.
DevOps và MLOps thông thường chia sẻ những điểm tương đồng nhất định, tuy nhiên, MLOps cũng khác rất nhiều so với DevOps truyền thống.
MLOps thêm một lớp phức tạp mới bằng cách tập trung vào dữ liệu, trong khi DevOps chủ yếu tập trung vào việc vận hành mã và các bản phát hành phần mềm không thể ở trạng thái.
Sự kết hợp của ML, Data và Ops là những gì tạo ra tên gọi chung của MLOps (học máy, kỹ thuật dữ liệu và DevOps).
2. Các nhà khoa học dữ liệu, kỹ sư dữ liệu và kỹ sư ML khác nhau như thế nào?
Nó khác nhau, theo ý kiến của tôi, tùy thuộc vào công ty. Môi trường để vận chuyển và chuyển đổi dữ liệu, cũng như lưu trữ dữ liệu, được xây dựng bởi các kỹ sư dữ liệu.
Các nhà khoa học dữ liệu là những chuyên gia sử dụng các kỹ thuật thống kê và khoa học để phân tích dữ liệu và đưa ra kết luận, bao gồm cả việc đưa ra dự đoán về hành vi trong tương lai dựa trên các xu hướng hiện có.
Các kỹ sư phần mềm đã nghiên cứu hoạt động và quản lý cơ sở hạ tầng triển khai cách đây vài năm. Mặt khác, các nhóm Ops đang nghiên cứu sự phát triển trong khi sử dụng cơ sở hạ tầng làm mã. Vị trí DevOps được tạo ra bởi hai luồng này.
MLOps nằm trong cùng danh mục với Nhà khoa học dữ liệu và Kỹ sư dữ liệu. Các kỹ sư dữ liệu đang có được kiến thức về cơ sở hạ tầng cần thiết để hỗ trợ vòng đời của mô hình và tạo đường ống cho quá trình đào tạo liên tục.
Các nhà khoa học dữ liệu tìm cách phát triển khả năng triển khai và cho điểm mô hình của họ.
Một đường ống dữ liệu cấp sản xuất được xây dựng bởi các kỹ sư ML sử dụng cơ sở hạ tầng chuyển đổi dữ liệu thô thành dữ liệu đầu vào cần thiết cho mô hình khoa học dữ liệu, lưu trữ và chạy mô hình, đồng thời xuất ra tập dữ liệu đã được chấm điểm cho các hệ thống hạ nguồn.
Cả kỹ sư dữ liệu và nhà khoa học dữ liệu đều có khả năng trở thành kỹ sư ML.
3. Điều gì phân biệt MLOps với ModelOps và AIOps?
Khi xây dựng end-to-end thuật toán học máy, MLOps là một ứng dụng DevOps bao gồm thu thập dữ liệu, xử lý trước dữ liệu, tạo mô hình, triển khai mô hình trong sản xuất, giám sát mô hình trong sản xuất và nâng cấp mô hình định kỳ.
Việc sử dụng DevOps trong việc xử lý toàn bộ việc triển khai bất kỳ thuật toán nào, chẳng hạn như Mô hình dựa trên quy tắc, được gọi là ModelOps.
CỨU đang tận dụng các nguyên tắc của DevOps để tạo ứng dụng AI ngay từ đầu.
4. Bạn có thể cho tôi biết một số lợi ích của MLOps?
- Các nhà khoa học dữ liệu và nhà phát triển MLOps có thể nhanh chóng chạy lại các thử nghiệm để đảm bảo rằng các mô hình được đào tạo và đánh giá phù hợp vì MLOps giúp tự động hóa tất cả hoặc hầu hết các nhiệm vụ / bước trong MDLC (vòng đời phát triển mô hình). Ngoài ra cho phép dữ liệu và lập phiên bản mô hình.
- Việc đưa các ý tưởng MLOps vào thực tế cho phép các Kỹ sư dữ liệu và Nhà khoa học dữ liệu có quyền truy cập không hạn chế vào các bộ dữ liệu được xây dựng và quản lý, điều này giúp tăng tốc độ phát triển của các mô hình theo cấp số nhân.
- Các nhà khoa học dữ liệu sẽ có thể quay trở lại mô hình hoạt động tốt hơn nếu lần lặp hiện tại không đáp ứng được mong đợi nhờ khả năng có các mô hình và tập dữ liệu được tạo phiên bản, điều này sẽ nâng cao đáng kể dấu vết kiểm tra mô hình.
- Vì các phương pháp MLOps phụ thuộc rất nhiều vào DevOps nên chúng cũng kết hợp một số khái niệm CI/CD, giúp tăng cường chất lượng và độ tin cậy của mã.
5. Bạn có thể cho tôi biết các thành phần của MLOps?
Thiết kế: MLOps bao gồm rất nhiều tư duy thiết kế. Bắt đầu với bản chất của vấn đề, kiểm tra giả thuyết, kiến trúc và triển khai
Xây dựng mô hình: Kiểm tra và xác nhận mô hình là một phần của bước này, cùng với các đường ống kỹ thuật dữ liệu và thử nghiệm để thiết lập hệ thống học máy tốt nhất.
Hoạt động: Mô hình phải được thực hiện như một phần của các hoạt động và được kiểm tra, đánh giá liên tục. Các quy trình CI / CD sau đó được giám sát và bắt đầu sử dụng một công cụ điều phối.
6. Những rủi ro nào xảy ra với việc sử dụng khoa học dữ liệu?
- Rất khó để mở rộng mô hình trên toàn công ty.
- Nếu không có cảnh báo, mô hình sẽ tắt và ngừng hoạt động.
- Hầu hết, độ chính xác của các mô hình trở nên kém đi theo thời gian.
- Mô hình đưa ra các dự đoán không chính xác dựa trên một quan sát cụ thể mà không thể kiểm tra thêm.
- Các nhà khoa học dữ liệu cũng nên duy trì các mô hình, nhưng chúng rất đắt.
- MLOps có thể được sử dụng để giảm những rủi ro này.
7. Bạn có thể giải thích, mô hình drift là gì?
Khi hiệu suất giai đoạn suy luận của một mô hình (sử dụng dữ liệu trong thế giới thực) giảm sút so với hiệu suất giai đoạn huấn luyện của nó, điều này được gọi là độ lệch mô hình, còn được gọi là độ lệch ý tưởng (sử dụng dữ liệu có nhãn, lịch sử).
Hiệu suất của mô hình bị lệch so với các giai đoạn huấn luyện và giao bóng, do đó có tên là “lệch xe lửa / giao bóng”.
Nhiều yếu tố, bao gồm:
- Cách cơ bản mà dữ liệu được phân phối đã thay đổi.
- Khóa đào tạo tập trung vào một số nhóm nhỏ, tuy nhiên, một sự thay đổi về môi trường vừa diễn ra đã bổ sung thêm một lĩnh vực khác.
- Trong những khó khăn về NLP, dữ liệu trong thế giới thực có số lượng mã thông báo lớn hơn không tương xứng so với dữ liệu đào tạo.
- Các sự cố không mong muốn, chẳng hạn như một mô hình được xây dựng trên dữ liệu trước COVID được dự đoán sẽ hoạt động kém hơn đáng kể trên dữ liệu được thu thập trong đợt dịch COVID-19.
Theo dõi liên tục hoạt động của mô hình luôn được yêu cầu để xác định sự trôi dạt của mô hình.
Việc đào tạo lại người mẫu gần như luôn luôn được yêu cầu như một biện pháp khắc phục khi có sự sụt giảm liên tục về hiệu suất của người mẫu; lý do của sự suy giảm phải được xác định và các thủ tục điều trị thích hợp phải được sử dụng.
8. Theo bạn, có bao nhiêu cách MLO khác nhau có thể được áp dụng?
Có ba phương pháp để đưa MLOps vào thực tế:
MLOps mức 0 (Quy trình thủ công): Ở cấp độ này, tất cả các bước — bao gồm chuẩn bị, phân tích và đào tạo dữ liệu — được thực hiện theo cách thủ công. Mỗi giai đoạn phải được thực hiện thủ công, cũng như chuyển đổi từ giai đoạn này sang giai đoạn tiếp theo.
Tiền đề cơ bản là nhóm khoa học dữ liệu của bạn chỉ quản lý một số lượng nhỏ các mô hình không được cập nhật thường xuyên.
Do đó, không có Tích hợp liên tục (CI) hoặc Triển khai liên tục (CD) và kiểm tra mã thường được tích hợp vào thực thi tập lệnh hoặc thực thi sổ ghi chép, với việc triển khai diễn ra trong một microservice với REST API.
MLOps cấp độ 1 (tự động hóa đường ống ML): Bằng cách tự động hóa quy trình ML, mục tiêu là liên tục đào tạo mô hình (CT). Bạn có thể thực hiện việc cung cấp dịch vụ dự đoán mô hình liên tục theo cách này.
Việc chúng tôi triển khai toàn bộ quy trình đào tạo đảm bảo rằng mô hình được đào tạo tự động trong quá trình sản xuất bằng cách sử dụng dữ liệu mới dựa trên các trình kích hoạt đường ống đang hoạt động.
MLOps cấp độ 2 (tự động hóa đường ống CI / CD): Nó cao hơn một bước so với mức MLOps. Cần có hệ thống CI / CD tự động mạnh nếu bạn muốn cập nhật các đường ống dẫn trong sản xuất một cách nhanh chóng và đáng tin cậy:
- Bạn tạo mã nguồn và thực hiện nhiều thử nghiệm trong suốt giai đoạn CI. Các gói, tệp thực thi và tạo tác là kết quả đầu ra của giai đoạn, sẽ được triển khai sau đó.
- Các tạo tác được tạo bởi giai đoạn CI được triển khai tới môi trường đích trong bước CD. Một đường ống được triển khai với việc thực hiện mô hình đã sửa đổi là đầu ra của giai đoạn.
- Trước khi quy trình bắt đầu lặp lại thử nghiệm mới, các nhà khoa học dữ liệu vẫn phải thực hiện giai đoạn phân tích dữ liệu và mô hình theo cách thủ công.
9. Điều gì ngăn cách giữa triển khai tĩnh và triển khai động?
Mô hình được đào tạo ngoại tuyến cho Triển khai tĩnh. Nói cách khác, chúng tôi đào tạo mô hình chính xác một lần và sau đó sử dụng nó trong một thời gian. Sau khi mô hình đã được đào tạo cục bộ, nó được lưu trữ và gửi đến máy chủ để sử dụng để đưa ra các dự đoán thời gian thực.
Mô hình sau đó được phân phối dưới dạng phần mềm ứng dụng có thể cài đặt. một chương trình cho phép chấm điểm hàng loạt các yêu cầu, như một minh họa.
Mô hình được đào tạo trực tuyến cho Triển khai động. Có nghĩa là, dữ liệu mới liên tục được thêm vào hệ thống và mô hình được cập nhật liên tục để giải thích cho nó.
Do đó, bạn có thể đưa ra dự đoán bằng cách sử dụng máy chủ theo yêu cầu. Sau đó, mô hình được đưa vào sử dụng bằng cách được cung cấp dưới dạng điểm cuối API phản ứng với các truy vấn của người dùng, sử dụng khung web như Flask hoặc FastAPI.
10. Bạn biết những kỹ thuật kiểm tra sản xuất nào?
Kiểm tra hàng loạt: Bằng cách tiến hành thử nghiệm trong một cài đặt khác với môi trường đào tạo của nó, nó sẽ xác minh mô hình. Sử dụng các số liệu được lựa chọn, chẳng hạn như độ chính xác, RMSE, v.v., kiểm tra hàng loạt được thực hiện trên một nhóm mẫu dữ liệu để xác minh suy luận của mô hình.
Thử nghiệm hàng loạt có thể được thực hiện trên nhiều nền tảng điện toán khác nhau, chẳng hạn như máy chủ thử nghiệm, máy chủ từ xa hoặc đám mây. Thông thường, mô hình được cung cấp dưới dạng tệp tuần tự hóa, tệp này được tải dưới dạng đối tượng và được suy ra từ dữ liệu thử nghiệm.
Thử nghiệm A / B: Nó thường được sử dụng để phân tích các chiến dịch tiếp thị cũng như thiết kế các dịch vụ (trang web, ứng dụng di động, v.v.).
Dựa trên công ty hoặc hoạt động, các phương pháp tiếp cận thống kê được sử dụng để phân tích kết quả của thử nghiệm A / B để quyết định mô hình nào sẽ hoạt động tốt hơn trong sản xuất. Thông thường, thử nghiệm A / B được thực hiện theo cách sau:
- Dữ liệu trực tiếp hoặc thời gian thực được chia hoặc phân đoạn thành hai tập hợp, tập hợp A và tập hợp B.
- Dữ liệu Nhóm A được gửi đến mô hình lỗi thời, trong khi dữ liệu Nhóm B được gửi đến mô hình đã cập nhật.
- Tùy thuộc vào trường hợp sử dụng kinh doanh hoặc các quy trình, một số phương pháp thống kê có thể được sử dụng để đánh giá hiệu suất của mô hình (ví dụ, độ chính xác, độ chính xác, v.v.) để xác định xem mô hình mới (mô hình B) có tốt hơn mô hình cũ (mô hình A) hay không.
- Sau đó, chúng tôi thực hiện kiểm định giả thuyết thống kê: Giả thuyết không nói rằng mô hình mới không ảnh hưởng đến giá trị trung bình của các chỉ số kinh doanh đang được theo dõi. Theo giả thuyết thay thế, mô hình mới làm tăng giá trị trung bình của các chỉ số kinh doanh giám sát.
- Cuối cùng, chúng tôi đánh giá xem mô hình mới có dẫn đến sự cải thiện đáng kể trong các KPI kinh doanh nhất định hay không.
Kiểm tra bóng hoặc sân khấu: Một mô hình được đánh giá trong một bản sao của môi trường sản xuất trước khi được sử dụng trong sản xuất (môi trường dàn dựng).
Điều này rất quan trọng để xác định hiệu suất của mô hình với dữ liệu thời gian thực và xác nhận khả năng phục hồi của mô hình. được thực hiện bằng cách suy ra dữ liệu tương tự như đường ống sản xuất và phân phối nhánh đã phát triển hoặc một mô hình được thử nghiệm trên máy chủ dàn.
Hạn chế duy nhất là không có lựa chọn kinh doanh nào sẽ được thực hiện trên máy chủ dàn hoặc hiển thị cho người dùng cuối do kết quả của nhánh phát triển.
Khả năng phục hồi và hiệu suất của mô hình sẽ được đánh giá thống kê bằng cách sử dụng các kết quả của môi trường dàn dựng bằng cách sử dụng các thước đo thích hợp.
11. Điều gì phân biệt xử lý luồng với xử lý hàng loạt?
Chúng tôi có thể sử dụng các đặc điểm mà chúng tôi sử dụng để đưa ra dự báo thời gian thực bằng hai phương pháp xử lý: hàng loạt và luồng.
Quá trình thực thi các tính năng từ thời điểm trước cho một đối tượng cụ thể, sau đó được sử dụng để tạo các dự đoán thời gian thực.
- Tại đây, chúng tôi có thể thực hiện các tính toán tính năng chuyên sâu ngoại tuyến và chuẩn bị dữ liệu để suy luận nhanh chóng.
- Tuy nhiên, các tính năng đã được xác định trước trong quá khứ. Đây có thể là một nhược điểm lớn nếu tiên lượng của bạn dựa trên những lần xuất hiện gần đây. (Ví dụ: xác định các giao dịch gian lận càng sớm càng tốt.)
Với các tính năng phát trực tuyến gần thời gian thực cho một thực thể cụ thể, việc suy luận được thực hiện trong quá trình xử lý luồng trên một tập hợp đầu vào nhất định.
- Ở đây, bằng cách cung cấp cho mô hình các tính năng phát trực tuyến, thời gian thực, chúng tôi có thể nhận được các dự đoán chính xác hơn.
- Tuy nhiên, cần có thêm cơ sở hạ tầng để xử lý luồng và duy trì luồng dữ liệu (Kafka, Kinesis, v.v.). (Apache Flink, Beam, v.v.)
12. Bạn có nghĩa là gì khi Đào tạo Phục vụ Skew?
Chênh lệch giữa thành tích khi giao bóng và thành tích trong quá trình huấn luyện được gọi là độ lệch khi giao bóng trong quá trình huấn luyện. Sự lệch này có thể được tạo ra bởi các yếu tố sau:
- Sự khác biệt trong cách bạn xử lý dữ liệu giữa các đường ống phục vụ và đào tạo.
- Sự thay đổi dữ liệu từ đào tạo sang dịch vụ của bạn.
- Kênh phản hồi giữa thuật toán và mô hình của bạn.
13. Bạn hiểu Model Registry là gì?
Cơ quan đăng ký mô hình là một kho lưu trữ trung tâm, nơi người tạo mô hình có thể xuất bản các mô hình phù hợp để sử dụng trong sản xuất.
Các nhà phát triển có thể cộng tác với các nhóm khác và các bên liên quan để quản lý tuổi thọ của tất cả các mô hình bên trong doanh nghiệp bằng cách sử dụng sổ đăng ký. Một nhà khoa học dữ liệu có thể tải các mô hình được đào tạo lên sổ đăng ký mô hình.
Các mô hình được chuẩn bị để thử nghiệm, xác nhận và triển khai sản xuất sau khi chúng được đăng ký. Ngoài ra, các mô hình đã đào tạo được lưu trữ trong sổ đăng ký mô hình để truy cập nhanh chóng bằng bất kỳ ứng dụng hoặc dịch vụ tích hợp nào.
Để kiểm tra, đánh giá và triển khai mô hình vào sản xuất, Nhà phát triển phần mềm và người đánh giá có thể nhanh chóng nhận ra và chỉ chọn phiên bản tốt nhất của các mô hình được đào tạo (dựa trên các tiêu chí đánh giá).
14. Bạn có thể nói rõ hơn về những lợi ích của Đăng ký Mô hình?
Sau đây là một số cách mô hình đăng ký hợp lý hóa quản lý vòng đời của mô hình:
- Để triển khai dễ dàng hơn, hãy lưu các yêu cầu về thời gian chạy và siêu dữ liệu cho các mô hình được đào tạo của bạn.
- Các mô hình đã qua đào tạo, đã triển khai và đã ngừng hoạt động của bạn phải được đăng ký, theo dõi và tạo phiên bản trong một kho lưu trữ tập trung, có thể tìm kiếm được.
- Tạo các đường ống tự động cho phép liên tục phân phối, đào tạo và tích hợp mô hình sản xuất của bạn.
- So sánh các mô hình mới được đào tạo (hoặc mô hình thách thức) trong môi trường dàn dựng với các mô hình hiện đang hoạt động sản xuất (mô hình vô địch).
15. Bạn có thể giải thích các hoạt động của kỹ thuật Champion-Challenger?
Có thể kiểm tra các quyết định vận hành khác nhau trong quá trình sản xuất bằng kỹ thuật Champion Challenger. Bạn có thể đã nghe nói về thử nghiệm A / B trong bối cảnh tiếp thị.
Ví dụ: bạn có thể viết hai dòng chủ đề riêng biệt và phân phối chúng ngẫu nhiên cho nhân khẩu học mục tiêu của mình để tối đa hóa tỷ lệ mở cho một chiến dịch email.
Hệ thống ghi lại hiệu suất của email (tức là hành động mở email) liên quan đến dòng chủ đề của nó, cho phép bạn so sánh tỷ lệ mở của từng dòng chủ đề để xác định cách nào là hiệu quả nhất.
Champion-Challenger có thể so sánh với thử nghiệm A / B về mặt này. Bạn có thể sử dụng logic quyết định để đánh giá từng kết quả và chọn kết quả hiệu quả nhất khi bạn thử nghiệm với các phương pháp khác nhau để đi đến lựa chọn.
Mô hình thành công nhất tương quan với nhà vô địch. Người thách thức đầu tiên và danh sách phù hợp của những người thách thức hiện là tất cả những gì có mặt trong giai đoạn thực hiện đầu tiên thay vì nhà vô địch.
Nhà vô địch được hệ thống chọn để thực hiện các bước công việc tiếp theo.
Những người thách thức tương phản với nhau. Nhà vô địch mới sau đó được xác định bởi người thách thức tạo ra kết quả lớn nhất.
Các nhiệm vụ liên quan đến quá trình so sánh kẻ thách thức nhà vô địch được liệt kê chi tiết hơn bên dưới:
- Đánh giá từng mô hình đối thủ.
- Đánh giá điểm số cuối cùng.
- So sánh các kết quả đánh giá để xác định người thách thức chiến thắng.
- Thêm nhà vô địch mới vào kho lưu trữ
16. Mô tả các ứng dụng cấp doanh nghiệp của vòng đời MLOps?
Chúng ta cần dừng việc coi học máy chỉ là một thử nghiệm lặp đi lặp lại để các mô hình học máy đi vào sản xuất. MLOps là sự kết hợp của kỹ thuật phần mềm với máy học.
Kết quả hoàn thành nên được hình dung như vậy. Do đó, mã cho một sản phẩm công nghệ phải được thử nghiệm, chức năng và mô-đun.
MLOps có tuổi thọ tương đương với luồng học máy thông thường, ngoại trừ mô hình được giữ nguyên trong quá trình cho đến khi sản xuất.
Sau đó, các Kỹ sư MLOps luôn theo dõi điều này để đảm bảo chất lượng mô hình trong quá trình sản xuất là đúng như dự kiến.
Dưới đây là một số trường hợp sử dụng cho một số công nghệ MLOps:
- Cơ quan đăng ký mô hình: Đó là những gì nó có vẻ như vậy. Các nhóm lớn hơn lưu trữ và duy trì theo dõi các mô hình phiên bản trong sổ đăng ký mô hình. Ngay cả việc quay lại phiên bản trước cũng là một lựa chọn.
- Lưu trữ tính năng: Khi xử lý các tập dữ liệu lớn hơn, có thể có các phiên bản riêng biệt của tập dữ liệu phân tích và tập hợp con cho các tác vụ cụ thể. Kho tính năng là một cách tiện lợi và tiên tiến để sử dụng công việc chuẩn bị dữ liệu từ các lần chạy trước đó hoặc từ các nhóm khác.
- Lưu trữ siêu dữ liệu: Điều quan trọng là phải theo dõi siêu dữ liệu một cách chính xác trong suốt quá trình sản xuất nếu dữ liệu phi cấu trúc, chẳng hạn như dữ liệu hình ảnh và văn bản, được sử dụng thành công.
Kết luận
Điều quan trọng cần lưu ý là, trong phần lớn các trường hợp, người phỏng vấn đang tìm kiếm một hệ thống, trong khi ứng viên đang tìm kiếm một giải pháp.
Đầu tiên là dựa trên kỹ năng kỹ thuật của bạn, trong khi thứ hai là tất cả về phương pháp bạn sử dụng để chứng minh năng lực của bạn.
Có một số thủ tục bạn nên thực hiện khi trả lời các câu hỏi phỏng vấn MLOps để giúp người phỏng vấn hiểu rõ hơn về cách bạn định đánh giá và giải quyết vấn đề đang gặp phải.
Nồng độ của chúng tập trung vào phản ứng không chính xác hơn là phản ứng đúng. Giải pháp kể một câu chuyện và hệ thống của bạn là minh họa tốt nhất cho kiến thức và năng lực giao tiếp của bạn.
Bình luận