Table di cuntinutu[Piattà][Mostra]
- 1. Chì vulete dì per MLOps ?
- 2. Cumu i scientifichi di dati, l'ingegneri di dati è l'ingegneri ML varienu l'un l'altru?
- 3. Chì distingue MLOps da ModelOps è AIOps ?
- 4. Pudete dì à mè certi di i benefici di MLOps?
- 5. Pudete dì à mè i cumpunenti di MLOps?
- 6. Chì risichi vene cù l'usu di a scienza di dati?
- 7. Pudete spiegà, chì hè a deriva di mudellu?
- 8. Quantu modi diffirenti ponu esse applicati MLOps, in u vostru parè ?
- 9. Ciò chì separa a implementazione statica da a distribuzione dinamica?
- 10. Chì tecnichi di teste di pruduzzione cunnosci ?
- 11. Ciò chì distingue u prucessu di flussu da u prucessu di batch?
- 12. Chì vulete dì per Training Serving Skew?
- 13. Chì vulete dì per u Registru Modellu ?
- 14. Pudete elaburà nantu à i benefici di u Registru Modellu?
- 15. Pudete spiegà u travagliu di a tecnica Champion-Challenger?
- 16. Descrive l'applicazioni à livellu di l'impresa di u ciclu di vita MLOps?
- cunchiusioni
L'imprese utilizanu tecnulugia emergenti cum'è l'intelligenza artificiale (AI) è l'apprendimentu automaticu (ML) più spessu per aumentà l'accessibilità di u publicu à l'infurmazioni è i servizii.
Queste tecnulugii sò sempre più usate in una varietà di settori, cumpresi banca, finanza, retail, manufacturing, è ancu sanità.
I scientisti di dati, ingegneri di apprendimentu di macchine è ingegneri in intelligenza artificiale sò dumandati da un numeru crescente di cumpagnie.
Sapendu u pussibule machine learning e dumande di l'entrevista di l'operazione chì i gestori di assunzione è i reclutatori puderanu pose per voi hè essenziale se vulete travaglià in i campi ML o MLOps.
Pudete amparà à risponde à alcune di e dumande di l'entrevista MLOps in questu post mentre travagliate per ottene u vostru travagliu di sognu.
1. Chì vulete dì per MLOps ?
U tema di l'operatività di i mudelli ML hè u focu di MLOps, cunnisciutu ancu Operazioni di Machine Learning, un campu di sviluppu in l'arena più grande AI / DS / ML.
L'obiettivu principale di l'approcciu di l'ingegneria di u software è a cultura cunnisciuta cum'è MLOps hè di integrà a creazione di mudelli di machine learning / data science è a so successiva operalizazione (Ops).
DevOps convenzionali è MLOps sparte certe similitudini, però, MLOps difiere ancu assai da DevOps tradiziunali.
MLOps aghjunghjenu un novu stratu di cumplessità cuncentrandu nantu à e dati, mentri DevOps si focalizeghja principalmente in l'operatività di u codice è di e versioni di software chì ùn ponu esse stati.
A cumminazzioni di ML, Data è Ops hè ciò chì dà MLOps u so nome cumuni (apprendimentu automaticu, ingegneria di dati è DevOps).
2. Cumu i scientifichi di dati, l'ingegneri di dati è l'ingegneri ML varienu l'un l'altru?
Varia, in my opinion, secondu l'impresa. L'ambiente per u trasportu è a trasfurmazioni di e dati, è ancu u so almacenamentu, hè custruitu da ingegneri di dati.
I scientisti di dati sò esperti in l'utilizazione di tecniche scientifiche è statistiche per analizà e dati è tirà cunclusioni, cumpresa a predizioni nantu à u cumpurtamentu futuru basatu nantu à e tendenze chì sò avà in u locu.
L'ingegneri di u software anu studiatu l'operazioni è a gestione di l'infrastruttura di implementazione uni pochi anni fà. E squadre Ops, invece, anu studiatu u sviluppu mentre utilizanu l'infrastruttura cum'è codice. Una pusizioni DevOps hè stata prodotta da sti dui flussi.
MLOps hè in a listessa categuria cum'è Datu Cientista è Data Engineer. L'ingegneri di dati acquistenu cunniscenze nantu à l'infrastruttura necessaria per sustene i cicli di vita di mudelli è creanu pipeline per a furmazione cuntinua.
I scientisti di dati cercanu di sviluppà i so mudelli di implementazione è capacità di scoring.
Un pipeline di dati di qualità di produzzione hè custruitu da ingegneri ML chì utilizanu l'infrastruttura chì trasforma e dati crudi in l'input necessariu da un mudellu di scienza di dati, ospita è gestisce u mudellu, è produce un set di dati puntuatu à i sistemi downstream.
Sia l'ingegneri di dati è i scientisti di dati sò capaci di diventà ingegneri ML.
3. Chì distingue MLOps da ModelOps è AIOps ?
Quandu custruite end-to-end algoritmi di apprendimentu di macchina, MLOps hè una applicazione DevOps chì include a cullizzioni di dati, a pre-processazione di dati, a creazione di mudelli, a implementazione di mudelli in a produzzione, u monitoraghju di mudelli in a produzzione è l'aghjurnamentu periodicu di u mudellu.
L'usu di DevOps in a gestione di tutta l'implementazione di qualsiasi algoritmi, cum'è Modelli Basati in Rule, hè cunnisciutu cum'è ModelOps.
AI Ops sfrutta i principii DevOps per creà app AI da zero.
4. Pudete dì à mè certi di i benefici di MLOps?
- I scientisti di dati è i sviluppatori di MLOps ponu ripete rapidamente i prucessi per assicurà chì i mudelli sò furmati è valutati in modu adattatu, postu chì MLOps aiuta à automatizà tutte o a maiò parte di i travaglii / passi in u MDLC (ciclu di vita di sviluppu di mudellu). In più permette versione di dati è mudelli.
- A mette in pratica l'idee MLOps permette à l'ingegneri di dati è i scientifichi di dati avè un accessu illimitatu à i datasets cultivati è curati, chì acceleranu in modu esponenziale u sviluppu di mudelli.
- I scientisti di dati puderanu ritruvà nantu à u mudellu chì hà fattu megliu se l'iterazione attuale ùn hè micca à l'aspettattivi grazia à a capacità di avè mudelli è datasets versionati, chì aumenterà significativamente a pista di auditu di u mudellu.
- Siccomu i metudi MLOps si basanu fermamente in DevOps, incorporanu ancu una quantità di cuncetti CI/CD, chì aumentanu qualità è affidabilità di u codice.
5. Pudete dì à mè i cumpunenti di MLOps?
Design: MLOps include assai u pensamentu di design. Partendu da a natura di u prublema, teste ipotesi, architettura è implementazione
Edificiu mudellu: A prova è a validazione di mudelli sò parte di questu passu, cù i pipeline di l'ingegneria di dati è l'esperimentazione per stabilisce i migliori sistemi di apprendimentu di macchina.
Docenti: U mudellu deve esse implementatu cum'è parte di l'operazioni è verificatu è evaluatu in permanenza. I prucessi CI / CD sò poi monitorati è cuminciati cù un strumentu d'orchestrazione.
6. Chì risichi vene cù l'usu di a scienza di dati?
- Hè difficiuli di scala u mudellu in tutta a cumpagnia.
- Senza avvisu, u mudellu si chjude è smette di funziunà.
- A maiò parte, a precisione di i mudelli s'aggrava cù u tempu.
- U mudellu face prediczioni imprecisi basatu annantu à una osservazione specifica chì ùn pò micca esse esaminata più.
- I scientifichi di dati anu ancu mantene mudelli, ma sò caru.
- MLOps pò esse usatu per riduce questi risichi.
7. Pudete spiegà, chì hè a deriva di mudellu?
Quandu a prestazione di a fase di inferenza di un mudellu (aduprendu dati di u mondu reale) si deteriora da a so prestazione di a fase di furmazione, questu hè cunnisciutu cum'è deriva di mudellu, cunnisciuta ancu com'è deriva di l'idea (aduprendu dati storichi, etichettati).
U rendiment di u mudellu hè distornatu in paragunà à e fasi di furmazione è di serviziu, da quì u nome "train / serve skew".
Numerosi fattori, cumpresi:
- U modu fundamentale chì i dati sò distribuiti hà cambiatu.
- A furmazione fucalizza nantu à un picculu numeru di categurie, in ogni modu, un cambiamentu ambientale chì hè ghjustu aghjustatu un altru spaziu.
- In difficultà NLP, i dati di u mondu reale anu una quantità sproporzionatamente più grande di tokens numerichi cà i dati di furmazione.
- Occurrenze inaspettate, cum'è un mudellu custruitu nantu à e dati pre-COVID chì hè previstu per fà significativamente peghju nantu à e dati raccolti durante l'epidemie di COVID-19.
A monitorizazione continua di u rendiment di u mudellu hè sempre necessaria per identificà a deriva di u mudellu.
A ricuperazione di u mudellu hè quasi sempre necessaria cum'è rimediu quandu ci hè una diminuzione persistente di u rendiment di u mudellu; u mutivu di a decadenza deve esse identificata è i prucessi di trattamentu adattati devenu esse usatu.
8. Quantu modi diffirenti ponu esse applicati MLOps, in u vostru parè ?
Ci sò trè metudi per mette in pratica MLOps:
Livellu MLOps 0 (Processu Manuale): In questu livellu, tutti i passi, cumprese a preparazione di dati, l'analisi è a furmazione, sò realizati manualmente. Ogni tappa deve esse realizatu manualmente, è ancu a transizione da una à l'altra.
A premessa sottostante hè chì a vostra squadra di scienza di dati gestisce solu un picculu numeru di mudelli chì ùn sò micca aghjurnati spessu.
In u risultatu, ùn ci hè micca Integrazione Continua (CI) o Implementazione Continua (CD), è a prova di u codice hè tipicamente integrata in l'esekzione di script o l'execuzione di notebook, cù l'implementazione in un microserviziu cù un REST API.
Livellu MLOps 1 (automatizazione di u pipeline ML): Per automatizà u prucessu ML, l'ughjettu hè di furmà in modu continuu u mudellu (CT). Pudete rializà a prestazione di serviziu di predizione di mudelli continuu in questu modu.
A nostra implementazione di una pipeline di furmazione sana assicura chì u mudellu hè furmatu automaticamente in a produzzione utilizendu novi dati basati nantu à attivatori di pipeline attivi.
Livellu MLOps 2 (automatizazione di u pipeline CI/CD): Va un passu sopra u livellu MLOps. Un forte sistema automatizatu CI/CD hè necessariu se vulete aghjurnà i pipelines in a produzzione rapidamente è in modu affidabile:
- Crea u codice fonte è eseguite numerosi testi in tuttu u stadiu CI. Pacchetti, eseguibili è artefatti sò i risultati di u stadiu, chì saranu implementati in un tempu dopu.
- L'artefatti creati da u stadiu CI sò implementati à l'ambiente di destinazione durante u passu CD. Un pipeline implementatu cù l'implementazione di u mudellu rivisatu hè u risultatu di u stadiu.
- Prima chì u pipeline principia una nova iterazione di l'esperimentu, i scientisti di dati anu sempre fà a fase di analisi di dati è mudelli manualmente.
9. Ciò chì separa a implementazione statica da a distribuzione dinamica?
U mudellu hè furmatu offline per Impiegazione statica. In altre parolle, entremu u mudellu precisamente una volta è poi l'utilicemu per un tempu. Dopu chì u mudellu hè statu furmatu in u locu, hè guardatu è mandatu à u servitore per esse usatu per pruduce predizioni in tempu reale.
U mudellu hè allora distribuitu cum'è software d'applicazione installable. un prugramma chì permette di scoring batch di richieste, cum'è illustrazione.
U mudellu hè furmatu in linea per Impiegazione dinamica. Questu hè, i novi dati sò constantemente aghjuntu à u sistema, è u mudellu hè aghjurnatu continuamente per cuntà.
In u risultatu, pudete fà predizioni cù un servitore nantu à dumanda. Dopu questu, u mudellu hè messu in usu da esse furnitu cum'è un endpoint API chì reagisce à e dumande di l'utilizatori, utilizendu un framework web cum'è Flask o FastAPI.
10. Chì tecnichi di teste di pruduzzione cunnosci ?
Test di batch: Facendu teste in un ambiente sfarente da quellu di u so ambiente di furmazione, verifica u mudellu. Utilizendu metriche di scelta, cum'è precisione, RMSE, etc., a prova di batch hè fatta nantu à un gruppu di campioni di dati per verificà l'inferenza di mudellu.
A prova di batch pò esse realizatu nantu à una varietà di piattaforme informatiche, cum'è un servitore di prova, un servitore remoto o u nuvulu. Di genere, u mudellu hè furnitu cum'è un schedariu serializatu, chì hè carricatu cum'è un ughjettu è inferitu da e dati di prova.
A / essai B: Hè spessu usatu per analizà e campagni di marketing è ancu per u disignu di servizii (siti web, applicazioni mobili, etc.).
Basatu nantu à a cumpagnia o l'operazioni, l'approcciu statistichi sò usati per analizà i risultati di a prova A / B per decide quale mudellu hà da esse megliu in a produzzione. Di solitu, a prova A / B hè fatta da a manera seguente:
- I dati in diretta o in tempu reale sò divisi o segmentati in dui gruppi, Set A è Set B.
- Set A data hè mandatu à u mudellu anticu, mentri Set B data hè mandatu à u mudellu aghjurnata.
- Sicondu u casu d'usu di l'affari o i prucessi, parechji approcci statistichi ponu esse aduprati per evaluà u rendiment di u mudellu (per esempiu, precisione, precisione, etc.) per stabilisce se u novu mudellu (mudellu B) supera u vechju mudellu (mudellu A).
- Dopu facemu a prova di l'ipotesi statistiche: L'ipotesi nulla dice chì u novu mudellu ùn hà micca effettu nant'à u valore mediu di l'indicatori di cummerciale chì sò monitorati. Sicondu l'ipotesi alternativa, u novu mudellu aumenta u valore mediu di l'indicatori di l'attività di monitoraghju.
- Infine, valutemu se u novu mudellu risultatu in una mellura significativa in certi KPI di l'affari.
Una prova d'ombra o di scena: Un mudellu hè evaluatu in un duplicatu di un ambiente di produzzione prima di esse usatu in a produzzione (ambienti di staging).
Questu hè cruciale per determinà u rendiment di u mudellu cù dati in tempu reale è validà a resistenza di u mudellu. hè realizatu inferendu e listessi dati cum'è u pipeline di pruduzzione è furnisce u ramu sviluppatu o un mudellu per esse pruvatu in un servitore di staging.
L'unicu inconveniente hè chì nisuna scelta cummerciale serà fatta nantu à u servitore di staging o visibile per l'utilizatori finali per via di u ramu di sviluppu.
A resilienza è a prestazione di u mudellu serà valutata statisticamente utilizendu i risultati di l'ambiente di staging utilizendu e metriche appropritate.
11. Ciò chì distingue u prucessu di flussu da u prucessu di batch?
Pudemu manipulà e caratteristiche chì utilizemu per pruduce e nostre previsioni in tempu reale cù dui metudi di trasfurmazioni: batch è stream.
Prucessu batch caratteristiche da un puntu precedente in u tempu per un oggettu specificu, chì hè allora utilizatu per generà predizioni in tempu reale.
- Quì, pudemu fà calculi intensivi di funzioni offline è avè i dati preparati per una inferenza rapida.
- Features, però, un'età postu ch'elli eranu predeterminati in u passatu. Questu pò esse un inconveniente maiò se u vostru pronostico hè basatu annantu à l'occurrence recenti. (Per esempiu, identificà transazzione fraudulente appena fattibile).
Cù funzioni di streaming quasi in tempu reale per una entità specifica, l'inferenza hè realizata in u processu di flussu nantu à un determinatu set di inputs.
- Quì, dendu u mudellu in tempu reale, funzioni di streaming, pudemu avè predizioni più precise.
- Tuttavia, l'infrastruttura supplementaria hè necessaria per u processu di flussu è per mantene i flussi di dati (Kafka, Kinesis, etc.). (Apache Flink, Beam, etc.)
12. Chì vulete dì per Training Serving Skew?
A disparità trà u funziunamentu quandu serve è u funziunamentu durante a furmazione hè cunnisciuta cum'è skew di furmazione-serving. Stu skew pò esse induciutu da i seguenti fatturi:
- Una diffarenza in a manera di gestisce e dati trà e pipeline per serve è furmazione.
- Un cambiamentu in i dati da a vostra furmazione à u vostru serviziu.
- Un canale di feedback trà u vostru algoritmu è u mudellu.
13. Chì vulete dì per u Registru Modellu ?
Model Registry hè un repository cintrali induve i creatori di mudelli ponu publicà mudelli chì sò adattati per l'usu in a produzzione.
I sviluppatori ponu cullaburà cù altre squadre è parti interessate per gestisce a vita di tutti i mudelli in l'impresa utilizendu u registru. I mudelli furmati ponu esse caricati in u registru di mudelli da un scientist di dati.
I mudelli sò preparati per a prova, validazione è implementazione à a produzzione una volta chì sò in u registru. Inoltre, i mudelli furmati sò almacenati in i registri di mudelli per un accessu rapidu da qualsiasi applicazione o serviziu integrata.
Per pruvà, valutà è implementà u mudellu à a produzzione, i sviluppatori di software è i revisori ponu ricunnosce rapidamente è sceglie solu a versione megliu di i mudelli furmati (basatu nantu à i criterii di valutazione).
14. Pudete elaburà nantu à i benefici di u Registru Modellu?
Eccu alcuni modi chì u registru di mudelli razionalizza a gestione di u ciclu di vita di u mudellu:
- Per fà più faciule l'implementazione, salvate i requisiti di runtime è i metadati per i vostri mudelli furmati.
- I vostri mudelli furmati, implementati è ritirati devenu esse registrati, tracciati è versionati in un repositoriu centralizatu è cercabile.
- Crea pipeline automatizati chì permettenu a spedizione, a furmazione è l'integrazione cuntinui di u vostru mudellu di produzzione.
- Comparate mudelli di novu furmazione (o mudelli di sfida) in l'ambiente di staging cù mudelli chì operanu attualmente in produzzione (mudelli di campioni).
15. Pudete spiegà u travagliu di a tecnica Champion-Challenger?
Hè pussibule di pruvà diverse decisioni operative in a produzzione cù a tecnica Champion Challenger. Probabilmente avete intesu parlà di a prova A / B in u cuntestu di u marketing.
Per esempiu, pudete scrive duie linee di sughjetti distinti è distribuisce à l'aleatoriu à a vostra demografica di destinazione per maximizà a tarifa aperta per una campagna di email.
U sistema registra a prestazione di un email (vale à dì, l'azzione aperta di email) in relazione à a so linea di sughjettu, chì vi permette di paragunà a tarifa aperta di ogni linea di sughjettu per determinà quale hè u più efficace.
Champion-Challenger hè paragunabile à a prova A / B in questu sensu. Pudete aduprà a logica di decisione per valutà ogni risultatu è selezziunate u più efficau mentre sperimentate diversi metudi per vene à una scelta.
U mudellu più successu correlate à u campionu. U primu sfidante è a lista currispondente di sfidanti sò avà tuttu ciò chì hè presente in a prima fase di esecutivu invece di u campionu.
U campionu hè sceltu da u sistema per più esecuzioni di passi di travagliu.
I sfidanti sò cuntrastati l'un cù l'altru. U novu campionu hè allora determinatu da u sfidante chì pruduce i risultati più grande.
I travaglii implicati in u prucessu di paragone campionu-challenger sò elencati quì sottu in più dettagliu:
- Evaluà ognunu di i mudelli rivali.
- A valutazione di i risultati finali.
- Paragunendu i risultati di a valutazione per stabilisce u sfidante vittorioso.
- Aghjunghjendu u campionu frescu à l'archiviu
16. Descrive l'applicazioni à livellu di l'impresa di u ciclu di vita MLOps?
Avemu bisognu di piantà di cunsiderà l'apprendimentu di machine cum'è solu un esperimentu iterativu per chì i mudelli d'apprendimentu di machine entre in a produzzione. MLOps hè l'unione di l'ingegneria di u software cù l'apprendimentu automaticu.
U risultatu finitu deve esse imaginatu cum'è tali. Dunque, u codice per un pruduttu tecnologicu deve esse pruvatu, funziunale è modulare.
MLOps hà una vita chì hè paragunabile à un flussu di apprendimentu di machine cunvinziunali, cù l'eccezzioni chì u mudellu hè tenutu in u prucessu finu à a produzzione.
L'ingegneri MLOps tenenu un ochju nantu à questu per assicurà chì a qualità di u mudellu in a produzzione hè ciò chì hè destinatu.
Eccu alcuni casi d'usu per parechje di e tecnulugia MLOps:
- Registri di mudelli: Hè ciò chì pare esse. E squadre più grandi guardanu è mantenenu a traccia di mudelli di versione in i registri di mudelli. Ancu vultà à una versione precedente hè una opzione.
- Feature Store: Quandu si tratta di setti di dati più grande, puderia esse versioni distinte di i datasets analitici è sottosets per compiti specifichi. Un magazzinu di funziunalità hè un modu di punta è gustu per utilizà u travagliu di preparazione di dati da e corse precedenti o ancu da altre squadre.
- Magazzini per Metadati: Hè cruciale per monitorà i metadati currettamente in tutta a produzzione se i dati micca strutturati, cum'è e dati di stampa è di testu, anu da esse aduprati cù successu.
cunchiusioni
Hè cruciale per tene in mente chì, in a maiò parte di i casi, l'entrevistadore cerca un sistema, mentre chì u candidatu cerca una suluzione.
U primu hè basatu annantu à e vostre cumpetenze tecniche, mentri u sicondu hè tuttu nantu à u metudu chì aduprate per dimustrà a vostra cumpetenza.
Ci hè parechje prucedure chì duvete piglià quandu risponde à e dumande di l'entrevista MLOps per aiutà l'entrevistadore à capisce megliu cumu vulete valutà è indirizzà u prublema in manu.
A so cuncentrazione hè più nantu à a reazione incorrecta cà quella giusta. Una suluzione conta una storia, è u vostru sistema hè u megliu illustrazione di a vostra cunniscenza è a capacità di cumunicazione.
Lascia un Audiolibro