Fizahan-takelaka[Afeno][Aseho]
Amin'ny fiaraha-monina ankehitriny, zava-dehibe tokoa ny siansa momba ny data!
Hany ka ny mpahay siansa momba ny angona no voasokajy ho “Asa Sexiest of the Twenty-First Century”, na dia tsy nisy nanantena aza fa ho sexy ny asa geeky!
Na izany aza, noho ny maha-zava-dehibe ny angon-drakitra dia malaza amin'izao fotoana izao ny Data Science.
Python, miaraka amin'ny famakafakana statistika, ny modelin'ny angon-drakitra ary ny fahaiza-mamaky, dia iray amin'ireo tsara indrindra fiteny fandaharana mba hanesorana ny sanda avy amin'ity data ity.
Tsy mitsahatra mampitolagaga ny mpandrindra azy i Python rehefa miatrika fanamby momba ny siansa momba ny angona. Izy io dia fiteny fampiasa be mpampiasa, miompana amin'ny zavatra, loharano misokatra, tenim-pandrindrana avo lenta miaraka amin'ireo endri-javatra fanampiny isan-karazany.
Python dia noforonina miaraka amin'ny tranomboky miavaka ho an'ny siansa data izay ampiasain'ny mpandrindra isan'andro hamahana olana.
Ireto ny tranomboky Python tsara indrindra hodinihina:
1. pandas
Pandas dia fonosana natao hanampiana ireo mpamorona amin'ny fiasana amin'ny angon-drakitra "marika" sy "mifandray" amin'ny fomba voajanahary. Izy io dia miorina amin'ny rafitra angon-drakitra lehibe roa: "Series" (iray-dimensional, mitovy amin'ny lisitry ny zavatra) ary "Data Frames" (roa dimensions, toy ny latabatra misy tsanganana maromaro).
Ny Pandas dia manohana ny famadihana ny rafitra angon-drakitra ho amin'ny zavatra DataFrame, ny fiatrehana ny angona tsy hita, ny fanampiana/famafana tsanganana avy amin'ny DataFrame, ny fametrahana ny rakitra tsy hita, ary sary angona mampiasa histograms na boaty fika.
Izy io koa dia manome fitaovana maromaro ho an'ny famakiana sy fanoratana angona eo anelanelan'ny rafitra angona ao anaty fitadidiana sy ireo endrika rakitra maromaro.
Raha fintinina dia mety tsara amin'ny fanodinana angon-drakitra haingana sy tsotra, fanangonana angon-drakitra, famakiana sy fanoratana angona ary fijerena angon-drakitra. Rehefa mamorona tetikasa siantifika data ianao dia hampiasa ny Pandas tranomboky biby mba hikarakarana sy hamakafaka ny angonao.
2. numpy
NumPy (Numerical Python) dia fitaovana mahafinaritra amin'ny fanaovana kajy siantifika sy ny asa fandrindrana fototra sy saro-takarina.
Ny tranomboky dia manome endri-javatra mahasoa maromaro amin'ny fiasana amin'ny n-arrays sy matrices amin'ny Python.
Manamora ny fampandehanana ireo andry misy sanda mitovy karazana angon-drakitra ary manao asa arithmetika amin'ny array (anisan'izany ny vectorization). Raha ny marina, ny fampiasana ny karazana array NumPy mba hamolavola ny asa matematika dia manatsara ny fahombiazany ary mampihena ny fotoana famonoana.
Ny fanohanan'ny array multidimensional ho an'ny asa matematika sy lojika no singa fototra amin'ny tranomboky. Ny fiasa NumPy dia azo ampiasaina hanondroana, handaminana, hanova endrika, ary hampitana sary sy onjam-peo ho toy ny fitambarana isa tena izy.
3. matplotlib
Ao amin'ny tontolon'ny Python, Matplotlib dia iray amin'ireo tranomboky be mpampiasa indrindra. Ampiasaina izy io mba hamoronana sary an-tsary static, animated ary interactive. Matplotlib dia manana safidy maro amin'ny tabilao sy fanamboarana.
Amin'ny fampiasana histograma, afaka manaparitaka, manitsy, ary manova ny grafika ny mpandrindra. Ny tranomboky open-source dia manome API miompana amin'ny zavatra mba hampidirana teti-dratsy amin'ny programa.
Rehefa mampiasa ity tranomboky ity mba hamoronana sary saro-pady, na izany aza, ny mpamorona dia tsy maintsy manoratra kaody mihoatra noho ny mahazatra.
Tsara ny manamarika fa ny tranomboky fanaovana tabilao malaza dia miara-miaina amin'ny Matplotlib tsy misy sakantsakana.
Ankoatra ny zavatra hafa, dia ampiasaina amin'ny script Python, Python sy IPython shell, kahie Jupyter, ary fampiharana amin'ny tranonkala lohamilina.
Sarintany, tabilao bara, tabilao pie, histograms, scatterplots, tabilao diso, spectra power, stemplots, ary karazana sariitatra hafa rehetra dia azo noforonina miaraka aminy.
4. seaborn
Ny tranomboky Seaborn dia naorina amin'ny Matplotlib. Ny Seaborn dia azo ampiasaina hanamboarana sarin'ny statistika manintona kokoa sy mampahafantatra kokoa noho ny Matplotlib.
Seaborn dia misy API miompana amin'ny angon-drakitra mitambatra amin'ny fanadihadiana ny fifandraisana misy eo amin'ny fari-piainana maro, ankoatra ny fanohanana feno amin'ny fijerena angon-drakitra.
Seaborn dia manolotra safidy maro manaitra ho an'ny fijerena angon-drakitra, ao anatin'izany ny fijerena andiam-potoana, ny teti-dratsy, ny kisary violon, ary ny maro hafa.
Mampiasa sari-tany semantika sy fanangonana statistika izy io mba hanomezana sary an-tsaina misy fampahafantarana lalina. Tafiditra ao anatin'izany ny fomba fanao fanaovana sariitatra miompana amin'ny angon-drakitra izay miasa miaraka amin'ny rindran-damina sy ny laharan'ny data izay misy angona manontolo.
Ny sarin'ny angonany dia mety ahitana tabilao bara, tabilao pie, histograms, scatterplots, tabilao diso ary sary hafa. Ity tranombokin'ny fijerena angon-drakitra Python ity dia misy fitaovana hisafidianana paleta miloko, izay manampy amin'ny famoahana ny fironana amin'ny angona.
5. Scikit-mianatra
Scikit-learn no tranomboky Python lehibe indrindra amin'ny fanombanana ny angona sy ny fanombanana modely. Iray amin'ireo tranomboky Python mahasoa indrindra izy io. Izy io dia manana fahaiza-manao marobe natao ho an'ny tanjona modely.
Tafiditra ao anatin'izany ny algorithm fianarana amin'ny milina rehetra voafehy sy tsy voafehy, ary koa ny fiasan'ny Ensemble Learning sy ny Boosting Machine Learning.
Ampiasain'ny mpahay siansa momba ny data izy io mba hanaovana fanao mahazatra fianarana milina ary hetsika fitrandrahana angon-drakitra toy ny fivondronana, fihemorana, fifantenana modely, fampihenana ny refy, ary fanasokajiana. Izy io koa dia miaraka amin'ny antontan-taratasy feno ary mahavita manaitra.
Ny Scikit-learn dia azo ampiasaina hamoronana modely fianarana milina manara-maso sy tsy manara-maso isan-karazany toy ny fanasokajiana, fiverenana, milina fanohanana Vector, ala kisendrasendra, mpifanolo-bodirindrina akaiky indrindra, naive Bayes, hazo fanapahan-kevitra, Clustering, sy ny sisa.
Ny tranomboky fianarana milina Python dia ahitana karazana fitaovana tsotra nefa mahomby amin'ny fanaovana fanadihadiana angon-drakitra sy asa fitrandrahana.
Raha te hamaky bebe kokoa, ity ny torolàlana momba ny Scikit-mianatra.
6. XGBoost
XGBoost dia fitaovana fanamafisam-peo gradient zaraina natao ho an'ny hafainganam-pandeha, ny flexibilité ary ny fahafaha-mitondra. Mba hamoronana algorithm ML dia mampiasa ny rafitra Gradient Boosting. XGBoost dia teknika fampiroboroboana hazo mifanandrify haingana sy marina izay afaka mamaha olana maro momba ny siansa data.
Amin'ny fampiasana ny rafitra Gradient Boosting, ity tranomboky ity dia azo ampiasaina hamoronana algorithm fianarana milina.
Tafiditra ao anatin'izany ny fampiroboroboana hazo mifanandrify, izay manampy ny ekipa amin'ny famahana olana isan-karazany momba ny siansa angon-drakitra. Ny tombony iray hafa dia ny ahafahan'ny mpamorona mampiasa kaody mitovy amin'ny Hadoop, SGE, ary MPI.
Azo ianteherana koa izy io amin'ny toe-javatra zaraina na teren'ny fitadidiana.
7. fikorianan'ny tensor
TensorFlow dia sehatra AI open source maimaim-poana amin'ny farany miaraka amin'ireo fitaovana, tranomboky ary loharano marobe. TensorFlow dia tokony ho fantatry ny rehetra miasa tetikasa fianarana milina amin'ny Python.
Izy io dia fitaovana matematika an'ohatra an'ohatra misokatra ho an'ny kajy nomerika amin'ny fampiasana ny sarin'ny fikorianan'ny data izay novolavolain'i Google. Ny nodes dia maneho ny fizotran'ny matematika ao amin'ny kisary mikoriana angona TensorFlow mahazatra.
Ny sisiny amin'ny grafika, etsy ankilany, dia angona angon-drakitra marobe, fantatra amin'ny anarana hoe tensor, izay mikoriana eo anelanelan'ny node tambajotra. Izy io dia mamela ny mpandrindra mizara ny fanodinana amin'ny CPU na GPU iray na maromaro amin'ny desktop, fitaovana finday, na mpizara nefa tsy manova kaody.
TensorFlow dia novolavolaina tao amin'ny C sy C ++. Miaraka amin'ny TensorFlow, azonao atao ny mamolavola sy fiarandalamby Machine Learning modely mampiasa API avo lenta toa an'i Keras.
Izy io koa dia manana ambaratonga maro amin'ny abstraction, mamela anao hisafidy ny vahaolana tsara indrindra ho an'ny modelyo. TensorFlow koa dia mamela anao hametraka maodely Machine Learning amin'ny rahona, navigateur, na fitaovanao manokana.
Izy io no fitaovana mahomby indrindra amin'ny asa toy ny fanekena zavatra, famantarana ny kabary, ary ny maro hafa. Manampy amin'ny fampandrosoana ny artifisialy izany ny tambajotra vaovao izay tsy maintsy miatrika loharanom-baovao maro.
Ity ny torolàlana haingana momba ny TensorFlow raha te hamaky bebe kokoa.
8. Keras
Keras dia loharano malalaka sy malalaka Tambajotra neural mifototra amin'ny Python fitaovana ho an'ny faharanitan-tsaina artifisialy, fianarana lalina ary hetsika siantifika data. Ny tambajotra neural koa dia ampiasaina amin'ny Data Science mba handikana ny angon-drakitra fandinihana (sary na feo).
Izy io dia fitambarana fitaovana hamoronana maodely, fanaovana sary an-tsary, ary fanombanana angona. Tafiditra ao anatin'izany koa ny angon-drakitra voamarika mialoha izay azo ampidirina haingana sy entina.
Mora ampiasaina, azo ampiasaina ary mety amin'ny fikarohana fikarohana. Ankoatr'izay, mamela anao hamorona fifandraisana feno, convolutional, pooling, miverimberina, fampidirana ary endrika hafa amin'ny tambajotra Neural.
Ireo modely ireo dia azo atambatra mba hananganana tambajotra Neural feno ho an'ny angon-drakitra sy olana goavana. Tranomboky mahafinaritra amin'ny famolavolana sy famoronana tambajotra neural izy io.
Tsotra ny fampiasana azy ary manome fahafaham-po be ny mpamorona. Malaina i Keras raha oharina amin'ireo fonosana fianarana milina Python hafa.
Izany dia satria izy no mamorona tabilao computational voalohany amin'ny fampiasana ny fotodrafitrasa backend ary avy eo dia mampiasa azy io hanaovana asa. Keras dia tena maneho fihetseham-po ary azo ampifanarahana amin'ny fanaovana fikarohana vaovao.
9. PyTorch
PyTorch dia fonosana Python malaza ho an'ny fianarana lalina ary fianarana milina. Izy io dia rindrambaiko informatika siantifika open-source mifototra amin'ny Python ho fampiharana ny Deep Learning sy Neural Networks amin'ny angona goavana.
Mampiasa be dia be an'ity kitapo ity ny Facebook mba hamoronana tambajotra neural izay manampy amin'ny hetsika toy ny famantarana ny tarehy sy ny auto-tagging.
PyTorch dia sehatra iray ho an'ny mpahay siansa momba ny data izay maniry ny hamita asa fianarana lalina haingana. Ny fitaovana dia ahafahan'ny kajy tensor atao miaraka amin'ny hafainganam-pandeha GPU.
Ampiasaina amin'ny zavatra hafa ihany koa izy io, ao anatin'izany ny fananganana tamba-jotra kajy mavitrika sy ny fanaovana kajy ho azy ny gradients.
Soa ihany, PyTorch dia fonosana mahafinaritra izay ahafahan'ny mpamorona hifindra mora foana avy amin'ny teoria sy fikarohana mankany amin'ny fiofanana sy ny fampandrosoana raha ny momba ny fianarana milina sy ny fikarohana fianarana lalina mba hanomezana fahafaham-po sy hafainganam-pandeha ambony indrindra.
10. NLTK
NLTK (Natural Language Toolkit) dia fonosana Python malaza ho an'ny siantifika data. Ny fametahana lahatsoratra, ny tokenization, ny fanjohian-kevitra semantika ary ny asa hafa mifandraika amin'ny fanodinana fiteny voajanahary dia azo tanterahina amin'ny NLTK.
Ny NLTK dia azo ampiasaina koa mba hamitana AI sarotra kokoa (Fahaizana artifisialy) asa. NLTK dia noforonina tany am-boalohany mba hanohanana ireo paradigma fampianarana AI sy fianarana milina, toy ny modely amin'ny fiteny sy ny teoria kognitika.
Izy io dia mitondra ny algorithm AI sy ny fampandrosoana modely amin'ny tontolo tena izy. Izy io dia noraisina fatratra mba hampiasaina ho fitaovam-pampianarana sy ho fitaovana fandalinana manokana, ankoatra ny fampiasana azy ho sehatra fanaovana prototype sy famolavolana rafitra fikarohana.
Ny fanasokajiana, ny fanasokajiana, ny fanjohian-kevitra semantika, ny fametahana, ny fametahana, ary ny tokenization dia samy tohanana avokoa.
Famaranana
Izany dia mamarana ny tranomboky Python folo voalohany ho an'ny siansa data. Havaozina tsy tapaka ny tranomboky momba ny siansa data Python satria lasa malaza kokoa ny siansa momba ny angona sy ny fianarana milina.
Misy tranomboky Python maromaro ho an'ny Data Science, ary ny safidin'ny mpampiasa dia miankina amin'ny karazana tetikasa iasany.
Leave a Reply