Аксарияти моделҳои омӯзиши мошинсозӣ ва омӯзиши амиқ барои хуб кор кардан ба миқдор ва гуногунии додаҳо такя мекунанд. Ҳаҷм ва гуногунии маълумоте, ки ҳангоми омӯзиш пешниҳод карда мешавад, ба дурустии пешгӯии ин моделҳо таъсири ҷиддӣ мерасонад.
Моделҳои омӯзиши амиқ, ки барои иҷрои самаранок дар вазифаҳои мураккаб таълим дода шудаанд, аксар вақт нейронҳои пинҳониро дар бар мегиранд. Миқдори параметрҳои таълимшаванда вобаста ба шумораи нейронҳои пинҳонӣ зиёд мешавад.
Миқдори маълумоти зарурӣ ба шумораи параметрҳои омӯхташавандаи модел мутаносиб аст. Яке аз усулҳои мубориза бо мушкилоти додаҳои маҳдуд ин татбиқи тағиротҳои гуногун ба маълумоти ҷорӣ барои синтези додаҳои нав мебошад.
Технологияи синтези маълумоти нав аз маълумоти мавҷуда ҳамчун 'Augmentation Data' номида мешавад. Афзоиши маълумот метавонад барои иҷрои ҳарду талабот истифода шавад: ҳаҷми маълумот ва гуногунии маълумоти омӯзишӣ барои таҳияи дақиқ омӯзиши мошин ё моделҳои омӯзиши амиқ.
Дар ин паём, мо ба афзоиши додаҳо, намудҳои он, чаро он муҳим аст ва бисёр чизҳои дигарро бодиққат дида мебароем.
Пас, афзоиши маълумот чист?
Афзоиши додаҳо раванди таҳияи маълумоти нав ва намояндагӣ аз маълумоти мавҷуда мебошад. Шумо метавонед ин корро тавассути дохил кардани версияҳои тағирёфтаи маълумоти мавҷуда ё синтез кардани маълумоти нав анҷом диҳед.
Маҷмӯи додаҳои бо ин усул тавлидшуда омӯзиши мошини шуморо беҳтар мекунад ё моделҳои омӯзиши амиқ бо роҳи кам кардани хатари аз ҳад зиёд. Ин раванди тағир додан ё "афзоиш додани" маҷмӯи додаҳо бо маълумоти иловагӣ мебошад.
Ин вуруди иловагӣ метавонад аз тасвирҳо то матн фарқ кунад ва он кори системаҳои омӯзиши мошинро афзоиш медиҳад.
Фарз мекунем, ки мо мехоҳем моделеро барои гурӯҳбандӣ кардани зоти сагҳо созем ва мо шумораи зиёди аксҳои ҳама навъҳоро ба истиснои сагҳо дорем. Дар натиҷа, модел ба гурӯҳбандии пагҳо душворӣ мекашад.
Мо метавонем аксҳои иловагии (воқеӣ ё бардурӯғ) ба коллексия илова кунем, ё мо метавонем аксҳои ҷории худро дучанд кунем (масалан, бо такрор ва таҳриф кардани онҳо барои ба таври сунъӣ беназир сохтани онҳо).
Афзоиши додаҳо дар айни замон чӣ кор мекунад?
Барномаҳои барои омӯзиши машқҳо махсусан дар сохаи омузиши чукур босуръат инкишоф ёфта, гуногун мешаванд. Мушкилоте, ки саноати зеҳни сунъӣ дучор мешавад, тавассути усулҳои афзоиш додани маълумот бартараф карда мешавад.
Афзоиши маълумот метавонад кор ва натиҷаҳои моделҳои омӯзиши мошинро тавассути илова кардани мисолҳои нав ва гуногун ба маҷмӯи додаҳои таълим беҳтар созад.
Вақте ки маҷмӯи додаҳо калон ва кофӣ аст, модели омӯзиши мошинсозӣ беҳтар ва дақиқтар аст. Барои моделҳои омӯзиши мошинсозӣ, ҷамъоварӣ ва тамғагузории маълумот метавонад вақт ва гарон бошад.
Ширкатҳо метавонанд тавассути тағир додани маҷмӯи додаҳо ва истифодаи стратегияҳои афзоиш додани маълумот хароҷоти амалиётии худро кам кунанд.
Тозакунии маълумот яке аз марҳилаҳои таҳияи модели додаҳо мебошад ва он барои моделҳои дақиқи баланд муҳим аст. Аммо, модел қодир нест, ки воридоти дурустро аз ҷаҳони воқеӣ пешгӯӣ кунад, агар тозакунии додаҳо муаррифиро коҳиш диҳад.
Моделҳои омӯзиши мошинро тавассути истифодаи равишҳои афзоиш додани маълумот, ки фарқиятҳоеро ба вуҷуд меоранд, ки модел дар ҷаҳони воқеӣ дучор меояд, тақвият додан мумкин аст.
Намудҳои афзоиши маълумот
Афзоиши воқеии маълумот
Афзоиши воқеии додаҳо вақте ба амал меояд, ки шумо ба маҷмӯи додаҳо маълумоти аслӣ ва иловагӣ илова мекунед. Ин метавонад аз файлҳои матнӣ бо атрибутҳои иловагӣ (барои тасвирҳои барчасп) то тасвирҳои дигар объектҳои муқоисашаванда бо объекти аслӣ ё ҳатто сабти ашёи воқеӣ фарқ кунад.
Масалан, бо илова кардани чанд хусусияти дигар ба файли тасвир, модели омӯзиши мошин метавонад ашёро осонтар муайян кунад.
Метамаълумоти бештар дар бораи ҳар як тасвир (масалан, ном ва тавсифи он) метавонад дохил карда шавад, то модели AI-и мо дар бораи он ки ҳар як тасвир пеш аз оғози омӯзиш дар ин аксҳо бештар донист.
Вақте ки вақти он фаро мерасад, ки аксҳои тару тозаро ба яке аз категорияҳои пешакӣ муайянкардаи мо, ба монанди “гурба” ё “саг” гурӯҳбандӣ кунем, модел метавонад беҳтар тавонист ашёҳои дар тасвир мавҷудбударо ошкор кунад ва дар натиҷа дар маҷмӯъ беҳтар кор кунад.
Маълумоти синтетикӣ Афзоиш
Ба ғайр аз илова кардани маълумоти воқеии бештар, шумо инчунин метавонед саҳм гузоред маълумоти синтетикӣ ё маълумоти сунъӣ, ки ҳақиқӣ ба назар мерасад.
Ин барои вазифаҳои душвор ба монанди интиқоли услуби нейрон муфид аст, аммо он инчунин барои ҳама гуна тарҳрезӣ хуб аст, новобаста аз он ки шумо GANs (Шабакаҳои Ҳассосият), CNN (Шабакаҳои конволютсионӣ) ё дигар меъмории шабакаи амиқи нейронро истифода мебаред.
Масалан, агар мо мехоҳем, ки бачаҳоро ба таври дуруст гурӯҳбандӣ кунем, бидуни он ки берун равем ва як қатор акс гирем, мо метавонем ба маҷмӯаи тасвирҳои саг аксҳои бардурӯғ илова кунем.
Ин шакли афзоиш додани маълумот махсусан барои баланд бардоштани дақиқии модел ҳангоми ҷамъоварии маълумот мушкил, гарон ва вақт сарф мешавад, самаранок аст. Дар ин вазъият, мо маҷмӯи маълумотро ба таври сунъӣ васеъ карда истодаем.
Фарз мекунем, ки гурӯҳи ибтидоии мо аз 1000 аксҳои зоти сагҳо танҳо 5 тасвири сагро дар бар мегирад. Ба ҷои илова кардани аксҳои воқеии пуг аз сагҳои воқеӣ, биёед як акси қалбакиро бо роҳи клон кардани яке аз аксҳои ҳозира ва каме таҳриф кардани он созем, то ки он ҳанӯз ҳам мисли паг ба назар мерасад.
Усулҳои афзоиш додани маълумот
Равишҳои афзоиш додани маълумот ба маълумоти мавҷуда каме тағирот ворид мекунанд. Ин ҳамон як изҳоротро такрор мекунад. Мо метавонем афзоиши маълумотро ба се категория тақсим кунем:
Матн
- Иваз кардани калима: Ин равиши афзоиш додани маълумот иваз кардани истилоҳҳои ҷорӣ бо синонимҳоро дар бар мегирад. Масалан, "Ин филм аблаҳ аст" метавонад "Ин филм аблаҳ аст".
- Ҷумла/Калимаҳоро омехта: Ин стратегия иваз кардани пайдарпаии ибораҳо ё калимаҳоро ҳангоми нигоҳ доштани ҳамоҳангии умумӣ дар бар мегирад.
- Манипуляцияи синтаксис-дарахт: Шумо як ҷумлаи мавҷударо ҳангоми истифодаи ҳамон истилоҳот аз ҷиҳати грамматикӣ дуруст иваз мекунед.
- Нобудкунии тасодуфӣ: Гарчанде ки ин стратегия навиштаҷоти зиштиро ба вуҷуд меорад, он самаранок аст. Дар натиҷа, сатри "Ман ин сабтро намехарам, зеро он харошида шудааст" мешавад "Ман инро намехарам, зеро он харошидааст". Ибора камтар равшан аст, аммо он иловаи қобили қабул боқӣ мемонад.
- Тарҷумаи бозгашт: Ин равиш ҳам самаранок ва ҳам лаззатбахш аст. Изҳороте, ки бо забони худ навишта шудааст, гиред, онро ба забони дигар тарҷума кунед ва сипас онро дубора ба забони аслии худ тарҷума кунед.
тасвирҳо
- Филтрҳои ядро: Ин равиш тасвирро равшан ё норавшан мекунад.
- Омезиши тасвирҳо: Ҳарчанд он метавонад аҷиб ба назар расад, шумо метавонед аксҳоро омехта кунед.
- Тозакунии тасодуфӣ: Як қисми хурди тасвири ҷорӣро нест кунед.
- Табдилдиҳии геометрӣ: Ин равиш аз ҷумлаи чизҳои дигар, худсарона баргардонидан, гардиш кардан, буридан ё тарҷумаи расмҳоро дар бар мегирад.
- Баргардонидани тасвир: Шумо метавонед тасвирро аз уфуқӣ ба самти амудӣ варақ кунед.
- Табдил додани фазои ранг: Шумо метавонед каналҳои ранги RGB-ро тағир диҳед ё ягон ранги ҷориро такмил диҳед.
- Re-Scaling раванди танзими миқёси визуалӣ мебошад. Шумо имкони васеъ кардани миқёсро доред ё берун кунед. Вақте ки шумо ба дарун миқёс мекунед, тасвир аз андозаи аввала хурдтар мешавад. Агар шумо онро ба берун васеъ кунед, тасвир аз нусхаи аслӣ калонтар хоҳад буд.
Audio
- Pitch: Ин равиш тағир додани баландии садоро дар бар мегирад.
- Тағйир додани суръат: Суръати файли аудио ё сабтро тағир диҳед.
- Садои бештар: Шумо метавонед ба файли аудио садои бештар илова кунед.
Истифодаи парванда
Тасвирҳои тиббӣ дар айни замон як мисоли барҷастаи истифода барои афзоиш додани маълумот мебошад. Маҷмӯаҳои тасвирҳои тиббӣ хурданд ва мубодилаи маълумот аз сабаби қоидаҳо ва нигарониҳои махфият мушкил аст.
Ғайр аз он, маҷмӯаҳои додаҳо дар ҳолати ихтилоли ғайриоддӣ хеле маҳдуданд. Ширкатҳои тасвири тиббӣ барои диверсификатсияи маҷмӯи додаҳои худ афзоиши маълумотро истифода мебаранд.
мушкилоти
Миқёспазирӣ, маҷмӯаҳои гуногуни додаҳо ва мувофиқат баъзе масъалаҳое мебошанд, ки барои таҳияи усулҳои самараноки афзоиш додани маълумот бояд ҳал карда шаванд.
Дар робита ба миқёспазирӣ, маълумоти васеъшуда бояд миқёспазир бошад, то бисёре аз моделҳои гуногун онро истифода баранд. Шумо мехоҳед боварӣ ҳосил кунед, ки онро барои истифода дар моделҳои оянда такрор кардан мумкин аст, зеро таъсиси системаи афзоиши маълумот, ки миқдори зиёди маълумоти мувофиқ, арзишманд ва мукаммалро тавлид мекунад, метавонад чанд вақтро талаб кунад.
Дар робита ба гетерогенӣ, маҷмӯи додаҳои гуногун дорои хусусиятҳои фарқкунанда мебошанд, ки ҳангоми таҳияи маълумоти такмилёфта бояд ба назар гирифта шаванд. Барои таҳияи маълумоти мукаммали мувофиқ, хосиятҳои ҳар як маҷмӯи додаҳо бояд истифода шаванд.
Ба ибораи дигар, афзоиши додаҳо дар байни маҷмӯи додаҳо ва ҳолатҳои истифода фарқ мекунад.
Ниҳоят, барои кафолат додани он, ки бартариҳои маълумоти афзоянда аз ҳама хатарҳо зиёдтаранд, маълумоти афзоянда бояд пеш аз истифода аз моделҳои омӯзиши мошинсозӣ бо истифода аз ченакҳои мувофиқ арзёбӣ карда шаванд.
Масалан, мавҷудияти садои назарраси пасзамина ё ҷузъҳои ба ҳам алоқаманд дар маълумоти афзояндаи ба тасвир асосёфта метавонад ба иҷрои модел таъсири манфӣ расонад.
хулоса
Дар ниҳоят, оё шумо кӯшиш мекунед, ки талафотро пешгӯӣ кунед, қаллобии молиявиро муайян кунед ё беҳтар созед таснифи тасвир моделҳо, афзоиши маълумот роҳи муҳими сохтани моделҳои дақиқтар ва мустаҳкам аст.
Тавассути тартиби олии омӯзиш, коркарди оддии пешакӣ ва афзоиш додани маълумот метавонад ҳатто ба гурӯҳҳо дар таҳияи моделҳои пешрафта кӯмак расонад.
Соҳибкорон метавонанд аз афзоиши додаҳо истифода баранд, то вақти кам кардани вақти омодасозии маълумоти омӯзишӣ ва эҷоди моделҳои омӯзиши мошинро, ки дақиқтар ва зудтар мебошанд, истифода баранд..
Бо васеъ кардани миқдори маълумоти мувофиқ дар маҷмӯи додаҳо, афзоиши додаҳо инчунин метавонад ба моделҳои омӯзиши мошинсозӣ, ки аллакай маълумоти зиёд доранд, фоида орад.
Дин ва мазҳаб