பொருளடக்கம்[மறை][காட்டு]
மேம்பட்ட பகுப்பாய்வு மற்றும் இயந்திரக் கற்றல் திட்டங்கள் தரவுகளால் இயக்கப்படுகின்றன, ஆனால் அந்தத் தரவை அணுகுவது தனியுரிமை மற்றும் வணிக நடைமுறைகளில் உள்ள சவால்கள் காரணமாக கல்வியாளர்களுக்கு கடினமாக இருக்கலாம்.
செயற்கைத் தரவு, உண்மையான தரவுகளால் பகிர்ந்து கொள்ள முடியாத வழிகளில் பகிரப்பட்டு பயன்படுத்தப்படலாம், இது தொடர ஒரு சாத்தியமான புதிய திசையாகும். இருப்பினும், இந்த புதிய உத்தி ஆபத்துகள் அல்லது தீமைகள் இல்லாமல் இல்லை, எனவே வணிகங்கள் தங்கள் வளங்களை எங்கு, எப்படிப் பயன்படுத்துகின்றன என்பதை கவனமாகக் கருத்தில் கொள்வது அவசியம்.
AI இன் தற்போதைய சகாப்தத்தில், தரவு புதிய எண்ணெய் என்றும் நாம் கூறலாம், ஆனால் தேர்ந்தெடுக்கப்பட்ட சிலர் மட்டுமே குஷரில் அமர்ந்திருக்கிறார்கள். எனவே, நிறைய பேர் தங்கள் சொந்த எரிபொருளை உற்பத்தி செய்கிறார்கள், இது மலிவு மற்றும் திறமையானது. இது செயற்கை தரவு என்று அழைக்கப்படுகிறது.
இந்த இடுகையில், செயற்கைத் தரவை நீங்கள் ஏன் பயன்படுத்த வேண்டும், அதை எவ்வாறு தயாரிப்பது, உண்மையான தரவிலிருந்து வேறுபடுத்துவது எது, அது என்ன பயன் படுத்துகிறது மற்றும் பலவற்றைப் பற்றி விரிவாகப் பார்ப்போம்.
எனவே, செயற்கை தரவு என்றால் என்ன?
தரம், எண் அல்லது பன்முகத்தன்மை ஆகியவற்றின் அடிப்படையில் உண்மையான தரவுத் தொகுப்புகள் போதுமானதாக இல்லாதபோது, உண்மையான வரலாற்றுத் தரவுகளுக்குப் பதிலாக AI மாதிரிகளைப் பயிற்றுவிக்க செயற்கைத் தரவுகளைப் பயன்படுத்தலாம்.
தற்போதுள்ள தரவு வணிகத் தேவைகளைப் பூர்த்தி செய்யாதபோது அல்லது உருவாக்கப் பயன்படுத்தப்படும்போது தனியுரிமை அபாயங்கள் இருந்தால் இயந்திர கற்றல் கார்ப்பரேட் AI முயற்சிகளுக்கு மாதிரிகள், சோதனை மென்பொருள் அல்லது செயற்கைத் தரவுகள் குறிப்பிடத்தக்க கருவியாக இருக்கும்.
எளிமையாகச் சொன்னால், உண்மையான தரவுக்குப் பதிலாக செயற்கைத் தரவு அடிக்கடி பயன்படுத்தப்படுகிறது. இன்னும் துல்லியமாக, இது செயற்கையாக குறியிடப்பட்டு உருவகப்படுத்துதல்கள் அல்லது கணினி வழிமுறைகளால் உருவாக்கப்பட்ட தரவு ஆகும்.
செயற்கை தரவு என்பது உண்மையான நிகழ்வுகளின் விளைவாக இல்லாமல் செயற்கையாக கணினி நிரலால் உருவாக்கப்பட்ட தகவல் ஆகும். நிறுவனங்கள் தங்கள் பயிற்சித் தரவுகளில் செயற்கைத் தரவைச் சேர்க்கலாம், எல்லா பயன்பாடு மற்றும் விளிம்பு சூழ்நிலைகளையும் உள்ளடக்கும், தரவு சேகரிப்பின் செலவைக் குறைக்கலாம் அல்லது தனியுரிமை விதிமுறைகளை பூர்த்தி செய்யலாம்.
மேம்பாடு போன்ற செயலாக்க சக்தி மற்றும் தரவு சேமிப்பக முறைகளின் மேம்பாடுகள் காரணமாக செயற்கைத் தரவுகள் முன்பை விட இப்போது அணுகக்கூடியதாக உள்ளது. செயற்கைத் தரவு அனைத்து இறுதி பயனர்களுக்கும் மிகவும் பயனுள்ளதாக இருக்கும் AI தீர்வுகளை உருவாக்குவதை மேம்படுத்துகிறது, மேலும் இது சந்தேகத்திற்கு இடமின்றி ஒரு நல்ல வளர்ச்சியாகும்.
செயற்கை தரவு எவ்வளவு முக்கியமானது மற்றும் அதை ஏன் பயன்படுத்த வேண்டும்?
AI மாதிரிகளைப் பயிற்றுவிக்கும் போது, டெவலப்பர்களுக்கு துல்லியமான லேபிளிங் கொண்ட பெரிய தரவுத்தொகுப்புகள் அடிக்கடி தேவைப்படும். மிகவும் மாறுபட்ட தரவுகளுடன் கற்பிக்கப்படும் போது, நரம்பியல் வலையமைப்புகள் இன்னும் துல்லியமாக செயல்படும்.
நூற்றுக்கணக்கான அல்லது மில்லியன் கணக்கான பொருட்களைக் கொண்ட இந்த பாரிய தரவுத்தொகுப்புகளைச் சேகரித்து லேபிளிடுவது, நியாயமற்ற முறையில் நேரத்தையும் பணத்தையும் விரயமாக்கும். செயற்கைத் தரவைப் பயன்படுத்துவதன் மூலம் பயிற்சித் தரவை உருவாக்கும் விலையை வெகுவாகக் குறைக்கலாம். உதாரணமாக, செயற்கையாக உருவாக்கப்பட்டால், ஒரு பயிற்சிப் படத்தை வாங்கும்போது $5 செலவாகும் தரவு லேபிளிங் வழங்குநர் $0.05 மட்டுமே செலவாகும்.
செயற்கைத் தரவு, உண்மையான உலகத்திலிருந்து உருவாக்கப்படும் முக்கியமான தரவு தொடர்பான தனியுரிமைக் கவலைகளைத் தணிக்கும் அதே வேளையில் செலவுகளைக் குறைக்கும்.
உண்மையான தரவுகளுடன் ஒப்பிடுகையில், நிஜ உலகத்தைப் பற்றிய உண்மைகளின் முழுமையான ஸ்பெக்ட்ரம் துல்லியமாக பிரதிபலிக்க முடியாது, இது தப்பெண்ணத்தை குறைக்க உதவும். நம்பத்தகுந்த சாத்தியக்கூறுகளை பிரதிநிதித்துவப்படுத்தும் அசாதாரண நிகழ்வுகளை வழங்குவதன் மூலம், முறையான தரவுகளிலிருந்து பெறுவது சவாலாக இருக்கலாம், செயற்கைத் தரவு அதிக பன்முகத்தன்மையை வழங்க முடியும்.
கீழே பட்டியலிடப்பட்டுள்ள காரணங்களுக்காக செயற்கைத் தரவு உங்கள் திட்டத்திற்கு மிகவும் பொருத்தமாக இருக்கும்:
1. மாதிரியின் வலிமை
அதைப் பெறாமல், உங்கள் மாடல்களுக்கான பல்வேறு தரவை அணுகவும். செயற்கைத் தரவு மூலம், ஒரே நபரின் பல்வேறு ஹேர்கட்கள், முக முடிகள், கண்ணாடிகள், தலையின் தோரணைகள் போன்றவற்றுடன், தோல் தொனி, இனப் பண்புகள், எலும்பு அமைப்பு, குறும்புகள் மற்றும் பிற குணாதிசயங்கள் ஆகியவற்றைப் பயன்படுத்தி உங்கள் மாதிரியைப் பயிற்சி செய்யலாம். முகங்கள் மற்றும் அதை வலுப்படுத்த.
2. எட்ஜ் வழக்குகள் கணக்கில் எடுத்துக்கொள்ளப்படுகின்றன
ஒரு சீரான தரவுத்தொகுப்பு இயந்திர கற்றல் மூலம் விரும்பப்படுகிறது வழிமுறைகள். முகத்தை அடையாளம் காணும் எங்களின் உதாரணத்தை நினைத்துப் பாருங்கள். அவர்களின் மாதிரிகளின் துல்லியம் மேம்பட்டிருக்கும் (உண்மையில், இந்த வணிகங்களில் சில இதைச் செய்தன), மேலும் அவற்றின் தரவு இடைவெளிகளை நிரப்ப கருமை நிற முகங்களின் செயற்கைத் தரவைத் தயாரித்திருந்தால், அவை மிகவும் தார்மீக மாதிரியை உருவாக்கியிருக்கும். செயற்கைத் தரவுகளின் உதவியுடன், தரவு பற்றாக்குறை அல்லது இல்லாத எட்ஜ் கேஸ்கள் உட்பட, அனைத்து பயன்பாட்டு நிகழ்வுகளையும் குழுக்கள் மறைக்க முடியும்.
3. இது "உண்மையான" தரவை விட விரைவாகப் பெறலாம்
குழுக்கள் அதிக அளவிலான செயற்கைத் தரவை விரைவாக உருவாக்க முடியும். நிஜ வாழ்க்கைத் தரவு அவ்வப்போது நடக்கும் நிகழ்வுகளைச் சார்ந்திருக்கும் போது இது மிகவும் பயனுள்ளதாக இருக்கும். ஒரு சுய-ஓட்டுநர் காருக்கான தரவைச் சேகரிக்கும் போது, கடுமையான சாலை நிலைமைகள் குறித்த போதுமான நிஜ-உலகத் தரவைப் பெறுவது குழுக்களுக்கு கடினமாக இருக்கலாம், எடுத்துக்காட்டாக, அவற்றின் அரிதான தன்மை காரணமாக. கடினமான சிறுகுறிப்பு செயல்முறையை விரைவுபடுத்த, தரவு விஞ்ஞானிகள் செயற்கைத் தரவை உருவாக்கும்போது தானாகவே லேபிளிடுவதற்கு வழிமுறைகளை வைக்கலாம்.
4. இது பயனர் தனியுரிமை தகவலைப் பாதுகாக்கிறது
வணிகம் மற்றும் தரவு வகையைப் பொறுத்து, முக்கியமான தரவைக் கையாளும் போது நிறுவனங்களுக்கு பாதுகாப்புச் சிக்கல்கள் இருக்கலாம். எடுத்துக்காட்டாக, தனிப்பட்ட சுகாதாரத் தகவல் (PHI), சுகாதாரத் துறையில் உள்நோயாளிகளின் தரவுகளில் அடிக்கடி சேர்க்கப்படுகிறது, மேலும் அவை மிகுந்த பாதுகாப்புடன் கையாளப்பட வேண்டும்.
செயற்கைத் தரவுகளில் உண்மையான நபர்களைப் பற்றிய தகவல்கள் இல்லாததால், தனியுரிமைச் சிக்கல்கள் குறைக்கப்படுகின்றன. உங்கள் குழு சில தரவு தனியுரிமைச் சட்டங்களைக் கடைப்பிடிக்க வேண்டும் என்றால், செயற்கைத் தரவை மாற்றாகப் பயன்படுத்தவும்.
உண்மையான தரவு Vs செயற்கை தரவு
நிஜ உலகில், உண்மையான தரவு பெறப்படுகிறது அல்லது அளவிடப்படுகிறது. யாராவது ஸ்மார்ட்போன், லேப்டாப் அல்லது கணினியைப் பயன்படுத்தும்போது, கைக்கடிகாரத்தை அணிந்தால், இணையதளத்தை அணுகும்போது அல்லது ஆன்லைன் பரிவர்த்தனை செய்யும் போது, இந்த வகையான தரவு உடனடியாக உருவாக்கப்படும்.
கூடுதலாக, உண்மையான தரவை (ஆன்லைன் மற்றும் ஆஃப்லைன்) வழங்க ஆய்வுகள் பயன்படுத்தப்படலாம். டிஜிட்டல் அமைப்புகள் செயற்கைத் தரவை உருவாக்குகின்றன. எந்தவொரு நிஜ-உலக நிகழ்வுகளிலிருந்தும் பெறப்படாத பகுதியைத் தவிர, செயற்கைத் தரவு, அடிப்படை குணங்களின் அடிப்படையில் உண்மையான தரவை வெற்றிகரமாகப் பிரதிபலிக்கும் வகையில் உருவாக்கப்படுகிறது.
உண்மையான தரவுகளுக்கு மாற்றாக செயற்கைத் தரவைப் பயன்படுத்துவதற்கான யோசனை மிகவும் நம்பிக்கைக்குரியது, ஏனெனில் இது வழங்குவதற்குப் பயன்படுத்தப்படலாம். இயந்திர கற்றல் பயிற்சி தரவு மாதிரிகள் தேவை. ஆனால் அது உறுதியாக இல்லை செயற்கை நுண்ணறிவு உண்மையான உலகில் எழும் ஒவ்வொரு பிரச்சினையையும் தீர்க்க முடியும்.
பயன்பாடு வழக்குகள்
மாதிரி பயிற்சி, மாதிரி சரிபார்ப்பு மற்றும் புதிய தயாரிப்புகளின் சோதனை உட்பட பல்வேறு வணிக நோக்கங்களுக்காக செயற்கை தரவு பயனுள்ளதாக இருக்கும். இயந்திர கற்றலுக்கு அதன் பயன்பாட்டில் வழிவகுத்த சில துறைகளை நாங்கள் பட்டியலிடுவோம்:
1. ஹெல்த்கேர்
அதன் தரவுகளின் உணர்திறனைக் கருத்தில் கொண்டு, சுகாதாரத் துறையானது செயற்கைத் தரவுகளைப் பயன்படுத்துவதற்கு மிகவும் பொருத்தமானது. செயற்கைத் தரவை குழுக்களால் பயன்படுத்தப்படும் ஒவ்வொரு வகையான நோயாளியின் உடலியல்களையும் பதிவு செய்ய முடியும், இதனால் நோய்களை விரைவாகவும் துல்லியமாகவும் கண்டறிய உதவுகிறது.
கூகிளின் மெலனோமா கண்டறிதல் மாதிரியானது, அனைத்து தோல் வகைகளுக்கும் திறம்பட செயல்படும் திறன் கொண்ட மாதிரியை வழங்க, கருமையான தோல் நிறங்களைக் கொண்டவர்களின் செயற்கைத் தரவை (வருந்தத்தக்க வகையில் குறைவாகக் குறிப்பிடப்படும் மருத்துவத் தரவுகளின் பகுதி) உள்ளடக்கியதால், இது ஒரு புதிரான விளக்கமாகும்.
2. ஆட்டோமொபைல்கள்
செயல்திறனை மதிப்பிடுவதற்கு சுய-ஓட்டுநர் ஆட்டோமொபைல்களை உருவாக்கும் நிறுவனங்களால் சிமுலேட்டர்கள் அடிக்கடி பயன்படுத்தப்படுகின்றன. வானிலை கடுமையாக இருக்கும்போது, எடுத்துக்காட்டாக, உண்மையான சாலைத் தரவைச் சேகரிப்பது ஆபத்தானதாகவோ அல்லது கடினமாகவோ இருக்கலாம்.
சாலைகளில் உண்மையான ஆட்டோமொபைல்களுடன் நேரடி சோதனைகளை நம்புவது பொதுவாக நல்ல யோசனையல்ல, ஏனெனில் வெவ்வேறு ஓட்டுநர் சூழ்நிலைகள் அனைத்திலும் கணக்கில் எடுத்துக்கொள்ள வேண்டிய பல மாறிகள் உள்ளன.
3. தரவுகளின் பெயர்வுத்திறன்
தங்கள் பயிற்சித் தரவை மற்றவர்களுடன் பகிர்ந்து கொள்ள, நிறுவனங்களுக்கு நம்பகமான மற்றும் பாதுகாப்பான முறைகள் தேவை. தரவுத்தொகுப்பைப் பொதுவில் வைப்பதற்கு முன் தனிப்பட்ட முறையில் அடையாளம் காணக்கூடிய தகவலை (PII) மறைப்பது செயற்கைத் தரவுகளுக்கான மற்றொரு புதிரான பயன்பாடாகும். அறிவியல் ஆராய்ச்சி தரவுத்தொகுப்புகள், மருத்துவத் தரவு, சமூகவியல் தரவு மற்றும் PII ஐக் கொண்டிருக்கும் பிற துறைகளை பரிமாறிக்கொள்வது தனியுரிமை-பாதுகாக்கும் செயற்கைத் தரவு என குறிப்பிடப்படுகிறது.
4. பாதுகாப்பு
செயற்கைத் தரவுகளால் நிறுவனங்கள் மிகவும் பாதுகாப்பானவை. எங்கள் முகத்தை அடையாளம் காணும் உதாரணத்தைப் பற்றி மீண்டும் கூறினால், புனையப்பட்ட புகைப்படங்கள் அல்லது வீடியோக்களை விவரிக்கும் "ஆழமான போலிகள்" என்ற சொற்றொடரை நீங்கள் நன்கு அறிந்திருக்கலாம். தங்கள் சொந்த முக அங்கீகாரம் மற்றும் பாதுகாப்பு அமைப்புகளைச் சோதிக்க வணிகங்களால் ஆழமான போலிகளை உருவாக்க முடியும். செயற்கைத் தரவு வீடியோ கண்காணிப்பில் மாடல்களை விரைவாகவும் மலிவான விலையிலும் பயிற்றுவிக்கப் பயன்படுகிறது.
செயற்கை தரவு மற்றும் இயந்திர கற்றல்
திடமான மற்றும் நம்பகமான மாதிரியை உருவாக்க, இயந்திர கற்றல் வழிமுறைகளுக்கு கணிசமான அளவு தரவு செயலாக்கப்பட வேண்டும். செயற்கை தரவு இல்லாத நிலையில், இவ்வளவு பெரிய அளவிலான தரவை உருவாக்குவது சவாலானதாக இருக்கும்.
கணினி பார்வை அல்லது பட செயலாக்கம் போன்ற களங்களில், ஆரம்பகால செயற்கை தரவுகளின் வளர்ச்சியால் மாதிரிகளின் வளர்ச்சி எளிதாக்கப்படுகிறது, இது மிகவும் குறிப்பிடத்தக்கதாக இருக்கும். படத்தை அடையாளம் காணும் துறையில் ஒரு புதிய வளர்ச்சியானது ஜெனரேட்டிவ் அட்வர்ஸரியல் நெட்வொர்க்குகளின் (GANs) பயன்பாடு ஆகும். பொதுவாக இரண்டு நெட்வொர்க்குகள் உள்ளன: ஒரு ஜெனரேட்டர் மற்றும் ஒரு பாகுபாடு.
பாரபட்சமான நெட்வொர்க் உண்மையான புகைப்படங்களிலிருந்து போலியான புகைப்படங்களைப் பிரிப்பதை நோக்கமாகக் கொண்டிருந்தாலும், ஜெனரேட்டர் நெட்வொர்க் நிஜ உலகப் படங்களைப் போலவே செயற்கைப் படங்களை உருவாக்குகிறது.
இயந்திரக் கற்றலில், GANகள் நரம்பியல் நெட்வொர்க் குடும்பத்தின் துணைக்குழு ஆகும், இதில் இரண்டு நெட்வொர்க்குகளும் தொடர்ந்து புதிய முனைகள் மற்றும் அடுக்குகளைச் சேர்ப்பதன் மூலம் கற்றுக்கொள்கின்றன.
செயற்கைத் தரவை உருவாக்கும் போது, மாதிரியின் செயல்திறனை மேம்படுத்துவதற்குத் தேவையான சூழலையும் தரவின் வகையையும் மாற்ற உங்களுக்கு விருப்பம் உள்ளது. செயற்கைத் தரவுக்கான துல்லியத்தை வலுவான மதிப்பெண்ணுடன் எளிதாகப் பெற முடியும் என்றாலும், லேபிளிடப்பட்ட நிகழ்நேரத் தரவின் துல்லியம் எப்போதாவது மிகவும் விலை உயர்ந்ததாக இருக்கும்.
செயற்கைத் தரவை எவ்வாறு உருவாக்குவது?
செயற்கைத் தரவு சேகரிப்பை உருவாக்கப் பயன்படுத்தப்படும் அணுகுமுறைகள் பின்வருமாறு:
புள்ளிவிவர விநியோகத்தின் அடிப்படையில்
இந்த வழக்கில் பயன்படுத்தப்படும் மூலோபாயம், விநியோகத்திலிருந்து எண்களை எடுப்பது அல்லது ஒப்பிடக்கூடியதாக இருக்கும் தவறான தரவை உருவாக்க உண்மையான புள்ளிவிவர விநியோகங்களைப் பார்ப்பது. சில சூழ்நிலைகளில் உண்மையான தரவு முற்றிலும் இல்லாமல் இருக்கலாம்.
ஒரு தரவு விஞ்ஞானி, உண்மையான தரவுகளில் உள்ள புள்ளிவிவர விநியோகத்தை ஆழமாகப் புரிந்து கொண்டால், எந்தவொரு விநியோகத்தின் சீரற்ற மாதிரியைக் கொண்ட தரவுத்தொகுப்பை உருவாக்க முடியும். சாதாரண விநியோகம், அதிவேகப் பரவல், கை-சதுரப் பரவல், லாக்நார்மல் விநியோகம் மற்றும் பல, இதைச் செய்யப் பயன்படுத்தக்கூடிய புள்ளிவிவர நிகழ்தகவு விநியோகங்களின் சில எடுத்துக்காட்டுகள்.
பயிற்சி பெற்ற மாதிரியின் துல்லியத்தில் தரவு விஞ்ஞானியின் அனுபவத்தின் நிலை குறிப்பிடத்தக்க தாக்கத்தை ஏற்படுத்தும்.
மாதிரியைப் பொறுத்து
இந்த நுட்பம் சீரற்ற தரவை உருவாக்க அந்த மாதிரியைப் பயன்படுத்துவதற்கு முன்பு கவனிக்கப்பட்ட நடத்தையைக் கணக்கிடும் மாதிரியை உருவாக்குகிறது. சாராம்சத்தில், இது அறியப்பட்ட விநியோகத்திலிருந்து தரவுகளுடன் உண்மையான தரவைப் பொருத்துவதை உள்ளடக்குகிறது. மான்டே கார்லோ அணுகுமுறையானது போலியான தரவை உருவாக்க நிறுவனங்களால் பயன்படுத்தப்படலாம்.
கூடுதலாக, விநியோகங்களையும் பயன்படுத்தி பொருத்தலாம் இயந்திர கற்றல் மாதிரிகள் முடிவு மரங்கள் போல. தரவு விஞ்ஞானிகள் முன்னறிவிப்புக்கு கவனம் செலுத்த வேண்டும், இருப்பினும், முடிவெடுக்கும் மரங்கள் பொதுவாக அவற்றின் எளிமை மற்றும் ஆழமான விரிவாக்கம் காரணமாக மிகைப்படுத்தப்படுகின்றன.
ஆழ்ந்த கற்றலுடன்
ஆழமான கற்றல் மாறுபட்ட ஆட்டோஎன்கோடர் (VAE) அல்லது ஜெனரேட்டிவ் அட்வர்ஸரியல் நெட்வொர்க் (GAN) மாதிரிகளைப் பயன்படுத்தும் மாதிரிகள் செயற்கைத் தரவை உருவாக்க இரண்டு வழிகளாகும். மேற்பார்வை செய்யப்படாத இயந்திர கற்றல் மாதிரிகளில் VAEகள் அடங்கும்.
அவை குறியாக்கிகளால் ஆனவை, அவை அசல் தரவை சுருக்கி, சுருக்கி, மற்றும் உண்மையான தரவின் பிரதிநிதித்துவத்தை வழங்க இந்தத் தரவை ஆராயும் டிகோடர்கள். உள்ளீடு மற்றும் வெளியீட்டுத் தரவை முடிந்தவரை ஒரே மாதிரியாக வைத்திருப்பது VAE இன் அடிப்படை நோக்கமாகும். இரண்டு எதிர் நரம்பியல் நெட்வொர்க்குகள் GAN மாதிரிகள் மற்றும் எதிரி நெட்வொர்க்குகள்.
ஜெனரேட்டர் நெட்வொர்க் என்று அறியப்படும் முதல் நெட்வொர்க், போலியான தரவுகளை உருவாக்கும் பொறுப்பில் உள்ளது. பாரபட்சமான நெட்வொர்க், இரண்டாவது நெட்வொர்க், தரவுத்தொகுப்பு மோசடியானதா என்பதைக் கண்டறியும் முயற்சியில் உருவாக்கப்பட்ட செயற்கைத் தரவை உண்மையான தரவுகளுடன் ஒப்பிடுவதன் மூலம் செயல்படுகிறது. ஒரு போலியான தரவுத்தொகுப்பைக் கண்டறியும் போது, பாரபட்சமானவர் ஜெனரேட்டரை எச்சரிப்பார்.
பாகுபாடு காண்பவருக்கு வழங்கப்பட்ட பின்வரும் தொகுதி தரவு ஜெனரேட்டரால் மாற்றியமைக்கப்படுகிறது. இதன் விளைவாக, போலியான தரவுத்தொகுப்புகளைக் கண்டறிவதில் பாரபட்சம் காட்டுபவர் காலப்போக்கில் சிறந்து விளங்குகிறார். நிதித் துறையில் மோசடியைக் கண்டறிவதற்காகவும், மருத்துவ இமேஜிங்கிற்காக சுகாதாரத் துறையிலும் இந்த வகையான மாதிரி அடிக்கடி பயன்படுத்தப்படுகிறது.
தரவு பெருக்குதல் என்பது தரவு விஞ்ஞானிகள் அதிக தரவுகளை உருவாக்க பயன்படுத்தும் ஒரு வித்தியாசமான முறையாகும். இருப்பினும், இது போலி தரவு என்று தவறாக நினைக்கக்கூடாது. எளிமையாகச் சொன்னால், தரவுப் பெருக்கம் என்பது ஏற்கனவே இருக்கும் உண்மையான தரவுத்தொகுப்பில் புதிய தரவைச் சேர்ப்பதாகும்.
ஒரு படத்திலிருந்து பல படங்களை உருவாக்குதல், உதாரணமாக, நோக்குநிலை, பிரகாசம், உருப்பெருக்கம் மற்றும் பலவற்றைச் சரிசெய்வதன் மூலம். சில நேரங்களில், தனிப்பட்ட தகவல் மட்டுமே மீதமுள்ள நிலையில் உண்மையான தரவுத் தொகுப்பு பயன்படுத்தப்படுகிறது. தரவு அநாமதேயமாக்கல் என்பது இதுவாகும், மேலும் அத்தகைய தரவுகளின் தொகுப்பானது செயற்கைத் தரவுகளாகக் கருதப்படக்கூடாது.
செயற்கைத் தரவின் சவால்கள் மற்றும் வரம்புகள்
செயற்கைத் தரவு பல்வேறு நன்மைகளைக் கொண்டிருந்தாலும், தரவு அறிவியல் செயல்பாடுகளில் நிறுவனங்களுக்கு உதவ முடியும், அது சில வரம்புகளையும் கொண்டுள்ளது:
- தரவு நம்பகத்தன்மை: ஒவ்வொரு மெஷின் லேர்னிங்/ஆழமான கற்றல் மாதிரியும் அது அளிக்கப்படும் தரவைப் போலவே சிறப்பாக இருக்கும் என்பது பொதுவான அறிவு. இந்தச் சூழலில் செயற்கைத் தரவின் தரமானது உள்ளீட்டுத் தரவின் தரம் மற்றும் தரவை உருவாக்கப் பயன்படுத்தப்படும் மாதிரி ஆகியவற்றுடன் வலுவாக தொடர்புடையது. செயற்கைத் தரவுகளில் இவை மிகத் தெளிவாகப் பிரதிபலிக்கும் என்பதால், மூலத் தரவில் எந்தச் சார்புகளும் இல்லை என்பதை உறுதிப்படுத்துவது மிகவும் முக்கியமானது. மேலும், முன்னறிவிப்புகளைச் செய்வதற்கு முன், தரவின் தரம் உறுதிப்படுத்தப்பட்டு சரிபார்க்கப்பட வேண்டும்.
- அறிவு, முயற்சி மற்றும் நேரம் தேவை: உண்மையான தரவை உருவாக்குவதை விட செயற்கைத் தரவை உருவாக்குவது எளிமையானது மற்றும் செலவு குறைந்ததாக இருக்கலாம், அதற்கு சில அறிவு, நேரம் மற்றும் முயற்சி தேவை.
- முரண்பாடுகளை பிரதிபலிக்கும்: நிஜ உலகத் தரவின் சரியான பிரதி சாத்தியமில்லை; செயற்கை தரவு மட்டுமே அதை தோராயமாக மதிப்பிட முடியும். எனவே, உண்மையான தரவுகளில் இருக்கும் சில வெளிப்புறங்கள் செயற்கைத் தரவுகளால் மறைக்கப்படாமல் இருக்கலாம். வழக்கமான தரவை விட தரவு முரண்பாடுகள் மிகவும் குறிப்பிடத்தக்கவை.
- உற்பத்தியைக் கட்டுப்படுத்துதல் மற்றும் தரத்தை உறுதி செய்தல்: செயற்கைத் தரவு என்பது நிஜ உலகத் தரவைப் பிரதிபலிக்கும் நோக்கம் கொண்டது. தரவு கையேடு சரிபார்ப்பு இன்றியமையாததாகிறது. வழிமுறைகளைப் பயன்படுத்தி தானாக உருவாக்கப்பட்ட சிக்கலான தரவுத்தொகுப்புகளுக்கான இயந்திர கற்றல்/ஆழமான கற்றல் மாதிரிகளில் தரவை இணைப்பதற்கு முன் அதன் துல்லியத்தை சரிபார்க்க வேண்டியது அவசியம்.
- பயனர் கருத்து: செயற்கைத் தரவு ஒரு புதுமையான கருத்தாக இருப்பதால், அதைக் கொண்டு செய்யப்படும் முன்னறிவிப்புகளை அனைவரும் நம்பத் தயாராக இருக்க மாட்டார்கள். பயனர் ஏற்றுக்கொள்ளும் தன்மையை அதிகரிக்க, செயற்கைத் தரவின் பயன்பாட்டைப் பற்றிய அறிவை முதலில் பெறுவது அவசியம் என்பதை இது குறிக்கிறது.
காலத்திற்காக
முந்தைய தசாப்தத்தில் செயற்கை தரவுகளின் பயன்பாடு வியத்தகு அளவில் அதிகரித்துள்ளது. இது நிறுவனங்களின் நேரத்தையும் பணத்தையும் மிச்சப்படுத்தினாலும், அதன் குறைபாடுகள் இல்லாமல் இல்லை. இது வெளிப்புறங்களைக் கொண்டிருக்கவில்லை, இது உண்மையான தரவுகளில் இயற்கையாகவே நிகழ்கிறது மற்றும் சில மாதிரிகளில் துல்லியத்திற்கு முக்கியமானது.
செயற்கைத் தரவின் தரமானது உருவாக்கப் பயன்படுத்தப்படும் உள்ளீட்டுத் தரவை அடிக்கடி சார்ந்துள்ளது என்பதும் குறிப்பிடத்தக்கது; உள்ளீட்டுத் தரவில் உள்ள சார்புகள் செயற்கைத் தரவுகளில் விரைவாகப் பரவக்கூடும், எனவே உயர்தரத் தரவை ஆரம்பப் புள்ளியாகத் தேர்ந்தெடுப்பது மிகைப்படுத்தப்படக் கூடாது.
இறுதியாக, முரண்பாடுகள் அறிமுகப்படுத்தப்படவில்லை என்பதைச் சரிபார்க்க, செயற்கைத் தரவை மனித-குறிப்பிடப்பட்ட உண்மையான தரவுகளுடன் ஒப்பிடுவது உட்பட, கூடுதல் வெளியீட்டு கட்டுப்பாடு தேவைப்படுகிறது. இந்த தடைகள் இருந்தபோதிலும், செயற்கை தரவு ஒரு நம்பிக்கைக்குரிய துறையாக உள்ளது.
நிஜ-உலக தரவு கிடைக்காதபோதும் புதிய AI தீர்வுகளை உருவாக்க இது உதவுகிறது. மிகவும் குறிப்பிடத்தக்க வகையில், நிறுவனங்களை உள்ளடக்கிய மற்றும் இறுதி நுகர்வோரின் பன்முகத்தன்மையைக் குறிக்கும் தயாரிப்புகளை உருவாக்க இது உதவுகிறது.
இருப்பினும், தரவு உந்துதல் எதிர்காலத்தில், செயற்கைத் தரவு, தரவு விஞ்ஞானிகளுக்கு புதிய மற்றும் ஆக்கப்பூர்வமான பணிகளைச் செய்ய உதவுவதை நோக்கமாகக் கொண்டுள்ளது.
தீர்மானம்
சில சந்தர்ப்பங்களில், செயற்கைத் தரவு ஒரு வணிகம் அல்லது நிறுவனத்திற்குள் தரவுப் பற்றாக்குறை அல்லது தொடர்புடைய தரவு பற்றாக்குறையைப் போக்கலாம். செயற்கைத் தரவை உருவாக்குவதற்கு எந்த உத்திகள் உதவலாம் மற்றும் அதிலிருந்து யார் லாபம் பெறலாம் என்பதையும் நாங்கள் பார்த்தோம்.
செயற்கைத் தரவைக் கையாள்வதில் வரும் சில சிரமங்களைப் பற்றியும் பேசினோம். வணிக ரீதியாக முடிவெடுப்பதற்கு, உண்மையான தரவு எப்போதும் சாதகமாக இருக்கும். எவ்வாறாயினும், அத்தகைய உண்மையான மூல தரவு பகுப்பாய்வுக்கு அணுக முடியாதபோது யதார்த்தமான தரவு அடுத்த சிறந்த தேர்வாகும்.
இருப்பினும், செயற்கைத் தரவை உருவாக்க, தரவு மாடலிங் பற்றிய உறுதியான பிடிப்பு கொண்ட தரவு விஞ்ஞானிகள் தேவை என்பதை நினைவில் கொள்ள வேண்டும். உண்மையான தரவு மற்றும் அதன் சுற்றுப்புறங்களைப் பற்றிய முழுமையான புரிதலும் அவசியம். கிடைத்தால், தயாரிக்கப்பட்ட தரவு சாத்தியமான அளவுக்கு துல்லியமானது என்பதை உறுதிப்படுத்த இது அவசியம்.
ஒரு பதில் விடவும்