පටුන[සඟවන්න][පෙන්වන්න]
GPT-3, මේ මොහොතේ විශාල ස්නායු ජාලය, 2020 මැයි මාසයේදී ප්රකාශයට පත් කරන ලදී OpenAI, AI ආරම්භය Elon Musk සහ Sam Altman විසින් සම-ආරම්භ කරන ලදී. GPT-3 යනු එහි පූර්වගාමී GPT-175 හි පරාමිතීන් බිලියන 1,5 ට සාපේක්ෂව 2 බිලියන පරාමිති සහිත අති නවීන භාෂා ආකෘතියකි.
GPT-3 මයික්රොසොෆ්ට් හි NLG ටියුරින් මාදිලිය (Turing Natural Language Generation) අභිබවා ගිය අතර එය මීට පෙර බිලියන 17ක පරාමිති සහිත විශාලතම ස්නායුක ජාලය සඳහා වාර්තාව තබා තිබුණි.
භාෂා ආකෘතිය ප්රශංසාවට ලක් වී, විවේචනයට ලක් වී, සහ විමර්ශනයට පවා ලක් වී ඇත. එය නව සහ කුතුහලය දනවන භාවිතයන් ද ඇති කර ඇත. දැන් OpenAI හි මීළඟ සංස්කරණය වන GPT-4 බවට වාර්තා තිබේ භාෂා ආකෘතිය, ඇත්තෙන්ම ඉක්මනින් පැමිණෙනු ඇත.
ඔබට GPT-4 ගැන තව දැන ගැනීමට අවශ්ය නම් ඔබ නිවැරදි අඩවියට පැමිණ ඇත. අපි මෙම ලිපියෙන් GPT-4 ගැඹුරින් බලමු, එහි පරාමිතීන්, එය අනෙකුත් මාදිලි සමඟ සංසන්දනය කරන ආකාරය සහ තවත් බොහෝ දේ ආවරණය කරයි.
ඉතින්, GPT-4 යනු කුමක්ද?
GPT-4 හි විෂය පථය තේරුම් ගැනීමට, අපි මුලින්ම එහි පූර්වගාමියා වන GPT-3 තේරුම් ගත යුතුය. GPT-3 (උත්පාදක පෙර-පුහුණු ට්රාන්ස්ෆෝමරය, තුන්වන පරම්පරාව) යනු ස්වයංක්රීය අන්තර්ගත උත්පාදක මෙවලමකි.
පරිශීලකයින් a වෙත දත්ත ඇතුල් කරයි යන්ත්ර ඉගෙනීම OpenAI ට අනුව, පසුව ප්රතිචාර වශයෙන් අදාළ ලිවීම් විශාල ප්රමාණයක් නිපදවිය හැකි ආකෘතිය. GPT-4 කිහිපයක් වෙඩි තත්ත්වයේදී බහුකාර්යය කිරීමේදී සැලකිය යුතු ලෙස වඩා හොඳ වනු ඇත - වර්ගයකි යන්ත්ර ඉගෙනීම - ප්රතිඵල මිනිසුන්ගේ ප්රතිඵලවලට වඩා සමීප කිරීම.
GPT-3 ඉදිකිරීම සඳහා පවුම් මිලියන සිය ගණනක් වැය වේ, නමුත් GPT-4 පරිමාණයෙන් පන්සිය ගුණයකින් විශාල වන නිසා සැලකිය යුතු ලෙස වැඩි මුදලක් වැය වනු ඇතැයි පුරෝකථනය කර ඇත. මෙය ඉදිරිදර්ශනයක තැබීමට,
GPT-4 මොළයේ උපාගමයන් තරම් බොහෝ ලක්ෂණ තිබිය හැක. GPT-4 ප්රධාන වශයෙන් GPT-3 ලෙසම එම ක්රම භාවිතා කරනු ඇත, එබැවින් සුසමාදර්ශීය පිම්මක් වෙනුවට, GPT-4 දැනට GPT-3 ඉටු කරන දේ මත පුළුල් කරනු ඇත - නමුත් සැලකිය යුතු ලෙස වැඩි අනුමාන හැකියාවක් ඇත.
GPT-3 භාවිතා කරන්නන්ට ප්රායෝගික අවශ්යතා සඳහා ස්වභාවික භාෂාවට ඇතුළු වීමට ඉඩ ලබා දී ඇත, නමුත් හොඳ ප්රතිඵල ගෙන දෙන ප්රවේගයක් සැලසුම් කිරීමට එයට තවමත් විශේෂඥ දැනුමක් අවශ්ය විය. GPT-4 පරිශීලකයින්ගේ අභිප්රායන් පුරෝකථනය කිරීමේදී සැලකිය යුතු ලෙස වඩා හොඳ වනු ඇත.
GPT-4 පරාමිති මොනවාද?
වඩාත් පුලුල්ව බලා සිටින AI දියුණුවක් තිබියදීත්, GPT-4 ගැන කිසිවක් නොදනී: එය කෙබඳු වනු ඇත්ද, එහි ලක්ෂණ මොනවාද සහ එහි බලයන් මොනවාද.
පසුගිය වසරේ, Altman විසින් ප්රශ්නෝත්තරයක් කළ අතර GPT-4 සඳහා OpenAI හි අභිලාෂයන් පිළිබඳ තොරතුරු කිහිපයක් හෙළි කළේය. Altman ට අනුව එය GPT-3 ට වඩා විශාල නොවේ. GPT-4 වඩාත් බහුලව භාවිතා කිරීමට අපහසුය භාෂා ආකෘතිය. පෙර පරම්පරාවන්ට සාපේක්ෂව මෙම ආකෘතිය විශාල වනු ඇත ස්නායු ජාල, එහි විශාලත්වය එහි කැපී පෙනෙන ලක්ෂණයක් නොවනු ඇත. GPT-3 සහ Gopher වඩාත්ම පිළිගත හැකි අපේක්ෂකයින් (175B-280B).
Nvidia සහ Microsoft හි Megatron-Turing NLG විසින් වාර්තාව තබා ඇත ඝනතම ස්නායු ජාලය 530B හි පරාමිති - GPT-3 මෙන් තුන් ගුණයක් - මෑතක් වන තුරු Google හි PalM එය 540B ට ගන්නා තෙක්. පුදුමයට කරුණක් නම්, අඩු මාදිලි රාශියක් MT-NLG අභිබවා යාමයි.
බල-නීති සම්බන්ධතාවයකට අනුව, OpenAI හි Jared Kaplan සහ සගයන් 2020 දී තීරණය කළේ අයවැය වැඩිවීම් සැකසීමේදී බොහෝ දුරට පරාමිතීන් ගණන වැඩි කිරීම සඳහා වැය කරන විට, කාර්ය සාධනය උපරිම ලෙස වැඩිදියුණු වන බවයි. Google, Nvidia, Microsoft, OpenAI, DeepMind, සහ අනෙකුත් භාෂා-ආකෘතිකරණ සමාගම් කීකරු ලෙස රෙගුලාසි අනුගමනය කළහ.
Altman පෙන්වා දුන්නේ ඔවුන් තවදුරටත් දැවැන්ත මාදිලි තැනීම කෙරෙහි අවධානය යොමු නොකරන නමුත් කුඩා මාදිලිවල කාර්ය සාධනය උපරිම කිරීම කෙරෙහි බවයි.
OpenAI පර්යේෂකයන් පරිමාණ කල්පිතයේ මුල් යෝජකයින් විය, නමුත් අතිරේක, කලින් සොයා නොගත් මාර්ග උසස් මාදිලිවලට තුඩු දිය හැකි බව ඔවුන් සොයා ගෙන ඇත. මෙම හේතූන් මත GPT-4 GPT-3 ට වඩා සැලකිය යුතු තරම් විශාල නොවේ.
වඩා ඉක්මනින් සැලකිය යුතු ප්රතිලාභ ලබා දීමට හැකියාව ඇති දත්ත, ඇල්ගොරිතම, පරාමිතිකරණය සහ පෙළගැස්ම වැනි අනෙකුත් අංශ කෙරෙහි OpenAI වැඩි අවධානයක් යොමු කරනු ඇත. 100T පරාමිති සහිත ආකෘතියක් කළ හැකි දේ අපට බලා සිටීමට සිදුවනු ඇත.
ප්රධාන කරුණු:
- ආකෘතියේ ප්රමාණය: GPT-4 GPT-3 ට වඩා විශාල වනු ඇත, නමුත් වැඩි නොවේ (MT-NLG 530B සහ PalM 540B). ආකෘතියේ විශාලත්වය සැලකිය නොහැකි වනු ඇත.
- ප්රශස්ත බව: GPT-4 GPT-3 ට වඩා වැඩි සම්පත් භාවිතා කරනු ඇත. එය පරාමිතිකරණය (ප්රශස්ත අධි පරාමිති) සහ පරිමාණ ක්රම (පුහුණු ටෝකන ගණන ආදර්ශ ප්රමාණය තරම්ම වැදගත්) පිළිබඳ නව ප්රශස්ත අවබෝධයන් ක්රියාත්මක කරනු ඇත.
- බහුවිධතාවය: GPT-4 හට කෙටි පණිවිඩ යැවීමට සහ ලැබීමට පමණක් හැකි වනු ඇත (බහු මාදිලියේ නොවේ). OpenAI වැනි බහුමාධ්ය මාදිලි වෙත සංක්රමණය වීමට පෙර භාෂා ආකෘති ඒවායේ සීමාවන්ට තල්ලු කිරීමට උත්සාහ කරයි DALLE 2, ඔවුන් පුරෝකථනය කරන පරිදි අවසානයේ ඒකමතික පද්ධති අභිබවා යනු ඇත.
- ස්පාර්සිටි: GPT-4, එහි පූර්වගාමී GPT-2 සහ GPT-3 වැනි, ඝන ආකෘතියක් වනු ඇත (ඕනෑම ආදානයක් සැකසීමට සියලු පරාමිති භාවිතා වේ). අනාගතයේ දී ස්පාර්සිටි වඩාත් වැදගත් වනු ඇත.
- මෙතැන් පටන්ය: GPT-4 GPT-3 ට වඩා අපට සමීප වනු ඇත. එය මානව ආදානයෙන් සංවර්ධනය කරන ලද InstructGPT වෙතින් ඉගෙන ගත් දේ දමනු ඇත. තවමත්, AI අභිසාරී වීම බොහෝ දුර බැහැර වන අතර, උත්සාහයන් අතිශයෝක්තියට වඩා ප්රවේශමෙන් තක්සේරු කළ යුතුය.
නිගමනය
කෘතිම සාමාන්ය බුද්ධිය. එය විශාල අරමුණක්, නමුත් OpenAI සංවර්ධකයින් එය සාක්ෂාත් කර ගැනීමට කටයුතු කරයි. AGI හි පරමාර්ථය වන්නේ පුද්ගලයෙකුට කළ හැකි ඕනෑම ක්රියාකාරකමක් තේරුම් ගැනීමට සහ කිරීමට හැකියාව ඇති ආකෘතියක් හෝ "නියෝජිතයෙකු" නිර්මාණය කිරීමයි.
GPT-4 මෙම අරමුණ සාක්ෂාත් කර ගැනීමේ මීළඟ පියවර විය හැකි අතර, එය විද්යා ප්රබන්ධ චිත්රපටයකින් පිට වූ දෙයක් ලෙස පෙනේ. AGI ලබා ගැනීම කෙතරම් යථාර්ථවාදී දැයි ඔබ කල්පනා කරනවා විය හැකිය.
Google හි ඉංජිනේරු අධ්යක්ෂ Ray Kurzweil පවසන පරිදි 2029 වන විට අපි මෙම සන්ධිස්ථානයට ළඟා වනු ඇත. මෙය මනසේ තබාගෙන, අපි AGI (කෘතිම සාමාන්ය බුද්ධිය) වෙත සමීප වන විට GPT-4 සහ මෙම ආකෘතියේ ප්රතිවිපාක පිළිබඳව ගැඹුරින් බලමු.
ඔබමයි