Skutočnosť, že to, ako používateľ interaguje s generatívnymi modelmi a systémami AI, je prinajmenšom rovnako dôležité ako základné školiace a inferenčné technológie, určite nie je prekvapením pre tých, ktorí sa tejto téme intenzívne venujú.
OpenAI sa už so svojimi dostala na titulky Dall-e2 technológia generujúca obrázky a jej séria GPT si získala pozornosť pri každej ďalšej opakovanej verzii a občasnú existenčnú hrôzu zo strany spisovateľov.
Diskusia sa trochu posunula z „vysokoškoláci to použijú na tvorbu funkčných semestrálnych prác“ na „toto mi môže skutočne pomôcť pri ladení kódu, ktorý chcem uviesť do produkcie“ s najnovšou verziou ChatGPT, zdá sa však, že rozširuje jej príťažlivosť a publikum.
V tomto článku sa podrobne pozrieme na značku GPT, aby sme zistili, ako funguje a čo je najdôležitejšie, ako funguje a ešte oveľa viac.
Takže, čo je ChatGPT z OpenAI?
ChatGPT, najnovší OpenAI jazykový model, bol navrhnutý s ohľadom na konverzačné interakcie. Je to silný nástroj, ktorý možno využiť na zvýšenie vašej produktivity v rôznych disciplínach.
Je to generatívny predtrénovaný transformátor založený na chate. Ide o druh technológie umelej inteligencie (AI), ktorý vyvinula výskumná a vývojová spoločnosť AI OpenAI a využíva model NLP.
Analyzuje a rozumie pomocou hovoreného alebo písaného jazyka algoritmy strojového učenia, potom vytvorí odpovede v závislosti od tohto vstupu.
Školenie ChatGPT
Tento model bol trénovaný pomocou Open AI Posilňovacie učenie z Human Feedback (RLHF), využívajúce rovnaké postupy ako InstructGPT, ale s malými úpravami v konfigurácii zhromažďovania údajov.
Na trénovanie počiatočného modelu použili doladenie pod dohľadom: tréneri ľudskej AI viedli dialógy, v ktorých hrali obe strany – používateľa a asistenta AI. Poskytli školiteľom modelom napísané nápady, ktoré im pomohli pri zostavovaní odpovedí.
Od výskumníkov sa požadovalo, aby zhromaždili porovnávacie údaje, ktoré zahŕňali dve alebo viac modelových odpovedí hodnotených podľa kvality, s cieľom vyvinúť model odmeňovania za posilňovanie učenia.
Na získanie týchto údajov použili interakcie chatbotov, ktoré s ním tréneri AI vykonali.
Výskumníci si náhodne vybrali vzorovo napísané vyhlásenie, vybrali niekoľko potenciálnych záverov a požiadali trénerov AI, aby ich zoradili. Môžu použiť Proximal Policy Optimization na úpravu modelu pomocou týchto modelov odmeňovania.
Metódu potom výskumníci niekoľkokrát zopakovali.
Model používaný na výcvik ChatGPT, ktorý ukončil výcvik začiatkom roku 2022, je zo série GPT-3.5. Séria 3.5 je popísaná podrobnejšie tu. Na superpočítačovej infraštruktúre poháňanej Azure AI, Boli vyškolené ChatGPT a GPT 3.5.
Ako ChatGPT je oveľa lepší ako GPT-3?
ChatGPT je postavený na GPT-3.5, založenom na hlbokom učení jazykový model ktorý generuje ľudský text.
ChatGPT je však zaujímavejší ako predchádzajúci model GPT-3, ktorý len absorboval textové podnety a snažil sa pokračovať s vlastným vytvoreným obsahom. Produkuje oveľa komplexnejšie výsledky a môže dokonca generovať poéziu.
Ďalším rozlišovacím znakom je pamäť. Robot môže vyvolať predchádzajúce komentáre v rozhovore a odovzdať ich používateľovi. OpenAI teda zatiaľ sprístupnila robota iba na kontrolu a beta testovanie, ale prístup k API je naplánovaný na budúci rok.
Vývojári budú môcť integrovať ChatGPT do vlastného softvéru s prístupom cez API.
Aký to má význam?
Aby ste skutočne pochopili jeho potenciál, musíte ho skutočne zažiť, ale pokúsim sa vysvetliť pomocou analógie. Jarvisa možno poznáte, ak ste niekedy pozerali film Iron Man.
Jarvis je spoľahlivý pomocník umelej inteligencie Tonyho Starka. ChatGPT si môžete predstaviť ako mladšiu verziu Jarvisa. S ChatGPT môžete efektívnejšie získavať informácie a upravovať, destilovať, upravovať a overovať ich veľmi presným spôsobom.
Ako používate ChatGPT?
Používanie ChatGPT je naozaj jednoduché, len musíte prihlásiť a budete nasmerovaní na ChatGPT.
Teraz už len stačí napísať výzvu a tá automaticky vygeneruje skvelé výsledky pomocou umelej inteligencie.
Možnosti ChatGPT
Vďaka širokému spektru účelov, na ktoré možno ChatGPT rozšíriť, je taký výkonný. Možnosti sú prakticky neobmedzené, či už ide o riešenie aritmetických alebo účtovných problémov, vytváranie zostáv, skriptov pre prezentácie, blogové články, návody, obchodné stratégie, ako je tá spomenutá vyššie, alebo úryvky kódu atď.
Tu je niekoľko kategórií, v ktorých možno ChatGPT využiť na zvýšenie efektívnosti a produkcie, ktoré vám pomôžu začať:
- Generovanie dokumentu: ChatGPT možno použiť na vytváranie dokumentov, ako sú správy, prezentácie a návrhy, a to jednoduchým zadaním niekoľkých dôležitých údajov a nechať ChatGPT urobiť zvyšok. "Môžete pripraviť správu o našich štvrťročných predajných číslach s tabuľkami a grafmi?" môžete sa opýtať ChatGPT.
- Odpovede na e-mail: ChatGPT možno použiť na vytváranie prispôsobených a pútavých e-mailových odpovedí, čo šetrí čas a zaisťuje rýchle a profesionálne spracovanie kritickej komunikácie. Môžete sa napríklad opýtať ChatGPT: „Ako mám reagovať na túto e-mailovú žiadosť láskavým a profesionálnym spôsobom?“
- Analýza dát: ChatGPT dokáže analyzovať obrovské objemy údajov a objaviť kritické vzorce a poznatky, čím pomáha tímom robiť lepšie rozhodnutia založené na údajoch. "Aké sú významné trendy v našich štatistikách predaja za posledný rok?" môžete sa opýtať ChatGPT.
- Podnikateľské nápady: ChatGPT možno použiť aj na vývoj nových nápadov spoločnosti poskytnutím niektorých informácií o odvetví a trhu a umožnením ChatGPT vytvárať perspektívne koncepty a nápady. To môže pomôcť podnikateľom a obchodným lídrom pri vymýšľaní nových a originálnych tovarov, služieb a iniciatív. "Môžete rozvíjať podnikateľské nápady pre nové softvérové riešenie v zdravotníctve?" môžete sa opýtať ChatGPT.
- Generovanie kódu: ChatGPT umožňuje vytváranie kódu, detekciu chýb a opravu. Požiadaním o niekoľko podrobností o požadovanej funkcii môže vygenerovať použiteľný kód, ktorý môže vývojár upraviť a vylepšiť. Identifikáciou bežných nedostatkov a defektov v kódovaní a poskytnutím pokynov, ako ich opraviť, možno ChatGPT použiť aj na ladenie programov. Môžete sa napríklad opýtať ChatGPT: „Môžete vytvoriť funkciu na výpočet priemeru zoznamu čísel a upozorniť na chyby v syntaxi v nasledujúcom kóde?
Obmedzenia služby ChatGPT
ChatGPT je citlivý na zmeny vo vstupných frázach alebo niekoľko pokusov o rovnakú otázku. Napríklad pri jednej formulácii otázky môže model tvrdiť, že je neznalý, ale pri malom preformulovaní môže presne odpovedať.
Model je často veľmi podrobný a nadmerne používa špecifické výrazy, ako napríklad opakovanie, že ide o jazykový model trénovaný OpenAI. Tieto problémy vznikajú ako dôsledok zaujatosti v tréningových údajoch (tréneri uprednostňujú zdĺhavejšie odpovede, ktoré sa zdajú dôkladnejšie) a dobre známych obáv z nadmernej optimalizácie.
Niekedy ChatGPT generuje odpovede, ktoré sa zdajú byť správne, ale v skutočnosti sú nepravdivé alebo absurdné. Riešenie tohto problému je ťažké, pretože:
- V súčasnosti neexistuje zdroj pravdy v celom tréningu RL.
- Model odmietne otázku, na ktorú môže presne odpovedať ako výsledok tréningu opatrnosti;
- Model je zavádzaný tréningom pod dohľadom, pretože najlepšia odozva závisí viac od toho, čo vie model, než od toho, čo vie ľudský demonštrant.
záver
Nakoniec, ChatGPT, AI chatbot odhalený výskumnou spoločnosťou OpenAI pre umelú inteligenciu, sa stal populárnym, keď ho jednotlivci začali používať na zodpovedanie školských úloh alebo zisťovanie chýb v kóde.
Chatbot bol naprogramovaný tak, aby sa zapojil do konverzačného štýlu a reagoval do hĺbky. Môže tiež odpovedať na doplňujúce otázky, priznať chyby a odmietnuť nevhodné požiadavky.
Nechaj odpoveď