ข้อเท็จจริงที่ว่าวิธีที่ผู้ใช้โต้ตอบกับโมเดลและระบบ AI กำเนิดนั้นมีความสำคัญอย่างน้อยพอๆ กับเทคโนโลยีการฝึกอบรมและการอนุมานพื้นฐาน จึงไม่น่าแปลกใจสำหรับผู้ที่ทำงานในหัวข้อนี้อย่างกว้างขวาง
OpenAI ได้พาดหัวข่าวไปแล้ว ดัล-E2 เทคโนโลยีการสร้างภาพและซีรีส์ GPT ได้รับการแจ้งให้ทราบด้วยการทำซ้ำติดต่อกันแต่ละครั้งและความหวาดกลัวที่มีอยู่เป็นครั้งคราวในส่วนของผู้เขียน
การโต้วาทีได้เปลี่ยนจาก “นักศึกษาระดับปริญญาตรีจะใช้สิ่งนี้เพื่อผลิตภาคนิพนธ์ที่ใช้การได้” เป็น “สิ่งนี้สามารถช่วยฉันแก้จุดบกพร่องของโค้ดที่ฉันต้องการนำไปใช้จริงได้อย่างแท้จริง” ด้วย ChatGPT เวอร์ชันใหม่ล่าสุด แต่ดูเหมือนว่าจะขยายความอุทธรณ์และ ผู้ชม.
ในบทความนี้ เราจะเจาะลึกเกี่ยวกับ GPT เพื่อดูว่า GPT ทำงานอย่างไร และที่สำคัญที่สุดคือทำงานอย่างไร และอื่นๆ อีกมากมาย
ดังนั้นคืออะไร ChatGPT ราคาเริ่มต้นที่ OpenAI?
ChatGPT ใหม่ล่าสุดของ OpenAI แบบจำลองภาษาได้รับการออกแบบโดยคำนึงถึงการโต้ตอบการสนทนาเป็นหลัก เป็นเครื่องมือที่แข็งแกร่งที่สามารถใช้เพื่อเพิ่มประสิทธิภาพการทำงานของคุณในหลากหลายสาขาวิชา
เป็น Transformer ที่ได้รับการฝึกฝนล่วงหน้าสำหรับการแชท เป็นเทคโนโลยีปัญญาประดิษฐ์ (AI) ประเภทหนึ่งที่พัฒนาโดยบริษัทวิจัยและพัฒนา AI OpenAI และใช้โมเดล NLP
วิเคราะห์และทำความเข้าใจภาษาพูดหรือภาษาเขียนโดยใช้ อัลกอริทึมการเรียนรู้ของเครื่องจากนั้นสร้างการตอบกลับโดยขึ้นอยู่กับอินพุตนั้น
การฝึกอบรม ChatGPT
โมเดลนี้ได้รับการฝึกฝนโดย Open AI ที่ใช้ การเรียนรู้เสริมแรง จาก Human Feedback (RLHF) ใช้ขั้นตอนเดียวกับ InstructGPT แต่มีการแก้ไขเล็กน้อยในการกำหนดค่าการรวบรวมข้อมูล
พวกเขาใช้การปรับแต่งแบบละเอียดภายใต้การดูแลเพื่อฝึกโมเดลเริ่มต้น: เทรนเนอร์ AI ที่เป็นมนุษย์ให้บทสนทนาที่พวกเขาเล่นทั้งสองฝ่าย นั่นคือผู้ใช้และผู้ช่วย AI พวกเขาให้แนวคิดที่เขียนแบบจำลองแก่ผู้ฝึกอบรมเพื่อช่วยพวกเขาในการเขียนคำตอบ
นักวิจัยจำเป็นต้องรวบรวมข้อมูลเปรียบเทียบ ซึ่งรวมถึงแบบจำลองคำตอบสองแบบขึ้นไปที่ประเมินตามคุณภาพ เพื่อพัฒนาแบบจำลองรางวัลสำหรับการเรียนรู้แบบเสริมแรง
พวกเขาใช้การโต้ตอบของแชทบอทที่ผู้ฝึกสอน AI ดำเนินการเพื่อรับข้อมูลนี้
นักวิจัยสุ่มเลือกข้อความที่เขียนขึ้นแบบจำลอง สุ่มตัวอย่างข้อสรุปที่เป็นไปได้สองสามข้อ และขอให้ผู้ฝึกสอน AI จัดอันดับพวกเขา พวกเขาสามารถใช้ Proximal Policy Optimization เพื่อปรับโมเดลโดยใช้โมเดลรางวัลเหล่านี้
วิธีการนี้ถูกทำซ้ำหลายครั้งโดยนักวิจัย
โมเดลที่ใช้ในการฝึก ChatGPT ซึ่งสิ้นสุดการฝึกในช่วงต้นปี 2022 มาจากซีรีส์ GPT-3.5 ซีรีส์ 3.5 ครอบคลุมรายละเอียดมากขึ้น โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม. บนโครงสร้างพื้นฐานซูเปอร์คอมพิวเตอร์ที่ขับเคลื่อนโดย Azure AI ChatGPT และ GPT 3.5 ได้รับการฝึกอบรม.
ChatGPT ดีกว่าอย่างไร จีพีที-3?
ChatGPT สร้างขึ้นบน GPT-3.5 ซึ่งเป็นการเรียนรู้เชิงลึก แบบจำลองภาษา ที่สร้างข้อความเหมือนมนุษย์
อย่างไรก็ตาม ChatGPT นั้นน่าสนใจกว่า GPT-3 รุ่นก่อนหน้า ซึ่งเพียงแค่ดูดซับข้อความและพยายามดำเนินการต่อด้วยเนื้อหาที่สร้างขึ้นเอง มันให้ผลลัพธ์ที่ครอบคลุมมากกว่าและสามารถสร้างบทกวีได้
หน่วยความจำเป็นอีกหนึ่งคุณสมบัติที่แตกต่าง บอทสามารถเรียกคืนความคิดเห็นก่อนหน้าในแชทและส่งต่อไปยังผู้ใช้ ถึงกระนั้น OpenAI ได้ทำให้บอตพร้อมใช้งานสำหรับการตรวจสอบและการทดสอบเบต้าเท่านั้น แต่การเข้าถึง API มีการวางแผนสำหรับปีหน้า
นักพัฒนาจะสามารถรวม ChatGPT เข้ากับซอฟต์แวร์ของตนเองด้วยการเข้าถึง API
ความสำคัญของมันคืออะไร?
เพื่อให้เข้าใจถึงศักยภาพของมันจริงๆ คุณต้องสัมผัสมันจริงๆ แต่ฉันจะพยายามอธิบายโดยใช้การเปรียบเทียบ คุณอาจคุ้นเคยกับ Jarvis หากคุณเคยดูภาพยนตร์เรื่อง Iron Man
Jarvis เป็นผู้ช่วย AI ที่เชื่อถือได้ของ Tony Stark คุณสามารถคิดว่า ChatGPT เป็นเวอร์ชันที่อายุน้อยกว่าของ Jarvis ด้วย ChatGPT คุณสามารถรับข้อมูลได้อย่างมีประสิทธิภาพมากขึ้นและปรับเปลี่ยน กลั่น แก้ไข และตรวจสอบความถูกต้องด้วยวิธีที่แม่นยำมาก
คุณใช้ ChatGPT อย่างไร
การใช้ ChatGPT นั้นง่ายมาก คุณแค่ต้องทำ ลงชื่อเข้าใช้ และคุณจะไปที่ ChatGPT
ตอนนี้เราแค่ต้องเขียนคำสั่ง จากนั้นระบบจะสร้างผลลัพธ์ที่ยอดเยี่ยมโดยอัตโนมัติโดยใช้ปัญญาประดิษฐ์
ความสามารถของ ChatGPT
วัตถุประสงค์ที่หลากหลายที่ ChatGPT สามารถขยายได้คือสิ่งที่ทำให้ ChatGPT มีประสิทธิภาพมาก ตัวเลือกแทบไม่มีขีดจำกัด ไม่ว่าจะเป็นการแก้ปัญหาทางเลขคณิตหรือการบัญชี การสร้างรายงาน สคริปต์สำหรับงานนำเสนอ บล็อก บทช่วยสอน กลยุทธ์ทางธุรกิจอย่างที่กล่าวไว้ข้างต้น หรือข้อมูลโค้ด เป็นต้น
ต่อไปนี้คือบางหมวดหมู่ที่สามารถใช้ ChatGPT เพื่อเพิ่มประสิทธิภาพและการผลิตเพื่อช่วยให้คุณเริ่มต้นได้:
- การสร้างเอกสาร: สามารถใช้ ChatGPT เพื่อจัดทำเอกสารต่างๆ เช่น รายงาน งานนำเสนอ และข้อเสนอ โดยเพียงแค่ป้อนข้อมูลสำคัญเล็กน้อยแล้วปล่อยให้ ChatGPT ดำเนินการที่เหลือ “คุณช่วยจัดทำรายงานยอดขายรายไตรมาสพร้อมแผนภูมิและกราฟได้ไหม” คุณสามารถถาม ChatGPT
- อีเมลตอบกลับ: สามารถใช้ ChatGPT เพื่อสร้างคำตอบทางอีเมลที่ปรับแต่งและมีส่วนร่วม ประหยัดเวลาและมั่นใจได้ว่าการสื่อสารที่สำคัญจะได้รับการจัดการอย่างรวดเร็วและเป็นมืออาชีพ ตัวอย่างเช่น คุณสามารถถาม ChatGPT ว่า “ฉันควรตอบสนองต่อคำขออีเมลนี้ในลักษณะที่สุภาพและเป็นมืออาชีพอย่างไร”
- การวิเคราะห์ข้อมูล: ChatGPT สามารถวิเคราะห์ข้อมูลปริมาณมหาศาลและค้นพบรูปแบบและข้อมูลเชิงลึกที่สำคัญ ช่วยทีมในการตัดสินใจเลือกข้อมูลที่ดีขึ้น “แนวโน้มสำคัญในสถิติการขายของเราในปีที่ผ่านมาคืออะไร” คุณสามารถถาม ChatGPT
- ไอเดียธุรกิจ: นอกจากนี้ยังสามารถใช้ ChatGPT เพื่อพัฒนาแนวคิดใหม่ๆ ของบริษัทด้วยการให้ข้อมูลบางอย่างเกี่ยวกับอุตสาหกรรมและตลาด และอนุญาตให้ ChatGPT สร้างแนวคิดและแนวคิดในอนาคต สิ่งนี้สามารถช่วยผู้ประกอบการและผู้นำธุรกิจในการคิดหาสินค้า บริการ และความคิดริเริ่มใหม่ๆ ที่สดใหม่และเป็นต้นฉบับ “คุณสามารถพัฒนาแนวคิดทางธุรกิจสำหรับโซลูชันซอฟต์แวร์ใหม่ในอุตสาหกรรมการดูแลสุขภาพได้หรือไม่” คุณสามารถถาม ChatGPT
- การสร้างรหัส: ChatGPT เปิดใช้งานการสร้างรหัส การตรวจจับข้อผิดพลาด และการซ่อมแซม การขอรายละเอียดเล็กน้อยเกี่ยวกับฟังก์ชันที่จำเป็นอาจสร้างโค้ดที่ใช้งานได้ซึ่งนักพัฒนาสามารถแก้ไขและปรับปรุงได้ ด้วยการระบุข้อบกพร่องและข้อบกพร่องทั่วไปในการเข้ารหัสและให้คำแนะนำในการแก้ไข ChatGPT ยังสามารถใช้ในการดีบักโปรแกรมได้อีกด้วย ตัวอย่างเช่น คุณสามารถถาม ChatGPT ว่า "คุณสร้างฟังก์ชันเพื่อคำนวณค่าเฉลี่ยของรายการตัวเลขและชี้ให้เห็นข้อผิดพลาดทางไวยากรณ์ในโค้ดต่อไปนี้ได้หรือไม่"
ข้อ จำกัด ของ ChatGPT
ChatGPT ไวต่อการเปลี่ยนแปลงวลีที่ป้อนหรือความพยายามหลายครั้งในคำถามเดียวกัน ตัวอย่างเช่น เมื่อถามคำถามหนึ่งคำถาม แบบจำลองสามารถอ้างว่าไม่รู้ แต่หากมีการใช้ถ้อยคำใหม่เล็กน้อย ก็สามารถตอบได้อย่างถูกต้อง
โมเดลมักมีรายละเอียดมากและใช้คำศัพท์เฉพาะมากเกินไป เช่น การย้ำว่าเป็นโมเดลภาษาที่ฝึกโดย OpenAI ปัญหาเหล่านี้เกิดขึ้นจากความลำเอียงในข้อมูลการฝึกอบรม (ผู้ฝึกอบรมชอบการตอบสนองที่ยาวกว่าและดูละเอียดกว่า) และความกังวลเกี่ยวกับการปรับให้เหมาะสมมากเกินไปซึ่งเป็นที่ทราบกันดี
บางครั้ง ChatGPT จะสร้างการตอบกลับที่ดูเหมือนจะถูกต้อง แต่จริงๆ แล้วเป็นเท็จหรือไร้สาระ การแก้ไขปัญหานี้เป็นเรื่องยากเนื่องจาก:
- ขณะนี้ไม่มีแหล่งที่มาของความจริงตลอดการฝึกอบรม RL
- แบบจำลองปฏิเสธคำถามที่สามารถตอบได้อย่างถูกต้องอันเป็นผลมาจากการฝึกอบรมข้อควรระวัง
- แบบจำลองถูกทำให้เข้าใจผิดโดยการฝึกอบรมภายใต้การดูแล เนื่องจากการตอบสนองที่ดีที่สุดขึ้นอยู่กับสิ่งที่แบบจำลองรู้มากกว่าสิ่งที่มนุษย์สาธิตรู้
สรุป
ในที่สุด ChatGPT ซึ่งเป็นแชทบอท AI ที่เปิดเผยโดยบริษัทวิจัยปัญญาประดิษฐ์ OpenAI ได้รับความนิยมเมื่อผู้คนเริ่มใช้มันเพื่อตอบงานที่โรงเรียนหรือตรวจหาข้อบกพร่องในโค้ด
แชทบอทได้รับการตั้งโปรแกรมให้มีส่วนร่วมในรูปแบบการสนทนาและตอบสนองในเชิงลึก โดยเฉพาะอย่างยิ่ง มันยังสามารถตอบคำถามติดตามผล สารภาพข้อผิดพลาด และปฏิเสธคำขอที่ไม่เหมาะสม
เขียนความเห็น