O feito de que a forma en que un usuario interactúa con modelos e sistemas de IA xerativa sexa polo menos tan esencial como as tecnoloxías de adestramento e inferencia subxacentes, seguramente non é unha sorpresa para aqueles que estiveron traballando sobre o tema extensamente.
OpenAI xa foi noticia co seu DALL-E2 tecnoloxía de xeración de imaxes, e a súa serie GPT obtivo atención con cada iteración consecutiva e un temor existencial ocasional por parte dos escritores.
O debate cambiou algo de "os estudantes universitarios van usar isto para producir traballos prácticos" a "isto realmente pode axudarme a depurar o código que quero poñer en produción" coa versión máis recente de ChatGPT, aínda que parece ampliar o seu atractivo e público.
Neste artigo, analizaremos en profundidade GPT para ver como funciona e, o máis importante, como funciona e moito máis.
Entón, o que é Chat GPT de OpenAI?
ChatGPT, o máis novo de OpenAI modelo lingüístico, foi deseñado pensando nas interaccións conversacionais. É unha ferramenta forte que se pode utilizar para aumentar a súa produtividade nunha variedade de disciplinas.
É un transformador xerativo preadestrado baseado en chat. É unha especie de tecnoloxía de intelixencia artificial (IA) que foi desenvolvida pola empresa de investigación e desenvolvemento de IA OpenAI e empregou un modelo de PNL.
Analiza e comprende a linguaxe oral ou escrita utilizando algoritmos de aprendizaxe automática, entón produce respostas dependendo desa entrada.
Formación de ChatGPT
Este modelo foi adestrado por Open AI utilizando Aprendizaxe de reforzo de Human Feedback (RLHF), empregando os mesmos procedementos que InstructGPT, pero con pequenas modificacións na configuración de recollida de datos.
Usaron axustes supervisados para adestrar un modelo inicial: os adestradores de IA humanas daban diálogos nos que xogaban a ambos os dous lados: o usuario e un asistente de IA. Proporcionaron aos formadores ideas escritas en modelos para axudarlles a redactar as súas respostas.
Os investigadores debían reunir datos de comparación, que incluían dúas ou máis respostas modelo avaliadas pola calidade, para desenvolver un modelo de recompensa para a aprendizaxe por reforzo.
Usaron as interaccións do chatbot que os adestradores de IA realizaron con el para obter estes datos.
Os investigadores escolleron ao azar unha declaración escrita nun modelo, probaron algunhas conclusións potenciais e pediron aos adestradores de IA que as clasificasen. Poden utilizar a Optimización de políticas próximas para axustar o modelo mediante estes modelos de recompensa.
O método foi entón repetido varias veces polos investigadores.
O modelo utilizado para adestrar ChatGPT, que rematou o adestramento a principios de 2022, é da serie GPT-3.5. A serie 3.5 está tratada con máis detalle aquí. Nunha infraestrutura de supercomputación impulsada por Azure AI, Adestrouse ChatGPT e GPT 3.5.
Como ChatGPT é moito mellor que GPT-3?
ChatGPT está construído en GPT-3.5, un sistema baseado na aprendizaxe profunda modelo lingüístico que xera texto de tipo humano.
Non obstante, ChatGPT é máis interesante que o modelo anterior GPT-3, que só absorbía as indicacións de texto e buscaba continuar co seu propio contido creado. Produce resultados moito máis completos e mesmo pode xerar poesía.
A memoria é outra característica distintiva. O bot pode recordar comentarios anteriores nun chat e transmitilos ao usuario. Así que aínda, OpenAI só puxo o bot dispoñible para revisión e proba beta, pero o acceso á API está previsto para o próximo ano.
Os desenvolvedores poderán integrar ChatGPT no seu propio software con acceso á API.
Que significado ten?
Para comprender realmente o seu potencial, necesitas experimentalo, pero farei un esforzo para explicalo usando unha analoxía. Quizais estea familiarizado con Jarvis se xa viches a película, Iron Man.
Jarvis é o axudante de IA de confianza de Tony Stark. Podes pensar en ChatGPT como unha versión máis nova de Jarvis. Con ChatGPT, pode adquirir información de forma máis eficiente e modificala, destilar, modificala e validala dun xeito moi exacto.
Como usas ChatGPT?
Usar ChatGPT é moi sinxelo, só tes que facelo Rexístrate e dirixirase ao ChatGPT.
Agora só temos que escribir o aviso e xerará automaticamente excelentes resultados usando intelixencia artificial.
Capacidades de ChatGPT
A ampla gama de propósitos aos que se pode estender ChatGPT é o que o fai tan poderoso. As opcións son practicamente ilimitadas, xa se trate de resolver problemas aritméticos ou de contabilidade, crear informes, guións para presentacións, pezas de blog, tutoriais, estratexias comerciais como a mencionada anteriormente, ou fragmentos de código, etc.
Aquí tes algunhas categorías nas que ChatGPT se pode utilizar para aumentar a túa eficiencia e produción para axudarche a comezar:
- Xeración de documentos: ChatGPT pódese usar para producir artigos como informes, presentacións e propostas introducindo só algúns datos críticos e deixando que ChatGPT faga o resto. "¿Podes preparar un informe sobre os nosos números de vendas trimestrais con gráficos e gráficos?" podes preguntar a ChatGPT.
- Respostas por correo electrónico: ChatGPT pódese usar para producir respostas de correo electrónico atractivas e personalizadas, aforrando tempo e garantindo que as comunicacións críticas se manexan de forma rápida e profesional. Por exemplo, podes preguntarlle a ChatGPT: "Como debo reaccionar ante esta solicitude de correo electrónico dun xeito amable e profesional?"
- Análise de Datos: ChatGPT pode analizar grandes volumes de datos e descubrir patróns e coñecementos críticos, axudando aos equipos a tomar mellores opcións baseadas en datos. "Cales son as tendencias significativas nas nosas estatísticas de vendas durante o último ano?" podes preguntar a ChatGPT.
- Ideas de negocio: ChatGPT tamén se pode usar para desenvolver novas ideas de empresa proporcionando información sobre a industria e o mercado e permitindo que ChatGPT produza conceptos e ideas potenciais. Isto pode axudar aos empresarios e líderes empresariais a crear produtos, servizos e iniciativas novos e orixinais. "Podes desenvolver ideas de negocio para unha nova solución de software no sector da saúde?" podes preguntar a ChatGPT.
- Xeración de código: ChatGPT permite a creación de código, a detección de erros e a reparación. Ao solicitar algúns detalles sobre a funcionalidade necesaria, pode xerar código utilizable que un desenvolvedor pode modificar e mellorar. Ao identificar fallos e defectos comúns na codificación e proporcionar orientación sobre como solucionalos, ChatGPT tamén se pode usar para depurar programas. Por exemplo, podes preguntarlle a ChatGPT "Podes crear unha función para calcular a media dunha lista de números e sinalar calquera erro de sintaxe no seguinte código?"
Limitacións de ChatGPT
ChatGPT é sensible aos cambios nas frases de entrada ou a varios intentos de facer a mesma pregunta. Por exemplo, tendo en conta unha redacción dunha pregunta, o modelo pode afirmar descoñecemento, pero cunha pequena reformulación, pode responder con precisión.
O modelo adoita ser moi detallado e usa en exceso termos específicos, como repetir que é un modelo de linguaxe adestrado en OpenAI. Estes problemas xorden como resultado de sesgos nos datos de adestramento (os adestradores prefiren respostas máis longas que parecen máis completas) e de preocupacións de sobreoptimización coñecidas.
Ás veces, ChatGPT xera respostas que parecen correctas pero que en realidade son falsas ou absurdas. Resolver este problema é difícil porque:
- Actualmente, non hai ningunha fonte de verdade en todo o adestramento de RL.
- O modelo rexeita unha consulta que pode responder con precisión como resultado do adestramento con precaución;
- O modelo é enganado pola formación supervisada xa que a mellor resposta depende máis do que o modelo sabe que do que o demostrador humano sabe.
Conclusión
Finalmente, ChatGPT, un chatbot de intelixencia artificial revelado pola empresa de investigación de intelixencia artificial OpenAI, fíxose popular cando os individuos comezaron a usalo para responder ao traballo escolar ou detectar fallos no código.
O chatbot foi programado para participar nun estilo de conversación e para responder en profundidade. En particular, tamén pode responder a preguntas de seguimento, confesar erros e rexeitar solicitudes inadecuadas.
Deixe unha resposta