El hecho de que la forma en que un usuario interactúa con los modelos y sistemas de IA generativa es al menos tan esencial como las tecnologías subyacentes de entrenamiento e inferencia seguramente no es una sorpresa para quienes han estado trabajando extensamente en el tema.
OpenAI ya ha sido noticia con su DALL-E2 tecnología de generación de imágenes, y su serie GPT ha llamado la atención con cada iteración consecutiva y temor existencial ocasional por parte de los escritores.
Sin embargo, el debate ha cambiado un poco de "los estudiantes universitarios van a usar esto para producir trabajos finales viables" a "esto realmente puede ayudarme a depurar el código que quiero poner en producción" con la versión más reciente de ChatGPT, que parece ampliar su atractivo y audiencia.
En este artículo, analizaremos en profundidad GPT para ver cómo funciona y, lo que es más importante, cómo funciona y mucho más.
Entonces que es ChatGPT en OpenAI?
ChatGPT, lo más nuevo de OpenAI modelo de lenguaje, fue diseñado teniendo en cuenta las interacciones conversacionales. Es una herramienta sólida que se puede utilizar para aumentar su productividad en una variedad de disciplinas.
Es un transformador preentrenado generativo basado en chat. Es una especie de tecnología de inteligencia artificial (AI) que fue desarrollada por la firma de investigación y desarrollo de AI OpenAI y empleó un modelo NLP.
Analiza y comprende el lenguaje hablado o escrito utilizando algoritmos de aprendizaje automático, luego produce respuestas dependiendo de esa entrada.
Entrenamiento de ChatGPT
Este modelo fue entrenado por Open AI utilizando Aprendizaje reforzado from Human Feedback (RLHF), empleando los mismos procedimientos que InstructGPT, pero con modificaciones menores en la configuración de recopilación de datos.
Utilizaron un ajuste fino supervisado para entrenar un modelo inicial: los entrenadores humanos de IA dieron diálogos en los que jugaron en ambos lados: el usuario y un asistente de IA. Proporcionaron a los capacitadores ideas escritas en modelos para ayudarlos a redactar sus respuestas.
Se pidió a los investigadores que reunieran datos de comparación, que incluían dos o más respuestas modelo evaluadas por calidad, a fin de desarrollar un modelo de recompensa para el aprendizaje por refuerzo.
Utilizaron las interacciones del chatbot que los entrenadores de IA realizaron con él para obtener estos datos.
Los investigadores eligieron una declaración escrita en un modelo al azar, probaron algunas posibles conclusiones y pidieron a los entrenadores de IA que las clasificaran. Pueden usar la Optimización de política proximal para ajustar el modelo usando estos modelos de recompensa.
Luego, los investigadores repitieron el método varias veces.
El modelo utilizado para entrenar ChatGPT, que finalizó el entrenamiento a principios de 2022, es de la serie GPT-3.5. La serie 3.5 se cubre con mayor detalle. esta página. En una infraestructura de supercomputación impulsada por Azure AI, ChatGPT y GPT 3.5 fueron capacitados.
Cómo ChatGPT es mucho mejor que GPT-3?
ChatGPT se basa en GPT-3.5, un aprendizaje profundo basado modelo de lenguaje que genera texto similar al humano.
Sin embargo, ChatGPT es más interesante que el modelo GPT-3 anterior, que solo absorbía las señales de texto y buscaba continuar con su propio contenido creado. Produce resultados mucho más completos e incluso puede generar poesía.
La memoria es otra característica distintiva. El bot puede recordar comentarios anteriores en un chat y transmitirlos al usuario. Hasta el momento, OpenAI solo ha puesto a disposición el bot para revisión y prueba beta, pero el acceso a la API está planificado para el próximo año.
Los desarrolladores podrán integrar ChatGPT en su propio software con acceso API.
¿Cuál es el significado de esto?
Para captar realmente su potencial, necesitas experimentarlo, pero haré un esfuerzo para explicarlo usando una analogía. Puede que estés familiarizado con Jarvis si alguna vez has visto la película Iron Man.
Jarvis es el confiable ayudante de inteligencia artificial de Tony Stark. Puedes pensar en ChatGPT como una versión más joven de Jarvis. Con ChatGPT, puede adquirir información de manera más eficiente y modificarla, destilarla, modificarla y validarla de manera muy exacta.
¿Cómo se usa ChatGPT?
Usar ChatGPT es realmente simple, solo necesita registrarse y se dirigirá al ChatGPT.
Ahora solo tenemos que escribir el mensaje y automáticamente generará excelentes resultados utilizando inteligencia artificial.
Capacidades de ChatGPT
La amplia gama de propósitos a los que se puede extender ChatGPT es lo que lo hace tan poderoso. Las opciones son prácticamente ilimitadas, ya sea para resolver problemas aritméticos o contables, crear informes, guiones para presentaciones, piezas de blog, tutoriales, estrategias comerciales como la mencionada anteriormente, fragmentos de código, etc.
Aquí hay algunas categorías en las que se puede utilizar ChatGPT para aumentar su eficiencia y producción para ayudarlo a comenzar:
- Generación de documentos: ChatGPT se puede usar para producir documentos como informes, presentaciones y propuestas simplemente ingresando algunos datos críticos y dejando que ChatGPT haga el resto. "¿Puede preparar un informe sobre nuestras cifras de ventas trimestrales con tablas y gráficos?" podrías preguntarle a ChatGPT.
- Respuestas por correo electrónico: ChatGPT se puede utilizar para producir respuestas de correo electrónico personalizadas y atractivas, lo que ahorra tiempo y garantiza que las comunicaciones críticas se manejen de manera rápida y profesional. Por ejemplo, puede preguntarle a ChatGPT: "¿Cómo debo reaccionar a esta solicitud de correo electrónico de manera amable y profesional?"
- Análisis de Datos: ChatGPT puede analizar grandes volúmenes de datos y descubrir patrones e información críticos, ayudando a los equipos a tomar mejores decisiones basadas en datos. "¿Cuáles son las tendencias significativas en nuestras estadísticas de ventas durante el último año?" podrías preguntarle a ChatGPT.
- Ideas de negocio: ChatGPT también se puede utilizar para desarrollar nuevas ideas de empresa proporcionando información sobre la industria y el mercado y permitiendo que ChatGPT produzca conceptos e ideas potenciales. Esto puede ayudar a los empresarios y líderes empresariales a idear nuevos productos, servicios e iniciativas frescos y originales. "¿Puedes desarrollar ideas de negocios para una nueva solución de software en la industria de la salud?" puedes preguntar a ChatGPT.
- Codigo de GENERACION: ChatGPT permite la creación de código, la detección de errores y la reparación. Al solicitar algunos detalles sobre la funcionalidad requerida, puede generar un código utilizable que un desarrollador puede modificar y mejorar. Al identificar fallas y defectos comunes en la codificación y brindar orientación sobre cómo solucionarlos, ChatGPT también se puede usar para depurar programas. Por ejemplo, puede preguntarle a ChatGPT "¿Puede crear una función para calcular el promedio de una lista de números y señalar cualquier error de sintaxis en el siguiente código?"
Limitaciones de ChatGPT
ChatGPT es sensible a los cambios en las frases de entrada o varios intentos de la misma pregunta. Por ejemplo, dada una redacción de una pregunta, el modelo puede alegar ignorancia, pero con una pequeña reformulación, puede responder con precisión.
El modelo suele ser muy detallado y abusa de términos específicos, como repetir que es un modelo de lenguaje entrenado en OpenAI. Estos problemas surgen como resultado de sesgos en los datos de entrenamiento (los entrenadores prefieren respuestas más largas que parezcan más completas) y problemas de sobreoptimización bien conocidos.
A veces, ChatGPT genera respuestas que parecen correctas pero que en realidad son falsas o absurdas. Resolver este problema es difícil porque:
- Actualmente, no hay una fuente de verdad en todo el entrenamiento de RL.
- El modelo rechaza una consulta que puede responder con precisión como resultado del entrenamiento de precaución;
- El modelo es engañado por el entrenamiento supervisado ya que la mejor respuesta depende más de lo que sabe el modelo que de lo que sabe el demostrador humano.
Conclusión
Finalmente, ChatGPT, un chatbot de IA revelado por la firma de investigación de inteligencia artificial OpenAI, se hizo popular cuando las personas comenzaron a usarlo para responder tareas escolares o detectar fallas en el código.
El chatbot ha sido programado para participar en un estilo conversacional y responder en profundidad. En particular, también puede responder a preguntas de seguimiento, confesar errores y rechazar solicitudes inadecuadas.
Deje un comentario