ChatGPT: ¿qué es?

El final de 2022, o más bien el final de noviembre, estuvo marcado por un acontecimiento destacado: la empresa OpenAI (uno de sus fundadores, por cierto, es Elon Musk) presentó el innovador chatbot ChatGPT. Es accesible para cualquier persona y puede utilizarse para una gran cantidad de tareas diferentes.

En este artículo hablaremos sobre qué es la red neuronal ChatGPT, cuáles son sus características, dónde puede usarla, le daremos ejemplos y le diremos cómo iniciar ChatGPT y cómo usar ChatGPT.

¿Qué es ChatGPT?

ChatGPT es un chatbot de inteligencia artificial . Fue desarrollado por OpenAI. El chatbot puede funcionar en modo diálogo y admite solicitudes en lenguajes naturales: ChatGPT está disponible en inglés, alemán, francés, etc. Se lanzó el 20 de noviembre de 2022 y literalmente causó sensación de inmediato gracias a sus capacidades, como crear textos, escribir código, traducir y otras, de las que hablaremos con más detalle un poco más adelante.

ChatGPT se creó utilizando la supercomputadora Azure AI de OpenAI, basada en el modelo de lenguaje GPT-3.5. El chatbot se entrenó utilizando matrices de texto de Internet, así como el sistema de aprendizaje por refuerzo de la retroalimentación humana con refuerzo basado en la retroalimentación humana.

Después de esto, el sistema fue reentrenado varias veces y en el proceso se utilizaron sus propias respuestas, lo que ayudó a especificarlas y aclararlas. Según los desarrolladores, el objetivo era hacer que la inteligencia artificial fuera más correcta, «humana» y más fácil de usar.

Además de lo ya enumerado, el sistema puede analizar finanzas, artículos técnicos y conceptos científicos, y responder cualquier duda. También «recuerda» los matices del diálogo y no se comunica con el usuario sobre temas controvertidos.

Revisión de ChatGPT

Aquí sugerimos profundizar un poco en los detalles.

Entonces, la base del modelo OpenAI ChatGPT es la arquitectura GPT-3.5 con parámetros 175B. Hay tres modelos de la familia GPT-3.5 :

  • Código-davinci-002. Este modelo es la base para las tareas de finalización de código.
  • Texto-davinci-002 . Este modelo se entrena utilizando el modelo de ajuste fino InstructGPT utilizando un conjunto especial con muchas instrucciones complejas. Y el modelo fue validado por expertos para que el indicador integral de la calidad del examen fuera máximo. Este proceso se llama aprendizaje por refuerzo a partir de la retroalimentación humana o RLHF para abreviar.
  • Texto-davinci-003. Este modelo es una continuación mejorada del modelo anterior y para crearlo se utilizó un conjunto más complejo de instrucciones y comandos. Este modelo es el más fuerte y fue este modelo el que sirvió de base para ChatGPT.

Pero deberíamos hablar un poco más sobre RLHF.

La base del aprendizaje por refuerzo a partir de la retroalimentación humana es un modelo de lenguaje previamente entrenado . Si hablamos de ChatGPT AI, entonces InstructGPT es uno, pero también hay otros como Gopher de DeepMind.

La principal característica distintiva es la integración del modelo de recompensa (modelo de preferencia), que se calibra de acuerdo con la evaluación de expertos. La tarea principal aquí es obtener un sistema (modelo) que acepte una secuencia de propuestas y devuelva un indicador de recompensa escalar que refleje numéricamente la evaluación de los expertos.

El sistema es capaz de realizar las funciones de un modelo de lenguaje de un extremo a otro o un módulo separado que produce un valor de recompensa como respuesta. Y este valor juega un papel fundamental para implementar sin problemas los algoritmos RL existentes en RLHF.

Hay varias formas de clasificar los datos de texto. Pero la más exitosa es que los expertos comparan el texto generado usando dos modelos de lenguaje con la condición de un mensaje de texto. Al comparar los resultados generados por los módulos por pares, utilizan el sistema Elo, que les permite clasificar modelos y resultados entre sí. Posteriormente, los métodos de clasificación se reducen a un valor escalar de la recompensa del entrenamiento.

Y en este proceso hay un artefacto interesante, que consiste en el hecho de que los sistemas RLHF que funcionan adecuadamente hoy en día han aplicado modelos de lenguaje para evaluar Reward, cuyo número de parámetros difiere de los modelos de generación de texto. Por ejemplo, el modelo de lenguaje OpenAI contiene 175B, Reward – 6B, DeepMind – 70B, aunque los modelos de puntuación de Reward deben tener la misma capacidad para comprender el texto de entrada que el modelo necesario para la síntesis de texto.

En la etapa actual, el sistema RLHF tiene un modelo de lenguaje inicial que se utiliza para generar texto y un modelo de recompensa que acepta cualquier texto y le asigna una puntuación. Teniendo en cuenta que trabajar con expertos cuesta mucho dinero, los autores del proyecto generaron sintéticamente 100 mil pares de segmentos y luego, basándose en ellos, así como en las evaluaciones de expertos, lograron entrenar un modelo estimador. (RM).

Inicialmente, los desarrolladores querían utilizar un modelo estimador de parámetros de 3M, pero los resultados de salida fueron casi aleatorios. En el siguiente paso, se utilizaron enfoques de RL para optimizar el modelo de lenguaje original con respecto al modelo de recompensa. Este circuito RLHF se ve así:

Y así es como se ve el algoritmo de entrenamiento del modelo:

En cuanto al proceso de OpenAI ChatGPT que utiliza recompensas, se puede representar esquemáticamente de la siguiente manera:

Actualmente, no hay materiales de investigación completos sobre la arquitectura ChatGPT, excepto un artículo en la página principal del sitio web oficial . Por esta razón, ahora es imposible evaluar la calidad del modelo, sin embargo, a pesar de que ChatGPT se lanzó el 30 de noviembre de 2022, al 5 de diciembre de 2022, más de 1 millón de personas lo habían utilizado.

Aplicación de Chat GPT: características, pros y contras

Como decíamos al principio, el potencial de ChatGPT es impresionante. Sus posibilidades, aunque no ilimitadas, son bastante amplias. Estas son sólo algunas opciones para su uso.

Escribir código

ChatGPT lo ayudará a realizar una operación o proceso, encontrar errores y fallos y traducir código de un lenguaje de programación a otro.

Respuestas a preguntas difíciles

Cuando le haces preguntas a un chatbot, puedes estar seguro de que lo más probable es que te dé la respuesta correcta (por cierto, los usuarios notan que las respuestas de ChatGPT son de mayor calidad que las de Google). Pero no olvides que es mejor comprobar la información .

Creando guiones

Con un chatbot tienes la oportunidad de generar, por ejemplo, nuevos episodios de antiguas series de televisión o asignar tareas específicas a algunos héroes de universos cinematográficos. Además, la red neuronal ChatGPT puede generar un nuevo juego basado en la película.

Componer canciones y notas.

Si tiene dificultades para escribir letras o arreglos de canciones, también puede pedir ayuda a ChatGPT AI y le dará el resultado. Además, el resultado será bastante adecuado y relativamente competitivo.

Recomendaciones médicas

Si sufres dolor de cabeza o, por ejemplo, alergia, pregunta al chatbot qué debes hacer. En respuesta, recibirá buenos consejos sobre la mejor manera de proceder. Naturalmente, el bot ChatGPT no debe tomarse como un médico, pero escuchar puede resultar útil.

Planificación y cálculos.

El chatbot te ayuda a calcular calorías o crear un plan de pérdida de peso individual. Por supuesto, no es inmune a los errores, pero en cualquier caso es mucho más fácil hacer algunos ajustes que elaborar un plan desde cero.

Ensayo escrito

Los usuarios informan que OpenAI ChatGPT es bastante capaz de escribir un ensayo sobre la diferencia en los enfoques del nacionalismo o un ensayo sobre la expansión estadounidense hacia Occidente en el siglo XIX. De hecho, el tema puede ser absolutamente cualquier cosa.

Generando consultas

El sistema ChatGPT es capaz de generar solicitudes para otras redes neuronales. Por ejemplo, un chatbot puede crear una lista de consejos precisos para redes neuronales que generan imágenes.

Entre otras cosas, ChatGPT AI es capaz de colorear el texto según un estilo determinado, por ejemplo, generar texto en transliteración, generar en un dominio específico, por ejemplo, en forma de notaciones musicales.

El chatbot comprende con bastante precisión las solicitudes del usuario, lo que determina el estilo y la naturaleza de las respuestas. Y con la ayuda de instrucciones introductorias específicas, puede «forzar» al sistema a eludir la censura de respuestas .

Si utiliza la red neuronal ChatGPT para crear textos, el resultado es un contenido único y de bastante alta calidad que le permite evitar los sistemas antiplagio.

Sin embargo, el bot ChatGPT no es una panacea. Teniendo en cuenta que el sistema no fue entrenado mediante diálogos largos (como se hizo, por ejemplo, con LaMDA), es bastante difícil que mantenga una conversación coherente durante mucho tiempo. La arquitectura se centra en respuestas detalladas y detalladas a preguntas secuenciales en un número reducido.

También es importante que el sistema haya sido prohibido por la plataforma más grande para desarrolladores StackOverflow. La razón de esto fueron muchos errores al responder las preguntas de los usuarios. Y debido al hecho de que no existe verificación con fuentes autorizadas y una base de conocimiento confirmada, ChatGPT puede responder preguntas sin sentido como «¿Qué es más pesado: un kilogramo de pelusa o un kilogramo de plomo?» con toda seriedad y gran perseverancia, mientras hace errores y conclusiones de razonamiento incorrecto.

En resumen, se pueden identificar las siguientes desventajas del sistema :

  • Puede generar tonterías.
  • Las respuestas siempre dependen en gran medida de la redacción de las preguntas.
  • En lugar de frases cortas, a menudo utiliza palabras largas innecesariamente.
  • Tiene una base de datos limitada.
  • No tiene protección contra la omisión por parte del usuario de filtros específicos.

Y, sin embargo, ChatGPT tiene incomparablemente más ventajas, entre otras cosas porque está en constante evolución, a saber:

  • Gracias a los principios del aprendizaje por refuerzo, se mejora la calidad del modelo y se mejora el propio bot. Algunos casos negativos que ocurrieron cuando se lanzó el programa ya no son relevantes.
  • A través del aprendizaje por refuerzo constante y regular en muestras pequeñas, la eficiencia computacional del proceso de reentrenamiento del sistema es cada vez mayor.

En el futuro, OpenAI ChatGPT mejorará enormemente la calidad de la búsqueda web, porque Está previsto integrar en el sistema un motor de búsqueda con síntesis de respuestas mediante un modelo verificado.

Además, en el futuro, el chatbot podrá funcionar en muchas modalidades, no solo en texto. Por ejemplo, podrá generar imágenes, transcribir grabaciones de audio, capturar en vídeo los fragmentos necesarios, reconocer documentos escaneados y otras imágenes.

¿Cómo utilizar ChatGPT?

Seguramente tiene alguna pregunta sobre cómo intentar trabajar tú mismo con un chatbot, cómo usar ChatGPT. Es fácil de hacer:

  • Vaya al sitio web de OpenAI y complete el proceso de registro a través de Gmail. También deberá pasar por la verificación utilizando su número de teléfono. Si se registró anteriormente en el sitio, no necesitará ingresar su número nuevamente.
  • Una vez que inicie sesión, accederá automáticamente a la hora de IA.
  • Ingrese la solicitud deseada en el campo correspondiente. El chatbot le responderá en el idioma en el que escribió su solicitud. Sin embargo, el sistema funciona mejor con el inglés porque es su idioma “nativo”.
  • Simplemente continúa el diálogo con el chat. Puede desarrollar una conversación sobre un tema o hacer preguntas completamente ajenas.

Cuando trabaje con ChatGPT, recuerde siempre que:

  • El sistema puede escribir respuestas plausibles pero sin sentido o incorrectas.
  • El sistema responderá a intentos repetidos de ingresar lo mismo.
  • El sistema es sensible a la redacción y la misma pregunta formulada de diferentes maneras puede dar respuestas diferentes o ninguna respuesta.
  • El sistema no hace preguntas aclaratorias y, por regla general, adivina lo que quiere decir el usuario.
  • El sistema puede ignorar solicitudes inapropiadas e incluso mostrar parcialidad .

Además, la red neuronal ChatGPT tiene algunas otras limitaciones en el conocimiento del mundo después de 2021 y, por lo tanto, intentará evitar responder preguntas sobre ciertos eventos y personas.

Sistemas similares

ChatGPT AI no es el único sistema con una arquitectura similar. Además de él, existen muchos otros sistemas :

  • LaMDA
  • GPT-3
  • Copiloto
  • Chatsónico
  • Jaspe
  • licuadora

Críticas a ChatGPT

La controversia en torno a ChatGPT no ha disminuido desde sus inicios y el chatbot tiene muchos oponentes. En su opinión, el sistema es capaz de generar una gran cantidad de precedentes legales en materia de infracción de derechos de autor, porque el chatbot no genera su propio contenido protegido por derechos de autor. Además, el sistema, aunque genera artículos falsos completamente realistas, puede hacer referencia tanto a personas reales como a pseudoevidencias inexistentes.

Al mismo tiempo, el modelo ChatGPT y otros similares, como ya hemos mencionado, pueden presentar sesgos en una variedad de temas. Al entrenarlos se utilizó contenido sin filtrar, lo que significa que los resultados generados por la red neuronal pueden ofender y herir los sentimientos de los creyentes, incluir elementos de discriminación por cualquier motivo, y esto está plagado de un aumento incontrolable de problemas sociales.

Los expertos en educación creen que ChatGPT puede impactar dramáticamente muchos procesos. Por ejemplo, en el futuro, las instituciones educativas y los profesores inevitablemente tendrán que cambiar su enfoque de la enseñanza , porque tendrán que idear algo que reemplace los ensayos habituales que escriben los mismos escolares. Después de todo, con la ayuda de un chatbot, cualquier estudiante puede recibir un ensayo único en un par de minutos y obtener una A.

Y se pone en duda la propia adquisición de conocimientos. Por eso, los expertos ya están pensando en cómo solucionar el problema emergente. Existe una propuesta para un futuro próximo de abandonar por completo los deberes y realizar resúmenes, composiciones y otros trabajos similares bajo la estrecha supervisión de los profesores. Algunos incluso sugieren exigir a los estudiantes que hagan presentaciones de su trabajo.

Los profesionales del campo de las tecnologías de la información confían en que la red neuronal ChatGPT desplazará seriamente en el mercado a los motores de búsqueda tradicionales como Google. Y el desarrollador principal de Gmail, Paul Buckheim, cree que en unos años el algoritmo del chatbot y sus modificaciones cambiarán por completo el proceso de búsqueda de información en Internet.

Es muy posible que los usuarios ya no tengan que realizar consultas y buscar los datos necesarios en diferentes sitios, porque el sistema proporcionará una respuesta al instante, sin recurrir a recursos de terceros. Por supuesto, los motores de búsqueda no desaparecerán por completo en el olvido, pero la red neuronal se convertirá en embajadora y los sitios en sí dejarán de ser de poco interés para la gente.

Y además de todo esto, existe el riesgo de que los atacantes puedan utilizar la inteligencia artificial para generar verdaderas noticias falsas, influyendo en la conciencia de las masas, y las noticias en sí serán muy difíciles de distinguir de las reales . Además, los delincuentes pueden utilizar la IA, y las personas expertas en delitos seguramente encontrarán cómo utilizar tanto la red neuronal como el propio OpenAI ChatGPT para sus propios fines.

Conclusión

Sea como fuere, la creación de ChatGPT y la posibilidad de que un número ilimitado de personas accedan al sistema es un verdadero avance y un paso serio en el desarrollo y difusión de la IA. Si le preguntas al propio chatbot dónde puede resultar útil, te responderá que se considera una herramienta valiosa en la investigación educativa.

Muchos especialistas en TI hablan de las grandes perspectivas de OpenAI ChatGPT en el campo del desarrollo de contenidos y soporte técnico, señalando que el sistema puede influir radicalmente en las reglas del juego en esta dirección y mejorar en gran medida la experiencia del cliente al utilizar servicios y productos.

Y generar textos y ayudar en el desarrollo está lejos de ser el límite para un chatbot. Muchos confían en que pueda tener un impacto en aquellas áreas en las que los cambios ocurren muy raramente. Esta es, por ejemplo, la industria de servicios personales, desde el diseño de interiores hasta la selección de tours turísticos, la consultoría, donde la red neuronal será un importante asesor, y el diseño gráfico.

Pero siempre ha habido, hay y habrá zonas en las que la presencia de una persona viva es insustituible. Y ningún desarrollo, al menos en el futuro previsible, podrá desplazar a las personas y, por lo tanto, lo más importante es que el bot ChatGPT, las redes neuronales y la inteligencia artificial en general sean utilizados sabiamente por la humanidad y solo para el bien. Aunque, por supuesto, el enfrentamiento entre el bien y el mal nos acompaña a lo largo de nuestra historia.

Probablemente, sólo el tiempo pueda responder a la pregunta de para qué servirán en última instancia maravillas como ChatGPT.