Desde que ChatGPT se puso a disposición del público para pruebas el pasado noviembre, OpenAI ha acaparado titulares en los principales sitios de tecnología y se ha convertido en la herramienta preferida de muchos desarrolladores. chatGPT se ha implementado no sólo para ofrecer sugerencias de código, resumir textos largos, responder preguntas, etc., sino, lo que es más importante, para marcar el comienzo de una nueva era de AIGC.
Sin embargo, debido al problema de que OpenAI ya no es abierto, la herramienta ha sido controvertida en el camino de ser muy aclamada. En este contexto, un grupo de profesionales del código abierto ha iniciado varios intentos de replicar un ChatGPT en la dimensión de modelo grande, y OpenAssistant es uno de los productos de código abierto que compiten.
El modelo de aprendizaje automático OpenAssistant está gestionado por una organización alemana sin ánimo de lucro, LAION. Recientemente, la organización anunció que el modelo OpenAssistant, los datos de entrenamiento y el código ya están disponibles, y calificó el modelo como "la réplica de código abierto más grande del mundo de ChatGPT".
El proyecto OpenAssistant comenzó en diciembre de 2022, poco después de que OpenAI lanzara ChatGPT.
"No nos detenemos en replicar ChatGPT; queremos construir el asistente del futuro que no solo pueda escribir correos electrónicos y cartas de presentación, sino también realizar trabajos significativos, utilizar API, buscar información de forma dinámica y mucho más, y que cualquiera pueda personalizar y ampliar. Queremos hacerlo de forma abierta y accesible, lo que significa no sólo construir un gran asistente, sino también hacerlo lo suficientemente pequeño y eficiente como para funcionar en hardware de consumo", escriben los responsables del proyecto OpenAssistant en su página de GitHub.
En pocas palabras, el objetivo de Open Assistant es crear un asistente de IA de código abierto con las mismas capacidades que ChatGPT. Con este proyecto, los responsables creen que pueden mejorar el propio lenguaje, de forma similar a como un flujo constante de personas crea nuevas obras de arte e imágenes.
Para demostrar la eficacia del conjunto de datos de OpenAssistant Conversation, el equipo de investigación ha creado la idea de que OpenAssistant es el primer modelo de sintonización de comandos a gran escala y de código abierto entrenado con datos humanos.
Paralelamente, el equipo utilizó los datos recopilados para centrarse en modelos lingüísticos de ajuste fino para el modelo LLaMA de Meta y el modelo Pyhtia de EleutherAI. De ellos, Pythia es un modelo de lenguaje de última generación con una generosa licencia de código abierto, mientras que LLaMA es un potente modelo de lenguaje con una licencia personalizada no comercial.
Sin embargo, el modelo también tiene algunas limitaciones. El artículo muestra que los datos de entrenamiento recogidos por el equipo de investigación procedían en su mayoría de anotadores varones con una media de edad de 26 años. Según el artículo, "este perfil demográfico puede introducir inadvertidamente un sesgo en el conjunto de datos, ya que reflejará necesariamente los valores, opiniones e intereses de los anotadores".
Sin embargo, el equipo también tomó medidas para detectar y eliminar la información perjudicial del conjunto de datos, pero el sistema no es infalible". Dadas las limitaciones expuestas, abogamos por utilizar nuestro LLM sólo en el contexto de la investigación académica", dice el artículo, "y animamos encarecidamente a los investigadores a investigar a fondo la seguridad y los sesgos de estos modelos antes de emplearlos en tareas posteriores. Es importante reconocer que los modelos publicados pueden mostrar un comportamiento inseguro y es probable que sean vulnerables a ataques de inyección."
En general, el uso del OpenAssistant de código abierto sirve como sustituto cuando no se puede utilizar la API o el Plus de OpenAI. En respuesta, también hay muchos usuarios que han dicho:
"Este es un acontecimiento emocionante. Voy a dejar de suscribirme a ChatGPT. Ojalá hubiera una forma fácil de copiar mis conversaciones de ChatGPT a Google Docs o directamente a OpenAssistant para poder probarlas y ver si funcionan también en OpenAssistant."