Qué esperar de la próxima generación de chatbots: GPT-5 de OpenAI y Llama-3 de Meta
Recientemente, ha habido una avalancha de publicidad sobre las actualizaciones planificadas para el chatbot impulsado por IA ChatGPT de OpenAI y el sistema Llama de Meta, que impulsa los chatbots de la compañía en Facebook e Instagram.
03 mayo 2024.- La tecnología detrás de estos sistemas se conoce como modelo de lenguaje extenso (LLM) . Se trata de redes neuronales artificiales , un tipo de IA diseñada para imitar el cerebro humano. Pueden generar texto de uso general para chatbots y realizar tareas de procesamiento del lenguaje, como clasificar conceptos, analizar datos y traducir texto.
Adquieren estas habilidades a través de un proceso intensivo conocido como entrenamiento, donde el sistema de IA está expuesto a grandes cantidades de datos en un esfuerzo por mejorar lo que hace. Se espera que OpenAI y Meta lancen las versiones más nuevas de sus chatbots, llamadas GPT-5 y Llama 3 , respectivamente, antes de finales del verano de 2024. Pero, ¿en qué se diferenciarán de sus predecesores y qué valor agregarán?
Al igual que su predecesor GPT-4, GPT-5 será capaz de comprender imágenes y texto. Por ejemplo, los usuarios podrán pedirle que describa una imagen, haciéndola aún más accesible para las personas con discapacidad visual.
Sin embargo, GPT-5 tendrá capacidades superiores con diferentes idiomas, lo que permitirá que las personas que no hablan inglés se comuniquen e interactúen con el sistema. Esto incluye un mayor dominio de la traducción de idiomas. La actualización también tendrá una capacidad mejorada para interpretar el contexto del diálogo e interpretar los matices del lenguaje.
En comparación con su predecesor, GPT-5 tendrá capacidades de razonamiento más avanzadas , lo que significa que podrá analizar conjuntos de datos más complejos y realizar soluciones de problemas más sofisticadas. El razonamiento permitirá que el sistema de IA tome decisiones informadas aprendiendo de nuevas experiencias.
Por lo tanto, podrá proporcionar información más precisa a los usuarios. Por ejemplo, las capacidades analíticas mejoradas del sistema le permitirán sugerir posibles condiciones médicas a partir de los síntomas descritos por el usuario. GPT-5 puede procesar hasta 50.000 palabras a la vez, el doble que GPT-4, lo que lo hace aún mejor equipado para manejar documentos grandes.
Contará con un mayor nivel de inteligencia emocional, lo que permitirá interacciones más empáticas con los usuarios. Esto podría resultar útil en diversos entornos, incluido el servicio de atención al cliente. GPT-5 también mostrará una mejora significativa en la precisión de la forma en que busca y recupera información, lo que lo convierte en una fuente de aprendizaje más confiable.
Se dice que va mucho más allá de las funciones de un motor de búsqueda típico que encuentra y extrae información relevante de depósitos de información existentes, hacia la generación de contenido nuevo.
También se espera que GPT-5 muestre niveles más altos de equidad e inclusión en el contenido que genera debido a los esfuerzos adicionales realizados por OpenAI para reducir los sesgos en el modelo de lenguaje.
Podrá interactuar de forma más inteligente con otros dispositivos y máquinas, incluidos los sistemas inteligentes del hogar. El GPT-5 debería poder analizar e interpretar los datos generados por estas otras máquinas e incorporarlos en las respuestas de los usuarios. También podrá aprender de esto con el objetivo de brindar respuestas más personalizadas.
Aslysun/ShutterstockEsto podría permitir entornos más inteligentes en el hogar y en el lugar de trabajo. GPT-5 será más compatible con lo que se conoce como Internet de las cosas, donde los dispositivos en el hogar y en otros lugares están conectados y comparten información. También debería ayudar a respaldar el concepto conocido como industria 5.0 , donde humanos y máquinas operan de forma interactiva dentro del mismo lugar de trabajo.
GPT-5 contará con protocolos de seguridad más sólidos que hacen que esta versión sea más sólida contra el uso malicioso y el mal manejo. Podría usarse para mejorar la seguridad del correo electrónico al permitir a los usuarios reconocer posibles violaciones de seguridad de datos o intentos de phishing.
En general, la actualización de OpenAI debería ser más versátil, más eficiente energéticamente en sus cálculos y ofrecer un servicio más adaptable y personalizado.
Actualización de Llama de Meta
Llama-3 es el competidor de Meta de GPT-5. Presenta varias mejoras en comparación con su predecesor, Llama-2. Es un modelo más capaz que eventualmente vendrá con 400 mil millones de parámetros en comparación con un máximo de 70 mil millones de su predecesor Llama-2. En el aprendizaje automático, un parámetro es un término que representa una variable en el sistema de IA que se puede ajustar durante el proceso de entrenamiento para mejorar su capacidad de realizar predicciones precisas.
Llama-3 también será multimodal, lo que significa que será capaz de procesar y generar texto, imágenes y vídeo. Por lo tanto, será capaz de tomar una imagen como entrada para proporcionar una descripción detallada del contenido de la imagen. Del mismo modo, puede crear automáticamente una nueva imagen que coincida con el mensaje del usuario o la descripción de texto.
Podrá realizar tareas en idiomas distintos del inglés y tendrá una ventana de contexto más grande que Llama 2. Una ventana de contexto refleja el rango de texto que el LLM puede procesar en el momento en que se genera la información. Esto implica que el modelo podrá manejar grandes cantidades de texto o datos en un período de tiempo más corto cuando se le solicite hacer predicciones y generar respuestas.
Meta planea lanzar Llama-3 en varias versiones diferentes para poder trabajar con una variedad de otras aplicaciones, incluido Google Cloud. Meta anunció que pronto se lanzarán versiones más básicas de Llama-3, antes del lanzamiento de la versión más avanzada, que se espera para el próximo verano.
La transición a esta nueva generación de chatbots no sólo podría revolucionar la IA generativa, sino que también marcaría el inicio de una nueva era en la interacción hombre-máquina que podría transformar industrias y sociedades a escala global. Afectará la forma en que las personas trabajan, aprenden, reciben atención médica, se comunican con el mundo y entre sí. Hará que las empresas y organizaciones sean más eficientes y efectivas, más ágiles al cambio y, por tanto, más rentables.
Fuente: Abdul Sadka. Profesor y director del Aston Digital Futures Institute, Facultad de Ingeniería y Ciencias Físicas, Universidad de Aston
COMENTARIOS