El director de innovación de Microsoft, David Hurtado, en el I Foro para el Desarrollo Angeco, compartió su visión sobre la IA generativa y GPT que tan en boga está actualmente, con múltiples ejemplos y aplicaciones prácticas y la evolución que se espera para los próximos meses.
La primera cuestión sobre la que quiso insistir para abrir su ponencia fue que hay que perder el miedo y dejar de pensar que la IA pueda sustituir a las personas y quitar el trabajo. Todo lo contrario. La Inteligencia Artificial generativa y GPT es una herramienta que lo que va a hacer es ayudarnos para hacer mejor ese trabajo.
Una característica importante de la Inteligencia Artificial generativa es que es muy transversal, afecta a todo el mundo y a todos los ámbitos y nos puede ayudar mucho sea cual sea el trabajo que desarrollemos, pero sobre todo si lo que queremos es procesar información.
La principal diferencia es que los modelos tradicionales predictivos de IA hacen muy bien una determinada cosa, mientras que la IA generativa es un único modelo capaz de hacer muchísimas cosas, por ejemplo, resumir, explicar, análisis de sentimiento, adaptar estilos y mucho más porque es capaz de responder en función de lo que cada persona le vaya preguntando.
A día de hoy, lo que hace esta tecnología es que le damos como entrada un texto o una pregunta y nos da como resultado otro texto o una imagen. Se le puede dar un texto y el sistema crea una imagen completamente de cero que refleja ese texto. Lo realmente impresionante es que, además, es capaz de entender semánticamente conceptos relativamente abstractos (como bueno, malo, etc.) y representarlos. Se trata, por tanto, de un gran modelo de lenguaje que es capaz de entender.
La siguiente revolución que ya está llegando y que tendremos operativa aproximadamente a lo largo del próximo año, es que al modelo se le van a poder dar otros formatos de entrada como imágenes, vídeos, audios, etc., y el sistema nos podrá dar otros formatos de salida. Es decir, el modelo podrá tener un entendimiento semántico de una imagen o un vídeo y ser capaz de hacer una hipótesis al respecto.
Para ilustrar mejor lo que esto quiere decir, se mostró el ejemplo de introducir al sistema una imagen de unos globos atados a un yunque que los mantiene unidos al suelo y se le pregunta qué ocurriría si se corta la cuerda y el sistema inmediatamente responde que los globos probablemente saldrían volando.
Una de las características más interesantes que se van viendo de esta tecnología, es que funciona mejor en modo conversacional, es decir, no consiste en hacerle la pregunta perfecta sino en ir preguntándole cosas a medida que te va dando las respuestas como si fuera una conversación normal entre humanos. GPT es un modelo de lenguaje que sabe dar explicaciones hasta satisfacer totalmente las preguntas que se le hagan.
Además de dar explicaciones, hace otra cosa interesante que es adaptar el estilo de la respuesta a lo que se le pida, lo que amplía mucho las posibilidades de uso para cualquier tipo de receptor. Tiene un maravilloso manejo del lenguaje y lo hace de manera instantánea.
El punto fundamental es el de conectar esta herramienta a datos. Es una estupenda herramienta de lenguaje, pero sin datos es sólo un juguete. Conectada a datos es una herramienta potentísima y facilitadora del trabajo.
Finalmente, se presentó el concepto que Microsoft está desarrollando ahora y que denomina Copiloto. El proyecto se basa en un doble concepto, por un lado, poder conectar GPT a fuentes de datos y, por otro, la multimodalidad, es decir, poder introducir no sólo texto sino cualquier cosa y extraer el resultado en cualquier formato.
Este concepto Copiloto parte de conectarle las herramientas ofimáticas más comunes como Word, Excel, Power Point, etc., a datos como correos, agendas, calendarios, bbdd de la empresa, etc. Cada vez que se le hace una pregunta al Copiloto desde una de esas aplicaciones ofimáticas, busca en las bases de conocimiento que le hemos conectado y, mediante el modelo de lenguaje GPT, nos devuelve el resultado en el formato en el que le hayamos preguntado, un documento de Word, una hoja Excel o una presentación de Power Point. Sobre ese resultado podemos seguir pidiéndole que vaya haciendo las modificaciones que consideremos oportunas y el sistema nos irá presentando resultados.
El ponente ilustró el proyecto con varios ejemplos prácticos como crear una oferta en un documento de Word o en una presentación de Power Point en base a unas notas de una reunión y un catálogo de productos. El sistema lee ambas cosas y, en base a eso, hace una propuesta de documento a la que le podemos ir pidiendo que añada un sumario, gráficos, etc., o corrija otras.
El Copiloto acompaña y ayuda en las tareas previas de procesar la información porque lo hace instantáneamente y en las tareas posteriores de ejecutar porque maneja las aplicaciones por nosotros.
Al final de la ponencia, David mostró numerosos ejemplos de aplicaciones prácticas concretas aplicadas a tareas específicas como, por ejemplo, a la atención al cliente con resultados realmente espectaculares a la hora de automatizar tareas en base a datos.
En definitiva, una ponencia muy ilustrativa y práctica del uso y posibilidades no sólo de la tecnología disponible actualmente, sino también de la que vendrá en los próximos meses.