¿Ya conocés la inteligencia artificial? En los últimos seis meses, los chatbots, como ChatGPT, y los generadores de imagen, como Midjourney,se convirtieron rápidamente en un fenómeno cultural.
Pero, la inteligencia artificial (IA) o los modelos de aprendizaje automatizado (machine-learning) existen ya desde hace un tiempo. En esta guía para principiantes iremos más allá de los chatbots para observar diferentes tipos de IA y ver cómo ya forma parte de nuestras vidas.
¿Cómo aprende la IA?
La clave de todo aprendizaje automatizado es un proceso llamado entrenamiento, en el que se alimenta a un software con una gran cantidad de datos -a veces con etiquetas que explican qué son esos datos- y una serie de instrucciones.
La orden puede ser algo así como: “buscá todas las imágenes que contengan caras” o “clasificá estos sonidos”. El programa buscará entonces patrones en los datos que se proporcionaron para cumplir con la tarea que se le pidió.
Es posible que necesite alguna ayuda en el camino -como “eso no es una cara” o “esos dos sonidos son diferentes”- pero lo que el programa aprende de los datos y las pistas que recibe se convierte en el modelo de IA, y el material de entrenamiento acaba definiendo sus habilidades.
Una forma de ver cómo este proceso de entrenamiento podría crear diferentes tipos de IA es pensar en diferentes animales. A lo largo de millones de años, el entorno natural hizo que los animales desarrollen habilidades específicas. De manera similar, los millones de ciclos que una IA completa durante su entrenamiento de datos determinarán la forma en que se desarrolla y conducirán a modelos de IA especializados.
Entonces, ¿qué ejemplos hay sobre cómo hemos entrenado a los distintos modelos de IA para desarrollar diferentes habilidades?
¿Qué son los chatbots?
Pensá en un chatbot como si fuera un loro. Es un imitador y puede repetir palabras que escuchó con cierta comprensión de su contexto pero sin un sentido completo de su significado.
Los chatbots hacen lo mismo -aunque a un nivel más sofisticado- y están a punto de cambiar nuestra relación con la palabra escrita.Pero, ¿cómo saben escribir estos chatbots? Son un tipo de IA conocido como Grandes modelos de lenguaje (LLM, por sus siglas en inglés) y son entrenados con grandes volúmenes de texto.
Un LLM es capaz de considerar no solo las palabras individuales, sino oraciones completas y comparar el uso de las palabras y las frases en un pasaje con otros ejemplos de sus datos de entrenamiento.
Con la utilización de miles de millones de comparaciones entre palabras y oraciones es capaz de leer una pregunta y generar una respuesta, como el texto predictivo en tu teléfono pero a una escala enorme. Lo increíble sobre los LLM es que pueden aprender las reglas de la gramática y averiguar el significado de palabras por sí mismos, sin asistencia humana.
¿Puedo hablar con una IA?
Si usaste Alexa, Siri o cualquier otro tipo de sistema de reconocimiento de voz, entonces utilizaste la IA. Imaginá un conejo con sus grandes orejas, adaptadas para captar pequeñas variaciones de sonido.
La IA registra los sonidos cuando hablás, elimina el ruido de fondo, separa tus palabras en unidades fonéticas -los sonidos individuales que forman una palabra hablada- y luego los compara con una biblioteca de sonidos del idioma. Tus palabras se convierten entonces en texto, en el que los errores de escucha pueden corregirse antes de que se dé una respuesta.
Este tipo de inteligencia artificial se conoce como procesamiento natural del lenguaje. Es la tecnología que se aplica cuando decís “sí” para confirmar una transacción bancaria, o cuando le pedís a tu celular que te diga qué tiempo va a hacer en los próximos días en la ciudad a la que vas a viajar.
¿Puede la IA comprender imágenes?
¿Alguna vez tu celular reuniste tus fotos y las colocaste en carpetas con nombres como “en la playa” o “de fiesta”? Entonces utilizaste IA sin darte cuenta. Un algoritmo de IA descubre patrones en tus fotos y las agrupa para vos.Estos programas fueron entrenados a base de revisar pilas de imágenes, todas etiquetadas con una simple descripción.
Si a una IA de reconocimiento de imágenes le proporcionás suficientes imágenes con la etiqueta “bicicleta”, con el tiempo comenzará a entender cómo es una bicicleta y en qué forma es distinta de un barco o un automóvil.
A veces, la IA está entrenada para descubrir pequeñas diferencias en imágenes similares. Así es como funciona el reconocimiento facial, encontrando una relación sutil entre las características de tu rostro que lo hacen distinto y único cuando se compara con cualquier otro rostro del planeta.
El mismo tipo de algoritmo fue entrenado con escaneos médicos para identificar tumores malignos y es capaz de revisar miles de escaneos en el tiempo que le llevaría a un médico tomar una decisión sobre uno solo.
¿Cómo crea la IA nuevas imágenes?
Recientemente, el reconocimiento de imágenes se ha adaptado a modelos de IA que han aprendido el poder camaleónico de manipular patrones y colores. Estas IA de generación de imagen pueden convertir los patrones visuales que recogen de millones de fotografías y dibujos en imágenes completamente nuevas.
Podés pedirle a la IA que cree una imagen fotográfica de algo que nunca ocurrió, por ejemplo, la foto de una personas caminando sobre la superficie de Marte. O podés dirigir de forma creativa el estilo de la imagen: “hacé un retrato del entrenador de la selección inglesa de fútbol, pintado al estilo de Picasso”.
Las últimas IA inician el proceso de generar esta nueva imagen con una colección de píxeles coloreados de forma aleatoria. Se fija en los puntos aleatorios en busca de algún indicio de un patrón que haya aprendido durante el entrenamiento, patrones que le sirven para crear diferentes objetos.
Estos patrones se mejoran lentamente agregando más capas de puntos, conservando los puntos que desarrollan el patrón y descartando otros, hasta que al final emerge una imagen semejante a la que se le pide. Si la IA desarrolla de manera simultánea patrones como “superficie de Marte”, “astronauta” y “caminar”, es capaz de producir una nueva imagen.
Como la nueva imagen se construye a partir de capas de píxeles al azar, el resultado es algo que nunca había existido, pero que se sigue basando en los miles de millones de patrones que la IA ha aprendido con las imágenes originales con las que se le entrenó.
Esto implica un desafío en asuntos relacionados con los derechos de autor y la ética de que una IA genere obras de arte a partir del duro trabajo de artistas, diseñadores y fotógrafos reales.
¿Y los vehículos autónomos?
Los vehículos autónomos formaron parte de la conversación sobre IA desde hace décadas, y la ciencia ficción consiguió fijarlos en la imaginación popular. La IA autónoma se conoce como conducción autónoma. Los vehículos con esta tecnología están equipados con cámaras, radar y láseres de medición de distancias. Piensa en una libélula, con visión de 360 grados y sensores en las alas que le ayudan a maniobrar y a hacer ajustes constantes durante el vuelo.
De forma similar, el modelo de IA utiliza los datos de sus sensores para identificar objetos y determinar si se mueven y, de ser así, qué tipo de objeto en movimiento es: otro vehículo, una bicicleta, un peatón…
Miles y miles de horas de entrenamiento para entender cómo se conduce han permitido a la IA ser capaz de tomar decisiones y actuar en el mundo real para conducir el vehículo y evitar choques.
Los algoritmos predictivos pueden haber tenido problemas durante muchos años para lidiar con la naturaleza a veces impredecible de los conductores humanos, pero los vehículos autónomos ahora han recopilado millones de kilómetros de datos en carreteras reales. En San Francisco ya hay usuarios que pagan por ser transportados en un vehículo autónomo. La conducción autónoma es también un claro ejemplo de cómo las nuevas tecnologías deben superar algo más que obstáculos técnicos.
La legislación de los gobiernos y las regulaciones de seguridad, junto con la profunda sensación de ansiedad sobre lo que ocurre cuando le entregas el control a las máquinas, son aún obstáculos potenciales para un futuro completamente automatizado en nuestras carreteras.
¿Qué sabe la IA sobre mí?
Algunas IA simplemente manejan números, recogiéndolos y combinándolos para crear un enjambre de información, cuyos productos pueden ser extremadamente valiosos. Es posible que ya existan varios perfiles de tus acciones financieras y sociales, particularmente en Internet, que podrían ser usados para hacer predicciones sobre tu comportamiento.
Tu tarjeta de fidelización del supermercado rastrea tus hábitos y gustos a través de tu compra semanal. Las agencias de crédito rastrean cuánto tenés en el banco y cuánto debés de tus tarjetas de crédito. Netflix y Amazon llevan un registro de cuántas horas de contenido viste anoche. Tus cuentas de redes sociales saben cuántos videos comentaste hoy. Y no sos vos solo, estos números existen para todo el mundo, lo que permite a los modelos de IA revisarlos y buscar tendencias sociales.
Estos modelos ya están dando forma a tu vida, desde ayudar a decidir si te van a dar un préstamo o una hipoteca a influir en tus decisiones de compra mostrándote determinados anuncios publicitarios.
¿La IA podrá hacer todo?
¿Sería posible combinar algunas de estas habilidades en un único modelo híbrido de IA? Eso es exactamente lo que hace uno de los avances más recientes en IA. Se llama IA multimodal, y permite que un modelo observe diferentes tipos de datos, como imágenes, texto, audio o video, y descubra nuevos patrones entre ellos.
Este enfoque multimodal fue una de las razones del gran salto en capacidad entre ChatGPT3.5, que solo fue entrenado con texto, y ChatGPT4, que fue entrenado también con imágenes. La idea de un modelo de IA único capaz de procesar cualquier tipo de información y, por lo tanto, llevar a cabo cualquier tarea, desde traducir idiomas a diseñar nuevos medicamentos, se conoce como inteligencia artificial general (IAG).
Para algunos, es el objetivo último de toda investigación en inteligencia artificial; para otros, es el camino para todas esas distopías de ciencia ficción en la que desatamos una inteligencia tan incomprensible que ya no somos capaces de controlarla.
¿Cómo se entrena a la IA?
Hasta hace poco, el proceso clave en el entrenamiento de la mayoría de las IA se conocía como “aprendizaje supervisado”. Los humanos ponían etiquetas a grandes paquetes de datos de entrenamiento y se le pedía a la IA que buscara patrones en los datos.
Se le pedía entonces a la IA que aplicara esos patrones a nuevos datos y que reportara sobre su precisión. Por ejemplo, imagina que le dás a la IA una docena de fotos, seis etiquetadas como “automóvil” y seis como “furgoneta”.
Después pedíle a la IA que encuentre un patrón visual que clasifique los automóviles y las furgonetas en dos grupos. ¿Qué crees que pasará cuando le pidas que clasifique esta foto? Lamentablemente, parece que la IA piensa que esto es una furgoneta, así que no es tan lista.
Ahora le enseñás esto:
Y te dice que esto es un automóvil. Está claro qué es lo que salió mal.
A partir del número limitado de imágenes con las que ha sido entrenada, la IA ha decidido que el color es la forma más sólida de separar automóviles y furgonetas. Pero, lo increíble del programa de IA es que llegó a esta conclusión solo, y podemos ayudarle a refinar su toma de decisiones.
Podemos decirle que identificó mal los dos nuevos objetos, esto le obligará a encontrar un nuevo patrón en las imágenes. Pero, lo que es más importante, podemos corregir el sesgo en nuestros datos de entrenamiento proporcionándole imágenes más variadas.
A través de la conjunción de estas dos simples acciones, y a una gran escala, es cómo la mayor parte de los sistemas de IA han sido entrenados para tomar decisiones increíblemente complejas.
¿Qué es el aprendizaje profundo?
La mayoría de los avances más recientes en IA han sido posibles gracias al aprendizaje profundo (deep learning). Explicado de forma sencilla, es cuando el uso de algoritmos complejos y grandes conjuntos de datos hacen que la IA pueda aprender sin ningún tipo de guía humana.
ChatGPT es el ejemplo más conocido. La cantidad de texto que hay en internet y en libros digitalizados es tan grande que, a lo largo de muchos meses, ChatGPT pudo aprender a combinar palabras de manera elocuente por sí mismo.
Imagina que tenés una gran pila de libros en un idioma extranjero, quizás algunos de ellos con imágenes. Con el tiempo podrías descubrir que la misma palabra aparecía en una página cuando había un dibujo o una foto de un árbol, y otra palabra cuando había una foto de una casa.
Y verías que a menudo había una palabra cerca de esas palabras que podría significar “un” o quizás “el “, y así sucesivamente. Este es el modelo de aprendizaje profundo, también conocido como aprendizaje sin supervisión. Se basa en enormes cantidades de poder computacional que permite a la IA memorizar enormes cantidades de palabras, solas, en grupos, en oraciones y en páginas, y luego leer y comparar cómo se utilizan una y otra vez en una fracción de segundo.
Los rápidos avances logrados por los modelos de aprendizaje profundo en el último año han impulsado la nueva ola de entusiasmo y preocupación sobre el potencial de la inteligencia artificial.
Las promesas y advertencias de la ciencia ficción parecen haberse acercado sin hacer ruido y nos encontramos con que ya estamos viviendo en un mundo donde la IA está empezando a revelar sus extrañas habilidades inhumanas.
Fuente: Paul Sargeant, La Nación