OpenAI lanzó recientemente su nueva inteligencia artificial. Llamada Sora, la herramienta es capaz de generar videos que, a simple vista, puede resultar difícil para algunos distinguirlos de la realidad.
Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.… pic.twitter.com/cjIdgYFaWq
— OpenAI (@OpenAI) February 15, 2024
De este modo, desde la firma consignaron que a la IA se le está enseñando a comprender y simular el mundo físico en movimiento. Ello, con el objetivo de entrenar modelos que ayuden a las personas a resolver problemas que requieran interacciones en el mundo real".
Por tal razón, Sora se encuentra con acceso limitado para un círculo cerrado de personas, entre los que se incluyen cineastas, diseñadores y artistas visuales. Ello, para que puedan dejar los comentarios necesarios que permitan mejorar esta IA.
Pero como toda tecnología, todavía propende a fallar. Especialmente porque se trata de una herramienta que, a pesar de lo revolucionaria que se ve, recién está naciendo. Y así lo reconoce OpenAI.
Sora: Lo que NO puede hacer todavía la inteligencia artificial de OpenAI
A pesar de los avances que Sora representa para la IA generativa, desde la firma explican que el modelo actual tiene sus debilidades. "Puede complicarse al simular con precisión la física de una escena compleja". Además, la IA "podría no comprender instancias específicas de causa y efecto". Por ejemplo, que al morder una galleta, el mordisco no aparezca en ella.
O, como en el clip al inicio de la nota, que al soplar velas el fuego no se altere con el viento. En el siguiente video, que exhibe una instancia de error más evidente, unas personas desentierran una silla, la cual a ratos parece cualquier cosa menos silla cuando se le "intenta" transportar.
⚡️ Se acaba de anunciar Sora, un modelo IA de @OpenAI que genera vídeo-a-partir-de-texto. Parece un NUEVO SALTO que eclipsa lo que había.
De los ejemplos lo que más impresiona es verlo “fallar”, como aquí, porque se ve real y al mismo tiempo artificial, generado: pic.twitter.com/ho9jAPfCDo
— Kiko Llaneras (@kikollan) February 15, 2024
Además, detallan también que Sora "puede confundir detalles espaciales de una instrucción. Por ejemplo, malinterpretar izquierda y derecha". También se le puede hacer difícil generar contenido que cuente con descripciones precisas de eventos que suceden en el tiempo, como seguir una trayectoria de cámara específica.