Sora, l'última revolució de la intel·ligència artificial per a crear vídeos impressionants a partir de paraules

OpenAI presenta una nova ferramenta capaç de generar escenes realistes i d'alta qualitat de fins a 60 segons seguint les instruccions textuals dels usuaris

Fotograma d'un dels vídeos generats amb intel·ligència artificial, a partir de les instruccions: "La ciutat de Nova York submergida com l'Atlàntida amb peixos, balenes, tortugues marines i taurons nadant" / OpenAI

Primer van ser DALL·E i ChatGPT. La carrera per liderar la intel·ligència artificial no es deté i l'empresa OpenAI, un dels gegants en el sector, ha fet aquest dijous un pas més cap al futur. Si ja havia aconseguit desenvolupar ferramentes capaces de generar imatges estàtiques i textos amb aquesta tecnologia, ara la firma dirigida per Sam Altman ha fet un salt meteòric al vídeo de la mà d'un nou programari que promet ser un revulsiu: Sora.

El model està en versió experimental, però ja ha donat resultats molt sorprenents que són només un tast del que pot arribar a fer. El funcionament és senzill, permet crear vídeos de fins a un minut a partir d'instruccions de text. L'únic que cal fer és descriure a Sora el que es vol veure en pantalla i la resta ja és feina de la intel·ligència artificial, que s'encarregarà de fer realitat les escenes seguint les peticions.

Ha sigut el mateix Sam Altman, conseller delegat d'OpenAI, qui ha fet l'anunci del llançament en la xarxa social X, que ràpidament s'ha inundat amb les primeres creacions que ha difós la companyia. Segons assegura, Sora pot generar escenes "complexes" i "realistes", amb múltiples personatges i mantenint la qualitat dels fotogrames. Igualment, indica que el model és capaç d'"entendre com existeixen els objectes en el món físic" i també d'"interpretar encertadament les instruccions i de generar personatges convincents que expressen emocions vibrants".

Realisme o fantasia, dues dimensions o tres, moviments fluids i específics… Sora obri la porta a crear molts nous mons i, fins i tot en aquelles escenes que no existeixen en la realitat, el model aplica les regles de la física correctes. Alguns dels vídeos que s'han viralitzat ja en les xarxes socials són, per exemple, una panoràmica de la ciutat de Tòquio captada per una càmera que es mou amb la parella protagonista pels carrers nevats i entre el rosa vibrant dels cirerers, tres cadells jugant en la neu, una recreació sorprenent del fons marí amb corals i peixos fets de paper o una escena de la ciutat de Nova York submergida com si fora l'Atlàntida.

Sora agafa el nom del terme en japonés per a "cel". OpenAI encara no l'ha posada a la disposició del públic perquè continua analitzant-la per a comprendre millor els perills del sistema, segons ha apuntat el diari The New York Times. Sí que ha compartit la tecnologia amb un xicotet grup d'acadèmics i altres investigadors externs, als qui ha encomanat la tasca de detectar de quines maneres podria usar-se amb finalitats malicioses.

D'aquesta manera, OpenAI, que va revolucionar l'emergent sector dels serveis d'intel·ligència artificial regenerativa, disposarà d'un conjunt de serveis que van des de la creació de text a la imatge estàtica i el vídeo.

Ciència