O noua inovatie uimitoare de la OpenAI. Videoclipuri create instant pe baza unui simplu text
Liderul in domeniul inteligentei artificiale, OpenAI, a prezentat un nou model de inteligenta artificiala, numit Sora, care poate crea videoclipuri „realiste” si „pline de imaginatie” de 60 de secunde pornind de la mesaje text rapide.
Intr-o postare pe blog miercuri, compania a declarat ca Sora este capabil sa genereze videoclipuri de pana la 60 de secunde doar pe baza unor instructiuni text, avand capacitatea de a genera scene cu mai multe personaje, tipuri specifice de miscare si detalii de fundal.
„Modelul intelege nu numai ceea ce a cerut utilizatorul in instructiuni, ci si modul in care acele lucruri exista in lumea fizica”, se arata in postarea de pe blog.
OpenAI a precizat ca intentioneaza sa antreneze modelele de inteligenta artificiala astfel incat sa poata „ajuta oamenii sa rezolve probleme care necesita interactiune in lumea reala”.
Desi modelele text-video exista deja, ceea ce face diferenta acum este lungimea si acuratetea pe care OpenAI spune ca le are Sora, potrivit lui Reece Hayden, analist senior la firma de cercetare de piata ABI Research, citat de CNN.
Hayden a declarat ca aceste tipuri de modele de inteligenta artificiala ar putea avea un mare impact pe pietele de divertisment digital, cu un nou continut personalizat difuzat pe canale.
„Un caz de utilizare evident este in cadrul televiziunii; crearea de scene scurte pentru a sustine naratiunile”, a spus Hayden. „Modelul are inca limite, totusi, dar arata directia pietei”.
In acelasi timp, OpenAI a declarat ca Sora este inca un produs in curs de desfasurare, cu „puncte slabe” clare, in special atunci cand vine vorba de detaliile spatiale ale unei comenzi – amestecand stanga si dreapta – si de cauza si efect. Acesta a dat exemplul crearii unui videoclip in care cineva musca dintr-o prajitura, dar aceasta nu are o urma de muscatura imediat dupa.
Sora va fi pus mai intai la dispozitia profesorilor de securitate cibernetica, numiti „red teamers”, care pot evalua produsul pentru a evalua eventualele riscuri. De asemenea, compania acorda acces unor artisti vizuali, designeri si regizori pentru a avea feedback cu privire la modul in care profesionistii din domeniul creativ ar putea sa-l foloseasca.
Iata cateva exemple ale modului in care functioneaza Sora:
Introducing Sora, our text-to-video model.
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024
https://t.co/uCuhUPv51N pic.twitter.com/nej4TIwgaP
— Sam Altman (@sama) February 15, 2024
Prompt: The camera directly faces colorful buildings in burano italy. An adorable dalmation looks through a window on a building on the ground floor. Many people are walking and cycling along the canal streets in front of the buildings. pic.twitter.com/YwqjefL9Qj
— Eduardo Borges (@duborges) February 15, 2024