Text-to-Video: Η AI της NVIDIA φέρνει την επανάσταση στο video

Παραγωγή video απλά με περιγραφή κειμένου.

Η τεχνητή νοημοσύνη είναι πλέον mainstream, με εργαλεία όπως το ChatGPT και το Midjourney να είναι σε θέση να παράγουν κείμενο και εικόνες. Η NVIDIA το πάει όμως στο επόμενο επίπεδο. Το Toronto AI Lab της εταιρίας ανέπτυξε τα Latent Diffusion Models (LDMs) τα οποία είναι σε θέση να παράγουν videos χωρίς την ανάγκη μεγάλης υπολογιστικής δύναμης. Με λίγα λόγια, η τεχνολογία αυτή μπορεί να παράγει video αποτελέσματα από απλές εντολές κειμένου.

Για παράδειγμα, με την εντολή “ένας strormtrooper να σκουπίζει την παραλία με ηλεκτρική σκούπα” παρήγαγε το παρακάτω GIF.

Η παραγωγική τεχνητή νοημοσύνη της NVIDIA μπορεί να μετατρέψει ακίνητες εικόνες με έναν ρεαλιστικό τρόπο και να τις κάνει upscale με διάφορες τεχνικές. Έτσι, μπορεί να παράγει ένα σύντομο βίντεο 4.7 δευτερολέπτων με ανάλυση 1280×2048. Αυτή η εξέλιξη βέβαια σημαίνει πως δε θα αργήσουμε να δούμε και ακόμα μεγαλύτερα σε διάρκεια videos.

Προς το παρόν μιλάμε απλά για δημιουργία GIF πρακτικά, αλλά πολύ σύντομα θα μιλάμε για εκδημοκρατισμό της δημιουργίας video από χρήστες που δεν έχουν τις τεχνικές γνώσεις ή ακόμα παραπέρα, θα μιλάμε σύντομα για αυτοματοποιημένες παραγωγές ταινιών…

Πηγή: unboxholics.com

Text-to-Video: Η AI της NVIDIA φέρνει την επανάσταση στο video

Οι The Linda Lindas συνεργάζονται με τη Hayley Williams στο single “Closer”

Η Lucy Dacus επέστρεψε με το “Planting Tomatoes” και με ένα πολύ...

Πέντε πρωτότυπα που έφτασαν κοντά την παραγωγή

Triumph Speed Twin TFC 2027: Διέρρευσαν οι πρώτες πληροφορίες για τη νέα...

Related posts