Τεχνολογία

Text-to-Video: Η AI της NVIDIA φέρνει την επανάσταση στο video

Παραγωγή video απλά με περιγραφή κειμένου.

Η τεχνητή νοημοσύνη είναι πλέον mainstream, με εργαλεία όπως το ChatGPT και το Midjourney να είναι σε θέση να παράγουν κείμενο και εικόνες. Η NVIDIA το πάει όμως στο επόμενο επίπεδο. Το Toronto AI Lab της εταιρίας ανέπτυξε τα Latent Diffusion Models (LDMs) τα οποία είναι σε θέση να παράγουν videos χωρίς την ανάγκη μεγάλης υπολογιστικής δύναμης. Με λίγα λόγια, η τεχνολογία αυτή μπορεί να παράγει video αποτελέσματα από απλές εντολές κειμένου.

Για παράδειγμα, με την εντολή “ένας strormtrooper να σκουπίζει την παραλία με ηλεκτρική σκούπα” παρήγαγε το παρακάτω GIF.

Η παραγωγική τεχνητή νοημοσύνη της NVIDIA μπορεί να μετατρέψει ακίνητες εικόνες με έναν ρεαλιστικό τρόπο και να τις κάνει upscale με διάφορες τεχνικές. Έτσι, μπορεί να παράγει ένα σύντομο βίντεο 4.7 δευτερολέπτων με ανάλυση 1280×2048. Αυτή η εξέλιξη βέβαια σημαίνει πως δε θα αργήσουμε να δούμε και ακόμα μεγαλύτερα σε διάρκεια videos.

Προς το παρόν μιλάμε απλά για δημιουργία GIF πρακτικά, αλλά πολύ σύντομα θα μιλάμε για εκδημοκρατισμό της δημιουργίας video από χρήστες που δεν έχουν τις τεχνικές γνώσεις ή ακόμα παραπέρα, θα μιλάμε σύντομα για αυτοματοποιημένες παραγωγές ταινιών…

Πηγή: unboxholics.com

Related posts

Αυτό είναι το μεγαλύτερο subwoofer του κόσμου – Έχει ύψος σχεδόν δυόμιση μέτρα

TEO

Η NVIDIA απαντά στα παράπονα ότι η RTX 5090 είναι υπερβολικά ακριβή – Νέες δηλώσεις από τον CEO της

TEO

Elon Musk: Είναι η τελευταία φορά που οποιαδήποτε AI είναι καλύτερη από τον Grok – Έρχεται το νέο πανίσχυρο μοντέλο

TEO

Αυτός ο ιστότοπος χρησιμοποιεί cookies για να βελτιώσει την εμπειρία σας. Θα υποθέσουμε ότι είστε εντάξει με αυτό, αλλά μπορείτε να εξαιρεθείτε εάν το επιθυμείτε. Αποδέχομαι Διαβάστε περισσότερα

Πολιτική Απορρήτου & Cookies