Τεχνολογία

Text-to-Video: Η AI της NVIDIA φέρνει την επανάσταση στο video

Παραγωγή video απλά με περιγραφή κειμένου.

Η τεχνητή νοημοσύνη είναι πλέον mainstream, με εργαλεία όπως το ChatGPT και το Midjourney να είναι σε θέση να παράγουν κείμενο και εικόνες. Η NVIDIA το πάει όμως στο επόμενο επίπεδο. Το Toronto AI Lab της εταιρίας ανέπτυξε τα Latent Diffusion Models (LDMs) τα οποία είναι σε θέση να παράγουν videos χωρίς την ανάγκη μεγάλης υπολογιστικής δύναμης. Με λίγα λόγια, η τεχνολογία αυτή μπορεί να παράγει video αποτελέσματα από απλές εντολές κειμένου.

Για παράδειγμα, με την εντολή “ένας strormtrooper να σκουπίζει την παραλία με ηλεκτρική σκούπα” παρήγαγε το παρακάτω GIF.

Η παραγωγική τεχνητή νοημοσύνη της NVIDIA μπορεί να μετατρέψει ακίνητες εικόνες με έναν ρεαλιστικό τρόπο και να τις κάνει upscale με διάφορες τεχνικές. Έτσι, μπορεί να παράγει ένα σύντομο βίντεο 4.7 δευτερολέπτων με ανάλυση 1280×2048. Αυτή η εξέλιξη βέβαια σημαίνει πως δε θα αργήσουμε να δούμε και ακόμα μεγαλύτερα σε διάρκεια videos.

Προς το παρόν μιλάμε απλά για δημιουργία GIF πρακτικά, αλλά πολύ σύντομα θα μιλάμε για εκδημοκρατισμό της δημιουργίας video από χρήστες που δεν έχουν τις τεχνικές γνώσεις ή ακόμα παραπέρα, θα μιλάμε σύντομα για αυτοματοποιημένες παραγωγές ταινιών…

Πηγή: unboxholics.com

Related posts

One UI 5.0: Αυτό είναι μάλλον το παράθυρο κυκλοφορίας του νέου λογισμικού της Samsung

TEO

Το Twitch αφαιρεί λειτουργία που επέτρεψε την προώθηση πορνό

TEO

Intel: Πρώτη κλεφτή ματιά στον επεξεργαστή-«τέρας» των 6 GHz

TEO

Αυτός ο ιστότοπος χρησιμοποιεί cookies για να βελτιώσει την εμπειρία σας. Θα υποθέσουμε ότι είστε εντάξει με αυτό, αλλά μπορείτε να εξαιρεθείτε εάν το επιθυμείτε. Αποδέχομαι Διαβάστε περισσότερα

Πολιτική Απορρήτου & Cookies