Τεχνολογία

Mocha AI: Το νέο μοντέλο της Meta μετατρέπει την ομιλία σε ρεαλιστικούς χαρακτήρες που μιλάνε

Η Meta σε συνεργασία με το Πανεπιστήμιο του Waterloo αποκάλυψε το MoCha, ένα πρωτοποριακό AI σύστημα το οποίο μπορεί να δημιουργεί full-body character animations, με συγχρονισμένο λόγο, εκφράσεις, χειρονομίες και ρεαλιστική κίνηση.

Πρόκειται για ένα σημαντικό βήμα στον τομέα των κινούμενων εικόνων που βασίζονται στην τεχνητή νοημοσύνη, υπερβαίνοντας τα όρια του τι είναι δυνατό με τη δημιουργία κειμένου σε βίντεο.

Σε αντίθεση με προηγούμενα μοντέλα που εστίαζαν μόνο στο πρόσωπο ή στο lip-sync, το MoCha αποδίδει την κίνηση ολόκληρου του σώματος και υποστηρίζει λήψεις από διαφορετικές γωνίες κάμερας. Μπορεί να αναπαραστήσει φυσικές κινήσεις, διαλόγους, ακόμα και αλληλεπιδράσεις μεταξύ πολλών χαρακτήρων ταυτόχρονα.

Η ομάδα εκπαίδευσε το MoCha με πάνω από 300 ώρες επιλεγμένου video υλικού, ενώ πρόσθεσε και text-based sequences για να δώσει στο σύστημα τη δυνατότητα να αποδίδει πιο σύνθετες αφηγηματικές σκηνές. Έτσι, ο χρήστης μπορεί να δημιουργήσει μία ρεαλιστική σκηνή animation απλώς δίνοντας ένα γραπτό prompt.

Το MoCha φέρνει την AI παραγωγή video πιο κοντά στην πλήρως αυτοματοποιημένη μορφή της, με δυνατότητες που αναμένεται να βρουν εφαρμογή σε gaming, VR, ταινίες και ψηφιακούς βοηθούς. Είναι ένα εργαλείο που μπορεί να αλλάξει ριζικά τον τρόπο με τον οποίο δημιουργείται ψηφιακό περιεχόμενο.

Πηγή: unboxholics.com

Related posts

Οι επόμενης γενιάς Ryzen 7000 της AMD θα υποστηρίζουν αρχικά μόνο DDR5 μνήμες RAM

TEO

Η τεχνητή νοημοσύνη εκτοξεύει τη Nvidia στα 4 τρισεκατομμύρια δολάρια

TEO

Το Reno 7 Z 5G είναι το νέο smartphone της Oppo με δυνατά χαρακτηριστικά

TEO

Αυτός ο ιστότοπος χρησιμοποιεί cookies για να βελτιώσει την εμπειρία σας. Θα υποθέσουμε ότι είστε εντάξει με αυτό, αλλά μπορείτε να εξαιρεθείτε εάν το επιθυμείτε. Αποδέχομαι Διαβάστε περισσότερα

Πολιτική Απορρήτου & Cookies