Κατά τη διάρκεια του Google I/O event, η Google ανακοίνωσε το Gemini Omni, ένα καινούργιο εργαλείο τεχνητής νοημοσύνης που θέλει να φέρει την επανάσταση στη δημιουργία βίντεο. Πρόκειται ουσιαστικά για την απάντηση της εταιρίας στην «πεθαμένη» πλέον Sora AI της OpenAI.
Η Google αποκάλυψε ότι μέσα από το Omni, οι χρήστες θα μπορούν να δημιουργούν βίντεο με την AI μέσα από υπάρχουσες φωτογραφίες, βίντεο ή selfie που θα τραβούν εκείνη την ώρα.
“Παρουσιάζουμε το Gemini Omni, όπου η ικανότητα του Gemini στον συλλογισμό συναντά την ικανότητά του στη δημιουργία. Το Omni είναι το νέο μοντέλο μας που μπορεί να δημιουργήσει ό,τι θέλετε από οποιοδήποτε είδος δεδομένων εισόδου, ξεκινώντας από το βίντεο. Με το Omni, μπορείτε να συνδυάσετε ως δεδομένα εισόδου εικόνες, ήχο, βίντεο και κείμενο και να παράγετε υψηλής ποιότητας βίντεο βασισμένα στη γνώση του Gemini για τον πραγματικό κόσμο. Μπορείτε, επίσης, να επεξεργαστείτε εύκολα τα βίντεό σας μέσω συνομιλίας.” έγραψε η Google.
We’re dropping Gemini Omni: our first step towards a model that can create anything from anything – starting with video.
— Google DeepMind (@GoogleDeepMind) May 19, 2026
It combines Gemini’s intelligence with our generative media systems – representing a leap forward in world understanding, multimodality, and editing 🧵 pic.twitter.com/GAtqzr0VIV
Google COOKED with Gemini Omni pic.twitter.com/Y1XoSUXJCH
— Shishir (@ShishirShelke1) May 19, 2026
Gemini Omni doesn't just build scenes that look real, it reasons about what should happen next. It combines an intuitive understanding of physics with Gemini's knowledge of history, science, and cultural context.
— Sundar Pichai (@sundarpichai) May 19, 2026
Rolling out today starting with video outputs to Google AI Plus,… pic.twitter.com/EkLjv5O0dN
Ακολουθούν οι ανακοινώσεις της Google για το Gemini Omni:
Σήμερα, κυκλοφορεί το πρώτο μοντέλο της οικογένειας Omni: το Gemini Omni Flash, στην εφαρμογή Gemini, στο Google Flow και στο YouTube Shorts. Στο μέλλον θα υποστηρίξουμε μορφές εξόδου όπως εικόνα και ήχο. Δείτε μερικά από τα στοιχεία που κάνουν το Omni να ξεχωρίζει:
Επεξεργασία βίντεο μέσω συνομιλίας
Το Gemini Omni προσφέρει έναν πιο εύκολο τρόπο να επεξεργαστείτε βίντεο χρησιμοποιώντας φυσική γλώσσα. Κάθε οδηγία βασίζεται στην προηγούμενη. Οι χαρακτήρες σας παραμένουν συνεπείς, οι νόμοι της φυσικής εφαρμόζονται ρεαλιστικά και η σκηνή διατηρεί τη συνέχεια όσων έχουν προηγηθεί.
Μεταμορφώστε τον κόσμο γύρω σας. Αλλάξτε συγκεκριμένα στοιχεία ή αλλάξτε τα πάντα. Το βίντεό σας γίνεται η αφετηρία για κάτι που δεν θα μπορούσατε ποτέ να έχετε κινηματογραφήσει μόνοι σας.
Αναδιαμορφώστε τη δράση. Ζητήστε απλώς από το Omni να αλλάξει αυτό που συμβαίνει σε ένα βίντεο που έχετε τραβήξει. Αλλάξτε την εξέλιξη της δράσης, προσθέστε νέους χαρακτήρες ή αντικείμενα, ή μετατρέψτε μια στιγμή σε κάτι απρόβλεπτο.
Βελτιώστε τα βίντεό σας σε πολλαπλά στάδια. Αλλάξτε το περιβάλλον, τη γωνία λήψης, το στιλ ή ακόμα και συγκεκριμένες λεπτομέρειες, διατηρώντας τη συνοχή της αρχικής σκηνής.
Ζωντανέψτε τις ιδέες σας, αξιοποιώντας τη γνώση του Gemini για τον κόσμο
Το Gemini Omni δεν δημιουργεί απλώς σκηνές που φαίνονται ρεαλιστικές, αλλά αντιλαμβάνεται τι πρέπει να συμβεί στη συνέχεια. Συνδυάζει μια διαισθητική κατανόηση της φυσικής με τη γνώση του Gemini για την ιστορία, την επιστήμη και το πολιτισμικό πλαίσιο, γεφυρώνοντας το χάσμα ανάμεσα στον φωτορεαλισμό και την αφήγηση με νόημα.
Δημιουργήστε οπτικό περιεχόμενο με μεγαλύτερη ακρίβεια στους νόμους της φυσικής. Το Omni διαθέτει μια βελτιωμένη διαισθητική κατανόηση φυσικών δυνάμεων όπως η βαρύτητα, η κινητική ενέργεια και η ρευστοδυναμική, επιτρέποντάς σας να δημιουργήσετε πιο ρεαλιστικές σκηνές.
Συνδυάστε γνώση και δημιουργικότητα. Το Omni χρησιμοποιεί τη γνώση του Gemini για να συνδέει γλώσσα, εικόνες και νόημα με τρόπους που ξεπερνούν κατά πολύ την απλή αντιστοίχιση προτύπων.
Σύνθετες ιδέες οπτικοποιούνται. Το Omni μπορεί να δημιουργήσει εντυπωσιακές επεξηγήσεις από σύντομες προτροπές, παράγοντας οπτικά στοιχεία που αποδομούν πιο σύνθετες έννοιες.
Δημιουργήστε βίντεο από οποιονδήποτε συνδυασμό δεδομένων εισόδου
Αναφερθείτε σε οτιδήποτε. Το Omni μετατρέπει κάθε αναφορά εικόνας, κειμένου, βίντεο ή ήχου, σε ένα ενιαίο, συνεκτικό αποτέλεσμα. Αν και προς το παρόν για τον ήχο θα υποστηρίζονται μόνο φωνητικές αναφορές, σύντομα θα προστεθούν και άλλοι τύποι ηχητικών δεδομένων εισόδου.
Ξεκινήστε από αυτό που έχετε. Με αναφορές δεδομένων εισόδου μπορείτε να χρησιμοποιήσετε εικόνες χαρακτήρων, σκηνές ή σχέδια για να δημιουργήσετε με τρόπο που ταιριάζει στο όραμά σας.
Εφαρμόστε στιλ, κίνηση ή εφέ. Καθορίστε την οπτική γλώσσα χρησιμοποιώντας αναφορές δεδομένων εισόδου ή απλά περιγράψτε το με φυσική γλώσσα. Το Omni συνδυάζει τις αναφορές εισόδου για να δημιουργήσει ένα συνεκτικό βίντεο κλιπ.
Δημιουργήστε βίντεο με το δικό σας ψηφιακό avatar
Δεσμευόμαστε να αναπτύξουμε το AI με υπευθυνότητα, θέτοντας σαφείς πολιτικές για την προστασία των χρηστών, και να διασφαλίσουμε τη σωστή χρήση των AI εργαλείων μας. Ως πρώτο βήμα, μπορείτε να δημιουργείτε βίντεο με τη δική σας φωνή χρησιμοποιώντας Avatar για τη διαμόρφωση μιας ψηφιακής εκδοχής του εαυτού σας, ώστε να μπορείτε να παράγετε βίντεο που μοιάζουν και ακούγονται σαν εσάς. Όσον αφορά την επεξεργασία βίντεο για την αλλαγή ήχου και ομιλίας, πέρα από τη λειτουργία Avatar, βρισκόμαστε ακόμα σε στάδιο δοκιμών, ώστε να κατανοήσουμε πώς μπορούμε να διαθέσουμε αυτή τη δυνατότητα στους χρήστες με υπευθυνότητα.
Όλα τα βίντεο που δημιουργούνται με το Omni περιλαμβάνουν το αόρατο ψηφιακό υδατογράφημα SynthID. Μπορείτε εύκολα να επαληθεύσετε ότι τα βίντεο έχουν δημιουργηθεί με το Gemini Omni μέσω της εφαρμογής Gemini, του Gemini στο Chrome και της Αναζήτησης Google. Μπορείτε να μάθετε περισσότερα σχετικά με το πώς επεκτείνουμε τα εργαλεία διαφάνειας και επαλήθευσης περιεχομένου, ώστε να σας βοηθήσουν να κατανοήσετε πώς δημιουργήθηκε και επεξεργάστηκε το περιεχόμενο στο διαδίκτυο, στην ανάρτηση ιστολογίου μας.
Δοκιμάστε το Gemini Omni τώρα
Σήμερα, παρουσιάζουμε το πρώτο μοντέλο της οικογένειας Omni, το Gemini Omni Flash. Το Gemini Omni Flash είναι διαθέσιμο σήμερα σε όλους τους συνδρομητές Google AI Plus, Pro and Ultra παγκοσμίως μέσω της εφαρμογής Gemini και του Google Flow. Κυκλοφορεί επίσης από αυτή την εβδομάδα, χωρίς κόστος προς τους χρήστες, στο YouTube Shorts and YouTube Create App.
Τις επόμενες εβδομάδες, θα διατεθεί επίσης σε προγραμματιστές και εταιρικούς πελάτες μέσω API.
Πηγή: unboxholics.com
