Αναζήτηση στην κοινότητα
Εμφάνιση αποτελεσμάτων για τις ετικέτες 'Veo'.
8 αποτελέσματα
-
Η Google λανσάρει νέα λειτουργία στο Gemini AI που μετατρέπει φωτογραφίες σε βίντεο με τεχνητή νοημοσύνη, συμπεριλαμβανομένων ήχων και διαλόγων. Η νέα δυνατότητα μετατροπής φωτογραφιών σε βίντεο τροφοδοτείται από το μοντέλο Veo 3 της Google και μπορεί να μετατρέψει εικόνες αναφοράς σε βίντεο οκτώ δευτερολέπτων με ήχο που δημιουργείται από τεχνητή νοημοσύνη, συμπεριλαμβανομένων θορύβων περιβάλλοντος, ήχων και ομιλίας. H ενημέρωση βίντεο του Gemini είναι πλέον διαθέσιμη στους συνδρομητές Google AI Ultra και Pro στη web έκδοση και "σε επιλεγμένες περιοχές" στις οποίες δεν περιλαμβάνεται για την ώρα η χώρα μας. Οι χρήστες του Gemini μπορούν να αποκτήσουν πρόσβαση στη λειτουργία κάνοντας κλικ στην επιλογή "εργαλεία" στη γραμμή προτροπής, επιλέγοντας "βίντεο" και μεταφορτώνοντας τη φωτογραφία τους μαζί με μια περιγραφή κειμένου για το πώς θέλουν να κινηθεί. Μπορούν επίσης να συμπεριληφθούν περιγραφές ήχου για διαλόγους, ηχητικά εφέ και περιβαλλοντικό θόρυβο, τα οποία, όπως αναφέρει η Google, θα είναι "τέλεια συγχρονισμένα με τα οπτικά στοιχεία". Τα τελικά βίντεο παραδίδονται ως αρχεία MP4 με ανάλυση 720p και σε αναλογία 16:9. "Μπορείτε να γίνετε δημιουργικοί ζωντανεύοντας καθημερινά αντικείμενα, δίνοντας ζωή στα σχέδια και τους πίνακές σας ή προσθέτοντας κίνηση σε σκηνές της φύσης", αναφέρει η Google. "Όλες οι δημιουργίες βίντεο περιλαμβάνουν ένα ορατό υδατογράφημα που δείχνει ότι έχουν δημιουργηθεί από τεχνητή νοημοσύνη και ένα αόρατο ψηφιακό υδατογράφημα SynthID." Μια παρόμοια λειτουργία είναι ήδη διαθέσιμη στο Flow, το εργαλείο δημιουργίας ταινιών με τεχνητή νοημοσύνη που ανακοίνωσε η Google τον Μάρτιο, αλλά τώρα οι χρήστες του Gemini μπορούν να ζωντανέψουν τις φωτογραφίες τους χωρίς να χρειάζεται να ανοίξουν άλλη εφαρμογή. Η Google αναφέρει ότι το Flow θα κυκλοφορήσει επίσης "σε επιπλέον 75 χώρες" από σήμερα, παράλληλα με την κυκλοφορία της νέας λειτουργίας βίντεο του Gemini. Διαβάστε ολόκληρο το άρθρο
-
Η νέα δυνατότητα μετατροπής φωτογραφιών σε βίντεο τροφοδοτείται από το μοντέλο Veo 3 της Google και μπορεί να μετατρέψει εικόνες αναφοράς σε βίντεο οκτώ δευτερολέπτων με ήχο που δημιουργείται από τεχνητή νοημοσύνη, συμπεριλαμβανομένων θορύβων περιβάλλοντος, ήχων και ομιλίας. H ενημέρωση βίντεο του Gemini είναι πλέον διαθέσιμη στους συνδρομητές Google AI Ultra και Pro στη web έκδοση και "σε επιλεγμένες περιοχές" στις οποίες δεν περιλαμβάνεται για την ώρα η χώρα μας. Οι χρήστες του Gemini μπορούν να αποκτήσουν πρόσβαση στη λειτουργία κάνοντας κλικ στην επιλογή "εργαλεία" στη γραμμή προτροπής, επιλέγοντας "βίντεο" και μεταφορτώνοντας τη φωτογραφία τους μαζί με μια περιγραφή κειμένου για το πώς θέλουν να κινηθεί. Μπορούν επίσης να συμπεριληφθούν περιγραφές ήχου για διαλόγους, ηχητικά εφέ και περιβαλλοντικό θόρυβο, τα οποία, όπως αναφέρει η Google, θα είναι "τέλεια συγχρονισμένα με τα οπτικά στοιχεία". Τα τελικά βίντεο παραδίδονται ως αρχεία MP4 με ανάλυση 720p και σε αναλογία 16:9. "Μπορείτε να γίνετε δημιουργικοί ζωντανεύοντας καθημερινά αντικείμενα, δίνοντας ζωή στα σχέδια και τους πίνακές σας ή προσθέτοντας κίνηση σε σκηνές της φύσης", αναφέρει η Google. "Όλες οι δημιουργίες βίντεο περιλαμβάνουν ένα ορατό υδατογράφημα που δείχνει ότι έχουν δημιουργηθεί από τεχνητή νοημοσύνη και ένα αόρατο ψηφιακό υδατογράφημα SynthID." Μια παρόμοια λειτουργία είναι ήδη διαθέσιμη στο Flow, το εργαλείο δημιουργίας ταινιών με τεχνητή νοημοσύνη που ανακοίνωσε η Google τον Μάρτιο, αλλά τώρα οι χρήστες του Gemini μπορούν να ζωντανέψουν τις φωτογραφίες τους χωρίς να χρειάζεται να ανοίξουν άλλη εφαρμογή. Η Google αναφέρει ότι το Flow θα κυκλοφορήσει επίσης "σε επιπλέον 75 χώρες" από σήμερα, παράλληλα με την κυκλοφορία της νέας λειτουργίας βίντεο του Gemini.
-
Το εντυπωσιακό μοντέλο δημιουργίας βίντεο της Google, Veo 3, είναι πλέον διαθέσιμο για τους συνδρομητές Gemini Pro, προσφέροντας τη δυνατότητα δημιουργίας βίντεο τριών βίντεο ημερησίως. Το τελευταίο μοντέλο δημιουργίας βίντεο της Google, το Veo 3, είναι πλέον διαθέσιμο για τους χρήστες του Gemini AI Pro σε όλη την Ευρώπη, συμπεριλαμβανομένων της Ελλάδας, με μηνιαίο κόστος €22,99. Το Veo 3 αποτελεί διάδοχο των προηγούμενων μοντέλων δημιουργίας βίντεο της Google. Σύμφωνα με την Google, το σύστημα έχει εκπαιδευτεί σε εκατομμύρια βίντεο του YouTube και μπορεί να δημιουργήσει ρεαλιστικά βιντεοκλίπ βάσει προτροπών κειμένου. Το εργαλείο δεν είναι δωρεάν, όμως οι χρήστες μπορούν να πειραματιστούν με αυτό χωρίς κόστος χρησιμοποιώντας πιστώσεις Google Cloud. Οι χρήστες του Gemini Pro αποκτούν πρόσβαση σε τρεις δημιουργίες βίντεο ανά ημέρα. Το όριο αυτό ανανεώνεται καθημερινά, επιτρέποντας στους συνδρομητές να παράγουν νέο περιεχόμενο τακτικά. Μετά την επίτευξη του ημερήσιου ορίου, οι χρήστες επιστρέφουν στο Veo 2 του οποίου όμως η ποιότητα υπολείπεται σημαντικά σε σχέση με τη νεότερη έκδοση. Το Veo 3 είναι άμεσα διαθέσιμο μέσα από την web έκδοση του Gemini στη διεύθυνση gemini.google.com, ενώ για την ώρα δεν έχει ενεργοποιηθεί στην εφαρμογή του Gemini για iPhone και Android κάτι που αναμένεται να γίνει άμεσα. Η Google εργάζεται εντατικά τους τελευταίους μήνες για τη βελτίωση της τεχνολογίας δημιουργίας βίντεο, με την εταιρεία να ανταγωνίζεται με άλλα παρόμοια εργαλεία, συμπεριλαμβανομένου του Sora της OpenAI. Η πολύ σημαντική διαφορά είναι ότι το Veo 3 μπορεί να δημιουργήσει κλιπ διάρκειας έως οκτώ δευτερολέπτων, συμπεριλαμβανομένου ήχου και ομιλίας σε πολλές γλώσσες, συμπεριλαμβανομένων και των ελληνικών. View full article
-
Το τελευταίο μοντέλο δημιουργίας βίντεο της Google, το Veo 3, είναι πλέον διαθέσιμο για τους χρήστες του Gemini AI Pro σε όλη την Ευρώπη, συμπεριλαμβανομένων της Ελλάδας, με μηνιαίο κόστος €22,99. Το Veo 3 αποτελεί διάδοχο των προηγούμενων μοντέλων δημιουργίας βίντεο της Google. Σύμφωνα με την Google, το σύστημα έχει εκπαιδευτεί σε εκατομμύρια βίντεο του YouTube και μπορεί να δημιουργήσει ρεαλιστικά βιντεοκλίπ βάσει προτροπών κειμένου. Το εργαλείο δεν είναι δωρεάν, όμως οι χρήστες μπορούν να πειραματιστούν με αυτό χωρίς κόστος χρησιμοποιώντας πιστώσεις Google Cloud. Οι χρήστες του Gemini Pro αποκτούν πρόσβαση σε τρεις δημιουργίες βίντεο ανά ημέρα. Το όριο αυτό ανανεώνεται καθημερινά, επιτρέποντας στους συνδρομητές να παράγουν νέο περιεχόμενο τακτικά. Μετά την επίτευξη του ημερήσιου ορίου, οι χρήστες επιστρέφουν στο Veo 2 του οποίου όμως η ποιότητα υπολείπεται σημαντικά σε σχέση με τη νεότερη έκδοση. Το Veo 3 είναι άμεσα διαθέσιμο μέσα από την web έκδοση του Gemini στη διεύθυνση gemini.google.com, ενώ για την ώρα δεν έχει ενεργοποιηθεί στην εφαρμογή του Gemini για iPhone και Android κάτι που αναμένεται να γίνει άμεσα. Η Google εργάζεται εντατικά τους τελευταίους μήνες για τη βελτίωση της τεχνολογίας δημιουργίας βίντεο, με την εταιρεία να ανταγωνίζεται με άλλα παρόμοια εργαλεία, συμπεριλαμβανομένου του Sora της OpenAI. Η πολύ σημαντική διαφορά είναι ότι το Veo 3 μπορεί να δημιουργήσει κλιπ διάρκειας έως οκτώ δευτερολέπτων, συμπεριλαμβανομένου ήχου και ομιλίας σε πολλές γλώσσες, συμπεριλαμβανομένων και των ελληνικών.
-
Η Google ανακοίνωσε το Veo 3 μόλις πριν από λίγες μέρες στο Google I/O 2025, και στο διαδίκτυο υπάρχει αναβρασμός! Η τελευταία γεννήτρια βίντεο με τεχνητή νοημοσύνη της εταιρείας έγινε viral για όλους τους σωστούς (και μερικές φορές ανησυχητικούς) λόγους. Με τη νέα του έκδοση, το Veo έλαβε μια τεράστια αναβάθμιση με τη μορφή εγγενούς παραγωγής ήχου και πλέον μπορείτε να δημιουργήσετε τα πάντα, από αφηγήσεις μέχρι ολόκληρα κλιπ που περιλαμβάνουν, μουσική, ήχους περιβάλλοντος, διαλόγους και άλλα, απλώς περιγράφοντας τι θέλετε να ακούσετε στις προτροπές (prompts). Το Veo 3 είναι επί του παρόντος διαθέσιμο στους συνδρομητές του Google AI Ultra στις ΗΠΑ μέσω της εφαρμογής Gemini ή μέσω του νέου εργαλείου δημιουργίας μίνι ταινίων της εταιρείας που ονομάζεται Flow. Υποστηρίζει δημιουργία βίντεο από κείμενο, από εικόνα και μέσω προτροπών, και τα αποτελέσματα είναι τρομακτικά αληθινά! Είναι το είδος του περιεχομένου που μπορεί να προσπεράσετε χωρίς καν να συνειδητοποιήσετε ότι δημιουργήθηκε από τεχνητή νοημοσύνη. Παρακάτω είναι μερικά από τα πιο viral, παράξενα και απίστευτα ρεαλιστικά βίντεο Veo 3 που κυκλοφορούν στα μέσα κοινωνικής δικτύωσης αυτή τη στιγμή, τα οποία πρέπει να δείτε για να τα πιστέψετε. Άνθρωποι που γνωρίζουν ότι δημιουργήθηκαν από AI Τα παρακάτω κλιπ παρουσιάζουν ανατριχιαστικά ανθρώπινους χαρακτήρες που είτε γνωρίζουν είτε αρνούνται να πιστέψουν ότι δημιουργήθηκαν με προτροπές. Ένα άλλο βίντεο φαντάζεται χαρακτήρες τεχνητής νοημοσύνης που συνειδητοποιούν την ύπαρξή τους ως συνθετικά όντα. Και τα δύο βίντεο είναι ολίγον ανατριχιαστικά, έχοντας -μεταξύ άλλων- και κινηματογραφικό feeling. Μια διαφήμιση αντικαταθλιπτικών φιλική προς τα γούνινα ζώα Πρόκειται για μια πλήρως ψεύτικη φαρμακευτική διαφήμιση για ένα αντικαταθλιπτικό που προσελκύει...σκύλους. Τα πάντα, από την υποκριτική μέχρι τη μελαγχολική μουσική, τον φωτισμό, το φόντο, ακόμη και τα κουτάβια, έχουν δημιουργηθεί με τεχνητή νοημοσύνη. Ανύπαρκτες συνεντεύξεις σε έκθεση αυτοκινήτων Tο συγκεκριμένο βίντεο παρουσιάζει ρεαλιστικούς παρουσιαστές που παίρνουν συνέντευξη από ψεύτικους επισκέπτες για ψεύτικα αυτοκίνητα σε μια ψεύτικη έκθεση αυτοκινήτων. Είναι δύσκολο για κάποιον τουλάχιστον άμεσα να διακρίνει ότι τα πάντα σε αυτό το βίντεο είναι ψεύτικα, συμπεριλαμβανομένου του πλήθους, των κινήσεων της κάμερας, του φωτισμού, των αυτοκινήτων, ακόμη και των μωρών σε καροτσάκια. Ο Will Smith τρώει μακαρόνια (ξανά) Κάποιος έπρεπε να το κάνει...ξανά. Σε αυτό το σημείο, έχει γίνει παράδοση κάθε φορά που κυκλοφορεί μια νέα γεννήτρια βίντεο τεχνητής νοημοσύνης, κάποιος να αναδημιουργεί το διαβόητο βίντεο "Ο Will Smith τρώει μακαρόνια". Με το Veo 3, η σκηνή τώρα περιλαμβάνει πλήρεις ήχους μασίματος, αν και όχι ρεαλιστικούς. Ενώ η ομοιότητα του προσώπου με τον Smith εξακολουθεί να μην είναι τέλεια, το αποτέλεσμα είναι ακόμα διασκεδαστικό. Το ντοκιμαντέρ για δημιουργία μουσικού οργάνου Μια ταινία μικρού μήκους που καταγράφει έναν καλλιτέχνη mixed-media που κατασκευάζει ένα μουσικό όργανο εμπνευσμένο από μια εθνοτική ομάδα στο Βιετνάμ. Η αφήγηση, η μουσική υπόκρουση, οι ήχοι, ακόμη και τα σχόλια του καλλιτέχνη, όλα έχουν δημιουργηθεί από τεχνητή νοημοσύνη. Μοιάζει με κάτι που θα βλέπατε στο Netflix, μέχρι να συνειδητοποιήσετε ότι τίποτα από αυτά δεν είναι πραγματικό. Είναι σαφές ότι εργαλεία όπως το Veo 3 έχουν απίστευτες δυνατότητες. Διαφημιστές, κινηματογραφιστές, εκπαιδευτικοί, καλλιτέχνες και πρακτικά οποιοσδήποτε άλλος μπορεί πλέον να δημιουργήσει ολόκληρες βιντεοπαραγωγές χωρίς ποτέ να πιάσει κάμερα ή να προσλάβει συνεργείο. Παρόλα αυτά, αυτού του είδους το περιεχόμενο τεχνητής νοημοσύνης που είναι αρκετά ρεαλιστικό, συνοδεύεται επίσης από κινδύνους παραπληροφόρησης και συναίνεσης στη δημιουργία μέσων. Σε κάθε περίπτωση το κουτί της Πανδώρας είναι πλέον ανοιχτό. Διαβάστε ολόκληρο το άρθρο
- 42 απαντήσεις
-
- 1
-
-
Η Midjourney, μια από τις πιο δημοφιλείς νεοφυείς επιχειρήσεις τεχνητής νοημοσύνης, ανακοίνωσε την Τετάρτη την κυκλοφορία του πολυαναμενόμενου μοντέλου δημιουργίας βίντεο με AI, V1. Το V1 είναι ένα μοντέλο μετατροπής εικόνας σε βίντεο, όπου οι χρήστες μπορούν να ανεβάσουν μια εικόνα - ή να χρησιμοποιήσουν μια εικόνα που δημιουργήθηκε από άλλα μοντέλα της Midjourney - και το V1 θα παράγει ένα σύνολο τεσσάρων βίντεο, με διάρκεια 5 δευτερολέπτων το καθένα, βασισμένων σε αυτή την εικόνα. Όπως και τα μοντέλα εικόνας της Midjourney, το V1 είναι διαθέσιμο μόνο μέσω Discord και μόνο σε web έκδοση κατά την αρχική κυκλοφορία του. Η κυκλοφορία του V1 φέρνει την Midjourney σε ανταγωνισμό με μοντέλα δημιουργίας βίντεο AI από άλλες εταιρείες, όπως το Sora της OpenAI, το Gen 4 της Runway, το Firefly της Adobe και το Veo 3 της Google. Ενώ πολλές εταιρείες εστιάζουν στην ανάπτυξη ελεγχόμενων μοντέλων βίντεο AI για εμπορική χρήση, η Midjourney ξεχωρίζει πάντα για τα χαρακτηριστικά μοντέλα εικόνας AI που απευθύνονται σε δημιουργικούς ανθρώπους. Όπως ξεκαθαρίζει η Midjourney, έχει μεγαλύτερους στόχους για τα μοντέλα βίντεο AI από την απλή δημιουργία B-roll για ταινίες του Χόλιγουντ ή διαφημίσεις. Σε μια ανάρτηση, ο CEO της Midjourney, David Holz, αναφέρει ότι το μοντέλο βίντεο AI είναι το επόμενο βήμα της εταιρείας προς τον τελικό της προορισμό, τη δημιουργία μοντέλων AI "ικανών για προσομοιώσεις ανοιχτού κόσμου σε πραγματικό χρόνο". Μετά τα μοντέλα βίντεο AI, η Midjourney δηλώνει ότι σχεδιάζει να αναπτύξει μοντέλα AI για την παραγωγή τρισδιάστατων απεικονίσεων, καθώς και μοντέλα AI πραγματικού χρόνου. Η κυκλοφορία του μοντέλου V1 της Midjourney έρχεται μόλις μια εβδομάδα μετά την αγωγή που κατέθεσαν εναντίον της δύο από τα πιο γνωστά κινηματογραφικά στούντιο του Χόλιγουντ: η Disney και η Universal. Η αγωγή ισχυρίζεται ότι εικόνες που δημιουργήθηκαν από τα μοντέλα εικόνας AI της Midjourney απεικονίζουν χαρακτήρες με πνευματικά δικαιώματα των στούντιο, όπως ο Homer Simpson και ο Darth Vader. Τα στούντιο του Χόλιγουντ αντιμετωπίζουν δυσκολίες στην αντιμετώπιση της αυξανόμενης δημοτικότητας των μοντέλων δημιουργίας εικόνας και βίντεο AI, όπως αυτά που αναπτύσσει η Midjourney. Υπάρχει αυξανόμενος φόβος ότι αυτά τα εργαλεία AI θα μπορούσαν να αντικαταστήσουν ή να υποτιμήσουν το έργο των δημιουργών στους αντίστοιχους τομείς τους, και αρκετές εταιρείες μέσων ενημέρωσης έχουν ισχυριστεί ότι αυτά τα προϊόντα εκπαιδεύονται σε έργα τους με πνευματικά δικαιώματα. Παρόλο που η Midjourney προσπάθησε να τοποθετηθεί ως διαφορετική από άλλες νεοφυείς επιχειρήσεις AI εικόνας και βίντεο - εστιάζοντας περισσότερο στη δημιουργικότητα παρά σε άμεσες εμπορικές εφαρμογές - η εταιρεία δεν μπορεί να ξεφύγει από αυτές τις κατηγορίες. Αρχικά, η Midjourney δηλώνει ότι θα χρεώνει 8 φορές περισσότερο για μια δημιουργία βίντεο από μια τυπική δημιουργία εικόνας, που σημαίνει ότι οι συνδρομητές θα εξαντλούν το μηνιαίο επιτρεπόμενο όριο δημιουργιών τους σημαντικά γρηγορότερα όταν δημιουργούν βίντεο αντί για εικόνες. Κατά την κυκλοφορία, ο φθηνότερος τρόπος για να δοκιμάσει κανείς το V1 είναι εγγραφόμενος στο πρόγραμμα Basic της Midjourney με κόστος 10 δολάρια το μήνα. Οι συνδρομητές του προγράμματος Pro με κόστος 60 δολάρια το μήνα και του προγράμματος Mega με κόστος 120 δολάρια το μήνα θα έχουν απεριόριστες δημιουργίες βίντεο στην πιο αργή λειτουργία "Relax" της εταιρείας. Τον επόμενο μήνα, η Midjourney δηλώνει ότι θα επανεξετάσει την τιμολόγηση για τα μοντέλα βίντεο. Το V1 έρχεται με μερικές προσαρμοσμένες ρυθμίσεις που επιτρέπουν στους χρήστες να ελέγχουν τα αποτελέσματα του μοντέλου βίντεο. Οι χρήστες μπορούν να επιλέξουν μια αυτόματη ρύθμιση animation για να κάνουν μια εικόνα να κινείται τυχαία, ή μπορούν να επιλέξουν μια χειροκίνητη ρύθμιση που επιτρέπει στους χρήστες να περιγράψουν, με κείμενο, ένα συγκεκριμένο animation που θέλουν να προσθέσουν στο βίντεό τους. Οι χρήστες μπορούν επίσης να ρυθμίσουν την ποσότητα κίνησης της κάμερας και του θέματος επιλέγοντας "χαμηλή κίνηση" ή "υψηλή κίνηση" στις ρυθμίσεις. Ενώ τα βίντεο που δημιουργούνται με το V1 διαρκούν μόνο πέντε δευτερόλεπτα, οι χρήστες μπορούν να επιλέξουν να τα επεκτείνουν κατά τέσσερα δευτερόλεπτα έως και τέσσερις φορές, που σημαίνει ότι τα βίντεο V1 θα μπορούσαν να φτάσουν τα 21 δευτερόλεπτα. Όπως και τα μοντέλα εικόνας AI της Midjourney, τα πρώτα δείγματα βίντεο του V1 φαίνονται κάπως εξωπραγματικά, παρά υπερρεαλιστικά. Η αρχική ανταπόκριση στο V1 ήταν θετική, αν και δεν είναι ακόμα σαφές πόσο καλά συγκρίνεται με άλλα κορυφαία μοντέλα βίντεο AI, τα οποία είναι στην αγορά για μήνες ή ακόμα και χρόνια. Διαβάστε ολόκληρο το άρθρο
- 15 απαντήσεις
-
- Midjourney
- Sora
-
(και 1 περισσότερα)
Ετικέτα με:
-
Το V1 είναι ένα μοντέλο μετατροπής εικόνας σε βίντεο, όπου οι χρήστες μπορούν να ανεβάσουν μια εικόνα - ή να χρησιμοποιήσουν μια εικόνα που δημιουργήθηκε από άλλα μοντέλα της Midjourney - και το V1 θα παράγει ένα σύνολο τεσσάρων βίντεο, με διάρκεια 5 δευτερολέπτων το καθένα, βασισμένων σε αυτή την εικόνα. Όπως και τα μοντέλα εικόνας της Midjourney, το V1 είναι διαθέσιμο μόνο μέσω Discord και μόνο σε web έκδοση κατά την αρχική κυκλοφορία του. Η κυκλοφορία του V1 φέρνει την Midjourney σε ανταγωνισμό με μοντέλα δημιουργίας βίντεο AI από άλλες εταιρείες, όπως το Sora της OpenAI, το Gen 4 της Runway, το Firefly της Adobe και το Veo 3 της Google. Ενώ πολλές εταιρείες εστιάζουν στην ανάπτυξη ελεγχόμενων μοντέλων βίντεο AI για εμπορική χρήση, η Midjourney ξεχωρίζει πάντα για τα χαρακτηριστικά μοντέλα εικόνας AI που απευθύνονται σε δημιουργικούς ανθρώπους. Όπως ξεκαθαρίζει η Midjourney, έχει μεγαλύτερους στόχους για τα μοντέλα βίντεο AI από την απλή δημιουργία B-roll για ταινίες του Χόλιγουντ ή διαφημίσεις. Σε μια ανάρτηση, ο CEO της Midjourney, David Holz, αναφέρει ότι το μοντέλο βίντεο AI είναι το επόμενο βήμα της εταιρείας προς τον τελικό της προορισμό, τη δημιουργία μοντέλων AI "ικανών για προσομοιώσεις ανοιχτού κόσμου σε πραγματικό χρόνο". Μετά τα μοντέλα βίντεο AI, η Midjourney δηλώνει ότι σχεδιάζει να αναπτύξει μοντέλα AI για την παραγωγή τρισδιάστατων απεικονίσεων, καθώς και μοντέλα AI πραγματικού χρόνου. Η κυκλοφορία του μοντέλου V1 της Midjourney έρχεται μόλις μια εβδομάδα μετά την αγωγή που κατέθεσαν εναντίον της δύο από τα πιο γνωστά κινηματογραφικά στούντιο του Χόλιγουντ: η Disney και η Universal. Η αγωγή ισχυρίζεται ότι εικόνες που δημιουργήθηκαν από τα μοντέλα εικόνας AI της Midjourney απεικονίζουν χαρακτήρες με πνευματικά δικαιώματα των στούντιο, όπως ο Homer Simpson και ο Darth Vader. Τα στούντιο του Χόλιγουντ αντιμετωπίζουν δυσκολίες στην αντιμετώπιση της αυξανόμενης δημοτικότητας των μοντέλων δημιουργίας εικόνας και βίντεο AI, όπως αυτά που αναπτύσσει η Midjourney. Υπάρχει αυξανόμενος φόβος ότι αυτά τα εργαλεία AI θα μπορούσαν να αντικαταστήσουν ή να υποτιμήσουν το έργο των δημιουργών στους αντίστοιχους τομείς τους, και αρκετές εταιρείες μέσων ενημέρωσης έχουν ισχυριστεί ότι αυτά τα προϊόντα εκπαιδεύονται σε έργα τους με πνευματικά δικαιώματα. Παρόλο που η Midjourney προσπάθησε να τοποθετηθεί ως διαφορετική από άλλες νεοφυείς επιχειρήσεις AI εικόνας και βίντεο - εστιάζοντας περισσότερο στη δημιουργικότητα παρά σε άμεσες εμπορικές εφαρμογές - η εταιρεία δεν μπορεί να ξεφύγει από αυτές τις κατηγορίες. Αρχικά, η Midjourney δηλώνει ότι θα χρεώνει 8 φορές περισσότερο για μια δημιουργία βίντεο από μια τυπική δημιουργία εικόνας, που σημαίνει ότι οι συνδρομητές θα εξαντλούν το μηνιαίο επιτρεπόμενο όριο δημιουργιών τους σημαντικά γρηγορότερα όταν δημιουργούν βίντεο αντί για εικόνες. Κατά την κυκλοφορία, ο φθηνότερος τρόπος για να δοκιμάσει κανείς το V1 είναι εγγραφόμενος στο πρόγραμμα Basic της Midjourney με κόστος 10 δολάρια το μήνα. Οι συνδρομητές του προγράμματος Pro με κόστος 60 δολάρια το μήνα και του προγράμματος Mega με κόστος 120 δολάρια το μήνα θα έχουν απεριόριστες δημιουργίες βίντεο στην πιο αργή λειτουργία "Relax" της εταιρείας. Τον επόμενο μήνα, η Midjourney δηλώνει ότι θα επανεξετάσει την τιμολόγηση για τα μοντέλα βίντεο. Το V1 έρχεται με μερικές προσαρμοσμένες ρυθμίσεις που επιτρέπουν στους χρήστες να ελέγχουν τα αποτελέσματα του μοντέλου βίντεο. Οι χρήστες μπορούν να επιλέξουν μια αυτόματη ρύθμιση animation για να κάνουν μια εικόνα να κινείται τυχαία, ή μπορούν να επιλέξουν μια χειροκίνητη ρύθμιση που επιτρέπει στους χρήστες να περιγράψουν, με κείμενο, ένα συγκεκριμένο animation που θέλουν να προσθέσουν στο βίντεό τους. Οι χρήστες μπορούν επίσης να ρυθμίσουν την ποσότητα κίνησης της κάμερας και του θέματος επιλέγοντας "χαμηλή κίνηση" ή "υψηλή κίνηση" στις ρυθμίσεις. Ενώ τα βίντεο που δημιουργούνται με το V1 διαρκούν μόνο πέντε δευτερόλεπτα, οι χρήστες μπορούν να επιλέξουν να τα επεκτείνουν κατά τέσσερα δευτερόλεπτα έως και τέσσερις φορές, που σημαίνει ότι τα βίντεο V1 θα μπορούσαν να φτάσουν τα 21 δευτερόλεπτα. Όπως και τα μοντέλα εικόνας AI της Midjourney, τα πρώτα δείγματα βίντεο του V1 φαίνονται κάπως εξωπραγματικά, παρά υπερρεαλιστικά. Η αρχική ανταπόκριση στο V1 ήταν θετική, αν και δεν είναι ακόμα σαφές πόσο καλά συγκρίνεται με άλλα κορυφαία μοντέλα βίντεο AI, τα οποία είναι στην αγορά για μήνες ή ακόμα και χρόνια.
- 15 σχόλια
-
- 1
-
-
- Midjourney
- Sora
-
(και 1 περισσότερα)
Ετικέτα με:
-
Η τελευταία γεννήτρια βίντεο με τεχνητή νοημοσύνη της εταιρείας έγινε viral για όλους τους σωστούς (και μερικές φορές ανησυχητικούς) λόγους. Με τη νέα του έκδοση, το Veo έλαβε μια τεράστια αναβάθμιση με τη μορφή εγγενούς παραγωγής ήχου και πλέον μπορείτε να δημιουργήσετε τα πάντα, από αφηγήσεις μέχρι ολόκληρα κλιπ που περιλαμβάνουν, μουσική, ήχους περιβάλλοντος, διαλόγους και άλλα, απλώς περιγράφοντας τι θέλετε να ακούσετε στις προτροπές (prompts). Το Veo 3 είναι επί του παρόντος διαθέσιμο στους συνδρομητές του Google AI Ultra στις ΗΠΑ μέσω της εφαρμογής Gemini ή μέσω του νέου εργαλείου δημιουργίας μίνι ταινίων της εταιρείας που ονομάζεται Flow. Υποστηρίζει δημιουργία βίντεο από κείμενο, από εικόνα και μέσω προτροπών, και τα αποτελέσματα είναι τρομακτικά αληθινά! Είναι το είδος του περιεχομένου που μπορεί να προσπεράσετε χωρίς καν να συνειδητοποιήσετε ότι δημιουργήθηκε από τεχνητή νοημοσύνη. Παρακάτω είναι μερικά από τα πιο viral, παράξενα και απίστευτα ρεαλιστικά βίντεο Veo 3 που κυκλοφορούν στα μέσα κοινωνικής δικτύωσης αυτή τη στιγμή, τα οποία πρέπει να δείτε για να τα πιστέψετε. Άνθρωποι που γνωρίζουν ότι δημιουργήθηκαν από AI Τα παρακάτω κλιπ παρουσιάζουν ανατριχιαστικά ανθρώπινους χαρακτήρες που είτε γνωρίζουν είτε αρνούνται να πιστέψουν ότι δημιουργήθηκαν με προτροπές. Ένα άλλο βίντεο φαντάζεται χαρακτήρες τεχνητής νοημοσύνης που συνειδητοποιούν την ύπαρξή τους ως συνθετικά όντα. Και τα δύο βίντεο είναι ολίγον ανατριχιαστικά, έχοντας -μεταξύ άλλων- και κινηματογραφικό feeling. Μια διαφήμιση αντικαταθλιπτικών φιλική προς τα γούνινα ζώα Πρόκειται για μια πλήρως ψεύτικη φαρμακευτική διαφήμιση για ένα αντικαταθλιπτικό που προσελκύει...σκύλους. Τα πάντα, από την υποκριτική μέχρι τη μελαγχολική μουσική, τον φωτισμό, το φόντο, ακόμη και τα κουτάβια, έχουν δημιουργηθεί με τεχνητή νοημοσύνη. Ανύπαρκτες συνεντεύξεις σε έκθεση αυτοκινήτων Tο συγκεκριμένο βίντεο παρουσιάζει ρεαλιστικούς παρουσιαστές που παίρνουν συνέντευξη από ψεύτικους επισκέπτες για ψεύτικα αυτοκίνητα σε μια ψεύτικη έκθεση αυτοκινήτων. Είναι δύσκολο για κάποιον τουλάχιστον άμεσα να διακρίνει ότι τα πάντα σε αυτό το βίντεο είναι ψεύτικα, συμπεριλαμβανομένου του πλήθους, των κινήσεων της κάμερας, του φωτισμού, των αυτοκινήτων, ακόμη και των μωρών σε καροτσάκια. Ο Will Smith τρώει μακαρόνια (ξανά) Κάποιος έπρεπε να το κάνει...ξανά. Σε αυτό το σημείο, έχει γίνει παράδοση κάθε φορά που κυκλοφορεί μια νέα γεννήτρια βίντεο τεχνητής νοημοσύνης, κάποιος να αναδημιουργεί το διαβόητο βίντεο "Ο Will Smith τρώει μακαρόνια". Με το Veo 3, η σκηνή τώρα περιλαμβάνει πλήρεις ήχους μασίματος, αν και όχι ρεαλιστικούς. Ενώ η ομοιότητα του προσώπου με τον Smith εξακολουθεί να μην είναι τέλεια, το αποτέλεσμα είναι ακόμα διασκεδαστικό. Το ντοκιμαντέρ για δημιουργία μουσικού οργάνου Μια ταινία μικρού μήκους που καταγράφει έναν καλλιτέχνη mixed-media που κατασκευάζει ένα μουσικό όργανο εμπνευσμένο από μια εθνοτική ομάδα στο Βιετνάμ. Η αφήγηση, η μουσική υπόκρουση, οι ήχοι, ακόμη και τα σχόλια του καλλιτέχνη, όλα έχουν δημιουργηθεί από τεχνητή νοημοσύνη. Μοιάζει με κάτι που θα βλέπατε στο Netflix, μέχρι να συνειδητοποιήσετε ότι τίποτα από αυτά δεν είναι πραγματικό. Είναι σαφές ότι εργαλεία όπως το Veo 3 έχουν απίστευτες δυνατότητες. Διαφημιστές, κινηματογραφιστές, εκπαιδευτικοί, καλλιτέχνες και πρακτικά οποιοσδήποτε άλλος μπορεί πλέον να δημιουργήσει ολόκληρες βιντεοπαραγωγές χωρίς ποτέ να πιάσει κάμερα ή να προσλάβει συνεργείο. Παρόλα αυτά, αυτού του είδους το περιεχόμενο τεχνητής νοημοσύνης που είναι αρκετά ρεαλιστικό, συνοδεύεται επίσης από κινδύνους παραπληροφόρησης και συναίνεσης στη δημιουργία μέσων. Σε κάθε περίπτωση το κουτί της Πανδώρας είναι πλέον ανοιχτό.