Αναζήτηση στην κοινότητα

Εμφάνιση αποτελεσμάτων για τις ετικέτες 'Veo'.

14 αποτελέσματα

ΤΑΞΙΝΟΜΗΣΗ με
- Ημερομηνία
- Σχετικότητα

Η Google ανακοίνωσε το Veo 3.1 με βελτιωμένο ήχο και ρεαλισμό

nchatz δημοσίευσε ένα άρθρο στο Google

Το ενημερωμένο μοντέλο θα είναι διαθέσιμο σε όλο το οικοσύστημα της Google, συμπεριλαμβανομένου του εργαλείου δημιουργίας μίνι ταινιών, Flow, όπου θα ξεκλειδώσει επιπλέον λειτουργίες. Παράλληλα, η Google προσθέτει μια παραλλαγή "Fast" του Veo για όσους ανησυχούν για το κόστος δημιουργίας βίντεο με τεχνητή νοημοσύνη. Το Veo προκάλεσε αίσθηση όταν κυκλοφόρησε νωρίτερα φέτος, επιδεικνύοντας εντυπωσιακή βελτίωση στην ποιότητα βίντεο με τεχνητή νοημοσύνη μόλις λίγους μήνες μετά την κυκλοφορία του Veo 2. Το γεγονός ότι η Google διαθέτει τεράστιο όγκο βίντεο στο YouTube είναι πολύ χρήσιμο για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης, με αποτέλεσμα η εταιρεία να προχωρά ήδη στο Veo 3.1 με πληθώρα νέων χαρακτηριστικών. Η Google είχε δηλώσει προηγουμένως ότι θα φέρει τα εργαλεία βίντεο του Veo στα YouTube Shorts, τα οποία χρησιμοποιούν κάθετη μορφή βίντεο όπως το TikTok. Η κυκλοφορία του Veo 3.1 πιθανότατα ανοίγει την πόρτα για την εκπλήρωση αυτής της υπόσχεσης. Τα βίντεο που δημιουργούνται με το Veo αναμένεται να εμφανίζονται πιο συχνά και στο TikTok τώρα που ταιριάζουν στη μορφή των βίντεο που κυριαρχούν στην υπηρεσία. Η κυκλοφορία του Veo 3.1 βάζει τη Google σε ευθύ ανταγωνισμό με την OpenAI, η οποία κυκλοφόρησε πρόσφατα τη δεύτερη έκδοση μαζί με την εφαρμογή Sora για iPhone με εντυπωσιακά αποτελέσματα. Οι χρήστες θα μπορούν να δημιουργούν περιεχόμενο με το Veo 3.1 και το Veo 3.1 Fast μέσω της εφαρμογής Gemini, ενώ οι προγραμματιστές θα έχουν πρόσβαση στο Vertex AI και μέσω του Gemini API. Η χρήση της παραλλαγής Fast θα βοηθήσει στη μείωση του κόστους κατά την πληρωμή ανά token. Τα χαρακτηριστικά Ingredients to Video, Frames to Video και Extend είναι πλέον όλα συμβατά με παραγόμενο ήχο. Έτσι, οι χρήστες μπορούν να ανεβάσουν πολλαπλές εικόνες ως αναφορά ή να χρησιμοποιήσουν εικόνες ως σημείο έναρξης ή λήξης ενώ προσθέτουν παράλληλα προσαρμοσμένο ήχο στο κλιπ. Υπάρχουν επίσης ορισμένες εντελώς νέες λειτουργίες βίντεο που έρχονται με το Veo 3.1. Σύμφωνα με τη Google, το Veo 3.1 είναι καλύτερο στην αναπαραγωγή της εμφάνισης ενός βίντεο ενώ κάνει "ακριβείς" επεξεργασίες. Για παράδειγμα οι χρήστες θα μπορούν να προσθέσουν ένα αντικείμενο σε ένα κλιπ διατηρώντας το υπόλοιπο αμετάβλητο. Παρομοίως, μπορούν να αφαιρέσουν ένα στοιχείο χωρίς να αλλάξουν την υπόλοιπη σκηνή. Η προσθήκη αντικειμένων θα είναι άμεσα διαθέσιμη στο Flow και στο API. Η αφαίρεση αντικειμένων δεν θα είναι ακόμα διαθέσιμη στο Flow, αλλά η Google αναφέρει ότι η συγκεκριμένη λειτουργία θα κυκλοφορήσει σύντομα.
Η Google ανακοίνωσε το Veo 3.1 με βελτιωμένο ήχο και ρεαλισμό

nchatz δημοσίευσε θέμα στο Νέα

Η Google ανακοίνωσε το Veo 3.1, το νέο μοντέλο βίντεο με τεχνητή νοημοσύνη που υπόσχεται βελτιωμένο ήχο, ρεαλισμό και μεγαλύτερη ακρίβεια στις εντολές των χρηστών. Το ενημερωμένο μοντέλο θα είναι διαθέσιμο σε όλο το οικοσύστημα της Google, συμπεριλαμβανομένου του εργαλείου δημιουργίας μίνι ταινιών, Flow, όπου θα ξεκλειδώσει επιπλέον λειτουργίες. Παράλληλα, η Google προσθέτει μια παραλλαγή "Fast" του Veo για όσους ανησυχούν για το κόστος δημιουργίας βίντεο με τεχνητή νοημοσύνη. Το Veo προκάλεσε αίσθηση όταν κυκλοφόρησε νωρίτερα φέτος, επιδεικνύοντας εντυπωσιακή βελτίωση στην ποιότητα βίντεο με τεχνητή νοημοσύνη μόλις λίγους μήνες μετά την κυκλοφορία του Veo 2. Το γεγονός ότι η Google διαθέτει τεράστιο όγκο βίντεο στο YouTube είναι πολύ χρήσιμο για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης, με αποτέλεσμα η εταιρεία να προχωρά ήδη στο Veo 3.1 με πληθώρα νέων χαρακτηριστικών. Η Google είχε δηλώσει προηγουμένως ότι θα φέρει τα εργαλεία βίντεο του Veo στα YouTube Shorts, τα οποία χρησιμοποιούν κάθετη μορφή βίντεο όπως το TikTok. Η κυκλοφορία του Veo 3.1 πιθανότατα ανοίγει την πόρτα για την εκπλήρωση αυτής της υπόσχεσης. Τα βίντεο που δημιουργούνται με το Veo αναμένεται να εμφανίζονται πιο συχνά και στο TikTok τώρα που ταιριάζουν στη μορφή των βίντεο που κυριαρχούν στην υπηρεσία. Η κυκλοφορία του Veo 3.1 βάζει τη Google σε ευθύ ανταγωνισμό με την OpenAI, η οποία κυκλοφόρησε πρόσφατα τη δεύτερη έκδοση μαζί με την εφαρμογή Sora για iPhone με εντυπωσιακά αποτελέσματα. Οι χρήστες θα μπορούν να δημιουργούν περιεχόμενο με το Veo 3.1 και το Veo 3.1 Fast μέσω της εφαρμογής Gemini, ενώ οι προγραμματιστές θα έχουν πρόσβαση στο Vertex AI και μέσω του Gemini API. Η χρήση της παραλλαγής Fast θα βοηθήσει στη μείωση του κόστους κατά την πληρωμή ανά token. Τα χαρακτηριστικά Ingredients to Video, Frames to Video και Extend είναι πλέον όλα συμβατά με παραγόμενο ήχο. Έτσι, οι χρήστες μπορούν να ανεβάσουν πολλαπλές εικόνες ως αναφορά ή να χρησιμοποιήσουν εικόνες ως σημείο έναρξης ή λήξης ενώ προσθέτουν παράλληλα προσαρμοσμένο ήχο στο κλιπ. Υπάρχουν επίσης ορισμένες εντελώς νέες λειτουργίες βίντεο που έρχονται με το Veo 3.1. Σύμφωνα με τη Google, το Veo 3.1 είναι καλύτερο στην αναπαραγωγή της εμφάνισης ενός βίντεο ενώ κάνει "ακριβείς" επεξεργασίες. Για παράδειγμα οι χρήστες θα μπορούν να προσθέσουν ένα αντικείμενο σε ένα κλιπ διατηρώντας το υπόλοιπο αμετάβλητο. Παρομοίως, μπορούν να αφαιρέσουν ένα στοιχείο χωρίς να αλλάξουν την υπόλοιπη σκηνή. Η προσθήκη αντικειμένων θα είναι άμεσα διαθέσιμη στο Flow και στο API. Η αφαίρεση αντικειμένων δεν θα είναι ακόμα διαθέσιμη στο Flow, αλλά η Google αναφέρει ότι η συγκεκριμένη λειτουργία θα κυκλοφορήσει σύντομα. Διαβάστε ολόκληρο το άρθρο
- Πέμπτη στις 05:54 μμ
- 1 απάντηση
- - Google
  - Veo
Η Ιαπωνία χρησιμοποιεί AI βίντεο για να προειδοποίησει για τις επιπτώσεις από πιθανή έκρηξη του ηφαιστείου στο όρος Φούτζι

nchatz δημοσίευσε θέμα στο Νέα

Η Ιαπωνία κυκλοφόρησε ένα βίντεο δημιουργημένο από τεχνητή νοημοσύνη, το οποίο απεικονίζει την έκρηξη του όρους Φούτζι, προκειμένου να προειδοποιήσει τους κατοίκους του Τόκιο για τον κίνδυνο μιας πιθανής καταστροφής. Το βίντεο παρουσιάζει την έκρηξη του ηφαιστείου με μια στήλη καπνού να υψώνεται και στη συνέχεια τέφρα να εξαπλώνεται σε απόσταση 100 χλμ. μέχρι το Τόκιο. Στη συνέχεια, εμφανίζει προβλήματα όπως διακοπές ρεύματος και δυσκολίες στη διανομή τροφίμων ως συνέπειες της έκρηξης. Με αυτόν τον τρόπο, η Ιαπωνία επιδιώκει να ενημερώσει το κοινό για τις πιθανές επιπτώσεις μιας τέτοιας φυσικής καταστροφής, χρησιμοποιώντας σύγχρονα εργαλεία τεχνολογίας. Η χρήση τεχνητής νοημοσύνης σε τέτοια σενάρια αποδεικνύεται ιδιαίτερα χρήσιμη, καθώς επιτρέπει την οπτικοποίηση ακραίων καταστάσεων με ρεαλιστικό τρόπο. Στην περίπτωση αυτή, το βίντεο λειτουργεί ως μέσο ευαισθητοποίησης, ώστε οι πολίτες να αντιληφθούν τη σοβαρότητα των συνεπειών και να προετοιμαστούν κατάλληλα. Η Ιαπωνία, γνωρίζοντας ότι το όρος Φούτζι παραμένει ανενεργό για μεγάλο χρονικό διάστημα, θέλει να διασφαλίσει ότι όλοι είναι έτοιμοι για οποιαδήποτε εξέλιξη, με την τεχνολογία να συμβάλει στην πρόληψη και την ενημέρωση σε θέματα φυσικών κινδύνων. Πέρα από την τοπική σημασία, η πρωτοβουλία αυτή ανοίγει δρόμους για ευρύτερη εφαρμογή της τεχνητής νοημοσύνης σε στρατηγικές προετοιμασίας για καταστροφές. Άλλες χώρες θα μπορούσαν να υιοθετήσουν παρόμοιες μεθόδους, χρησιμοποιώντας βίντεο δημιουργημένα από AI για να παρουσιάσουν σενάρια δυσάρεστων καταστάσεων. Παρόμοιες κινήσεις θα παρείχαν σημαντική βοήθεια στο να γίνουν οι πολίτες πιο συνειδητοποιημένοι και να μην υποτιμούν πιθανούς κινδύνους, ιδιαίτερα σε θέματα ασφάλειας. Η προσβασιμότητα των εργαλείων δημιουργίας βίντεο μέσω τεχνητής νοημοσύνης αυξάνεται συνεχώς, κάνοντας τέτοιες δημιουργίες διαθέσιμες σε όλους. Για παράδειγμα, το Google Gemini προσφέρει τη δυνατότητα δοκιμής του Veo 3, ενός προϊόντος που μετατρέπει κείμενο σε βίντεο διάρκειας οκτώ δευτερολέπτων. Παρομοίως, το Grok επιτρέπει τη χρήση του Grok Imagine για παραγωγή βίντεο από κείμενο ή εικόνες, με δυνατότητα ελέγχου του τόνου. Αυτή η λειτουργία είναι δωρεάν για όλους τους χρήστες σε iOS και Android. Με τέτοια εργαλεία, οποιοσδήποτε μπορεί να παράγει περιεχόμενο παρόμοιο με αυτό που χρησιμοποίησε η Ιαπωνία, χωρίς να απαιτούνται προχωρημένες γνώσεις, με το κόστος να παραμένει σε εξαιρετικά χαμηλά επίπεδα. Παλαιότερα, χαρακτηριστικά όπως η παραγωγή φωτογραφιών και βίντεο ήταν διαθέσιμα μόνο σε όσους πλήρωναν για premium συνδρομές σε AI πλατφόρμες. Τώρα, εταιρείες ανοίγουν αυτές τις δυνατότητες σε όλους, ενισχύοντας τη δημοκρατικοποίηση της τεχνολογίας. Αυτό σημαίνει ότι η δημιουργία εκπαιδευτικού ή προειδοποιητικού υλικού γίνεται πιο εύκολη, επιτρέποντας σε οργανισμούς και άτομα να επικοινωνούν μηνύματα με αποτελεσματικό τρόπο. Η περίπτωση της Ιαπωνίας αποτελεί παράδειγμα πώς η AI μπορεί να μετατρέψει αφηρημένες προειδοποιήσεις σε ζωντανές απεικονίσεις, ενθαρρύνοντας την προετοιμασία. Όπως αναφέρεται και στο βίντεο, το όρος Φούτζι δεν έχει εκραγεί για πάνω από 300 χρόνια ενώ οι επιστήμονες δεν αναφέρουν οποιοδήποτε ανησυχητική ένδειξη. Διαβάστε ολόκληρο το άρθρο
- 31 Αυγούστου
- 15 απαντήσεις
- - τεχνητή νοημοσύνη
  - Veo
  - (και 2 περισσότερα)
    Ετικέτα με:
    
    τεχνητή νοημοσύνη
    
    Veo
    
    Google
    
    Grok
Η Ιαπωνία χρησιμοποιεί AI βίντεο για να προειδοποίησει για τις επιπτώσεις από πιθανή έκρηξη του ηφαιστείου στο όρος Φούτζι

nchatz δημοσίευσε ένα άρθρο στο Πλανήτης

Το βίντεο παρουσιάζει την έκρηξη του ηφαιστείου με μια στήλη καπνού να υψώνεται και στη συνέχεια τέφρα να εξαπλώνεται σε απόσταση 100 χλμ. μέχρι το Τόκιο. Στη συνέχεια, εμφανίζει προβλήματα όπως διακοπές ρεύματος και δυσκολίες στη διανομή τροφίμων ως συνέπειες της έκρηξης. Με αυτόν τον τρόπο, η Ιαπωνία επιδιώκει να ενημερώσει το κοινό για τις πιθανές επιπτώσεις μιας τέτοιας φυσικής καταστροφής, χρησιμοποιώντας σύγχρονα εργαλεία τεχνολογίας. Η χρήση τεχνητής νοημοσύνης σε τέτοια σενάρια αποδεικνύεται ιδιαίτερα χρήσιμη, καθώς επιτρέπει την οπτικοποίηση ακραίων καταστάσεων με ρεαλιστικό τρόπο. Στην περίπτωση αυτή, το βίντεο λειτουργεί ως μέσο ευαισθητοποίησης, ώστε οι πολίτες να αντιληφθούν τη σοβαρότητα των συνεπειών και να προετοιμαστούν κατάλληλα. Η Ιαπωνία, γνωρίζοντας ότι το όρος Φούτζι παραμένει ανενεργό για μεγάλο χρονικό διάστημα, θέλει να διασφαλίσει ότι όλοι είναι έτοιμοι για οποιαδήποτε εξέλιξη, με την τεχνολογία να συμβάλει στην πρόληψη και την ενημέρωση σε θέματα φυσικών κινδύνων. Πέρα από την τοπική σημασία, η πρωτοβουλία αυτή ανοίγει δρόμους για ευρύτερη εφαρμογή της τεχνητής νοημοσύνης σε στρατηγικές προετοιμασίας για καταστροφές. Άλλες χώρες θα μπορούσαν να υιοθετήσουν παρόμοιες μεθόδους, χρησιμοποιώντας βίντεο δημιουργημένα από AI για να παρουσιάσουν σενάρια δυσάρεστων καταστάσεων. Παρόμοιες κινήσεις θα παρείχαν σημαντική βοήθεια στο να γίνουν οι πολίτες πιο συνειδητοποιημένοι και να μην υποτιμούν πιθανούς κινδύνους, ιδιαίτερα σε θέματα ασφάλειας. Η προσβασιμότητα των εργαλείων δημιουργίας βίντεο μέσω τεχνητής νοημοσύνης αυξάνεται συνεχώς, κάνοντας τέτοιες δημιουργίες διαθέσιμες σε όλους. Για παράδειγμα, το Google Gemini προσφέρει τη δυνατότητα δοκιμής του Veo 3, ενός προϊόντος που μετατρέπει κείμενο σε βίντεο διάρκειας οκτώ δευτερολέπτων. Παρομοίως, το Grok επιτρέπει τη χρήση του Grok Imagine για παραγωγή βίντεο από κείμενο ή εικόνες, με δυνατότητα ελέγχου του τόνου. Αυτή η λειτουργία είναι δωρεάν για όλους τους χρήστες σε iOS και Android. Με τέτοια εργαλεία, οποιοσδήποτε μπορεί να παράγει περιεχόμενο παρόμοιο με αυτό που χρησιμοποίησε η Ιαπωνία, χωρίς να απαιτούνται προχωρημένες γνώσεις, με το κόστος να παραμένει σε εξαιρετικά χαμηλά επίπεδα. Παλαιότερα, χαρακτηριστικά όπως η παραγωγή φωτογραφιών και βίντεο ήταν διαθέσιμα μόνο σε όσους πλήρωναν για premium συνδρομές σε AI πλατφόρμες. Τώρα, εταιρείες ανοίγουν αυτές τις δυνατότητες σε όλους, ενισχύοντας τη δημοκρατικοποίηση της τεχνολογίας. Αυτό σημαίνει ότι η δημιουργία εκπαιδευτικού ή προειδοποιητικού υλικού γίνεται πιο εύκολη, επιτρέποντας σε οργανισμούς και άτομα να επικοινωνούν μηνύματα με αποτελεσματικό τρόπο. Η περίπτωση της Ιαπωνίας αποτελεί παράδειγμα πώς η AI μπορεί να μετατρέψει αφηρημένες προειδοποιήσεις σε ζωντανές απεικονίσεις, ενθαρρύνοντας την προετοιμασία. Όπως αναφέρεται και στο βίντεο, το όρος Φούτζι δεν έχει εκραγεί για πάνω από 300 χρόνια ενώ οι επιστήμονες δεν αναφέρουν οποιοδήποτε ανησυχητική ένδειξη.
- 31 Αυγούστου
- 15 σχόλια
- - 4
- - τεχνητή νοημοσύνη
  - Veo
  - (και 2 περισσότερα)
    Ετικέτα με:
    
    τεχνητή νοημοσύνη
    
    Veo
    
    Google
    
    Grok
Δωρεάν πρόσβαση στο Veo 3 της Google για περιορισμένο χρόνο

nchatz δημοσίευσε θέμα στο Νέα

Η Google ανακοίνωσε την προσωρινή διάθεση του Veo 3 για όλους τους χρήστες της εφαρμογής Gemini, συμπεριλαμβανομένων των μη συνδρομητών, μέχρι το τέλος του Σαββατοκύριακου (22:00 PT). Σύμφωνα με την ανακοίνωση, οι χρήστες θα έχουν τη δυνατότητα να δημιουργήσουν μόνο τρία βίντεο από την αρχή του Σαββάτου μέχρι τις πρώτες πρωινές ώρες της Δευτέρας (ώρα Ελλάδος). Η λειτουργία δημιουργίας βίντεο Veo 3 αποτέλεσε σημαντική καινοτομία για την Google Gemini. Αρχικά, η δυνατότητα ήταν διαθέσιμη μόνο για τους συνδρομητές του προγράμματος Google AI Ultra. Τον Μάιο, επεκτάθηκε στο πρόγραμμα AI Pro που κοστίζει $20 το μήνα, διευρύνοντας έτσι το κοινό που μπορεί να χρησιμοποιήσει αυτό το εργαλείο. O Josh Woodward, επικεφαλής του Gemini και των Google Labs, αποκάλυψε την Πέμπτη ότι η ομάδα ετοίμαζε "μεγάλο αριθμό TPUs" κάτι που τώρα γνωρίζουμε ότι αφορούσε αυτή την προωθητική ενέργεια του Σαββατοκύριακου για τους δωρεάν χρήστες του Gemini. Ένας δωρεάν λογαριασμός έχει ήδη πρόσβαση στο Veo 3 Fast (Preview) στις εφαρμογές Gemini για κινητά και στο διαδίκτυο (gemini.google.com). Όταν η λειτουργία είναι διαθέσιμη, το Gemini υποδέχεται τους χρήστες με ένα μήνυμα σχετικά με τη συμπερίληψη ήχου στα βίντεο Veo 3, με το τελικό αποτέλεσμα να υποστηρίζει ακόμα και διαλόγους στηνν ελληνική γλώσσα. Το κείμενο στο κάτω μέρος αυτού του πλαισίου αναφέρει επίσης την πρόσβαση στο Veo 3 μόνο για το Σαββατοκύριακο. Παρόμοιο μήνυμα εμφανίζεται και κατά το άνοιγμα της διαδικτυακής εφαρμογής Gemini. H προσφορά αποτελεί μια εξαιρετική ευκαιρία για τους χρήστες να εξοικειωθούν με τα σύντομα βίντεο που δημιουργούνται με τεχνητή νοημοσύνη, ειδικά αν δεν τα έχουν δοκιμάσει στο παρελθόν. Παρόλο που κάποιος θα μπορούσε να υποστηρίξει ότι τρία βίντεο σε σύντομο χρονικό διάστημα δεν επαρκούν για να αποκτήσει κανείς μια πλήρη εικόνα των δυνατοτήτων του Veo 3, το σχέδιο της Google είναι προφανώς να προσελκύσει χρήστες στο εργαλείο και ενδεχομένως να τους μετατρέψει σε συνδρομητές επί πληρωμή. Περιορισμοί υπάρχουν επίσης για τους συνδρομητές, αν και είναι ελαφρώς πιο ευέλικτοι. Οι συνδρομητές του προγράμματος Google AI Pro λαμβάνουν τρεις δημιουργίες βίντεο ανά ημέρα με το Veo 3 Fast, αλλά θα έχουν πρόσβαση μόνο στη δημιουργία βίντεο βασισμένη στο Veo 2 μέχρι να επανέλθει το όριο. Εν τω μεταξύ, το πρόγραμμα Google AI Ultra που κοστίζει $250 το μήνα προσφέρει σημαντικά υψηλότερο όριο αιτημάτων, αν και δεν είναι απεριόριστο. Για να δοκιμάσετε το Veo 3, μεταβείτε στην εφαρμογή Gemini για κινητά ή στο διαδίκτυο, πατήστε την επιλογή Βίντεο στη γραμμή προτροπής. Μπορείτε επίσης να το εντοπίσετε πατώντας το μενού τριών κουκκίδων στη γραμμή προτροπής. Παρά τα οφέλη αυτού του εργαλείου, υπάρχει πάντα το ενδεχόμενο κατάχρησης, όπως συμβαίνει με οποιοδήποτε προϊόν τεχνητής νοημοσύνης. Για τον μετριασμό τέτοιων προβλημάτων, κάθε βίντεο που δημιουργείται από το Gemini περιλαμβάνει ένα ψηφιακό υδατογράφημα SynthID, ενώ υπάρχει επίσης ένα ορατό υδατογράφημα Veo στα παραγόμενα βίντεο. View full article
- 23 Αυγούστου
- 12 απαντήσεις
- - Google
  - Veo
Δωρεάν πρόσβαση στο Veo 3 της Google για περιορισμένο χρόνο

nchatz δημοσίευσε ένα άρθρο στο Google

Σύμφωνα με την ανακοίνωση, οι χρήστες θα έχουν τη δυνατότητα να δημιουργήσουν μόνο τρία βίντεο από την αρχή του Σαββάτου μέχρι τις πρώτες πρωινές ώρες της Δευτέρας (ώρα Ελλάδος). Η λειτουργία δημιουργίας βίντεο Veo 3 αποτέλεσε σημαντική καινοτομία για την Google Gemini. Αρχικά, η δυνατότητα ήταν διαθέσιμη μόνο για τους συνδρομητές του προγράμματος Google AI Ultra. Τον Μάιο, επεκτάθηκε στο πρόγραμμα AI Pro που κοστίζει $20 το μήνα, διευρύνοντας έτσι το κοινό που μπορεί να χρησιμοποιήσει αυτό το εργαλείο. O Josh Woodward, επικεφαλής του Gemini και των Google Labs, αποκάλυψε την Πέμπτη ότι η ομάδα ετοίμαζε "μεγάλο αριθμό TPUs" κάτι που τώρα γνωρίζουμε ότι αφορούσε αυτή την προωθητική ενέργεια του Σαββατοκύριακου για τους δωρεάν χρήστες του Gemini. Ένας δωρεάν λογαριασμός έχει ήδη πρόσβαση στο Veo 3 Fast (Preview) στις εφαρμογές Gemini για κινητά και στο διαδίκτυο (gemini.google.com). Όταν η λειτουργία είναι διαθέσιμη, το Gemini υποδέχεται τους χρήστες με ένα μήνυμα σχετικά με τη συμπερίληψη ήχου στα βίντεο Veo 3, με το τελικό αποτέλεσμα να υποστηρίζει ακόμα και διαλόγους στηνν ελληνική γλώσσα. Το κείμενο στο κάτω μέρος αυτού του πλαισίου αναφέρει επίσης την πρόσβαση στο Veo 3 μόνο για το Σαββατοκύριακο. Παρόμοιο μήνυμα εμφανίζεται και κατά το άνοιγμα της διαδικτυακής εφαρμογής Gemini. H προσφορά αποτελεί μια εξαιρετική ευκαιρία για τους χρήστες να εξοικειωθούν με τα σύντομα βίντεο που δημιουργούνται με τεχνητή νοημοσύνη, ειδικά αν δεν τα έχουν δοκιμάσει στο παρελθόν. Παρόλο που κάποιος θα μπορούσε να υποστηρίξει ότι τρία βίντεο σε σύντομο χρονικό διάστημα δεν επαρκούν για να αποκτήσει κανείς μια πλήρη εικόνα των δυνατοτήτων του Veo 3, το σχέδιο της Google είναι προφανώς να προσελκύσει χρήστες στο εργαλείο και ενδεχομένως να τους μετατρέψει σε συνδρομητές επί πληρωμή. Περιορισμοί υπάρχουν επίσης για τους συνδρομητές, αν και είναι ελαφρώς πιο ευέλικτοι. Οι συνδρομητές του προγράμματος Google AI Pro λαμβάνουν τρεις δημιουργίες βίντεο ανά ημέρα με το Veo 3 Fast, αλλά θα έχουν πρόσβαση μόνο στη δημιουργία βίντεο βασισμένη στο Veo 2 μέχρι να επανέλθει το όριο. Εν τω μεταξύ, το πρόγραμμα Google AI Ultra που κοστίζει $250 το μήνα προσφέρει σημαντικά υψηλότερο όριο αιτημάτων, αν και δεν είναι απεριόριστο. Για να δοκιμάσετε το Veo 3, μεταβείτε στην εφαρμογή Gemini για κινητά ή στο διαδίκτυο, πατήστε την επιλογή Βίντεο στη γραμμή προτροπής. Μπορείτε επίσης να το εντοπίσετε πατώντας το μενού τριών κουκκίδων στη γραμμή προτροπής. Παρά τα οφέλη αυτού του εργαλείου, υπάρχει πάντα το ενδεχόμενο κατάχρησης, όπως συμβαίνει με οποιοδήποτε προϊόν τεχνητής νοημοσύνης. Για τον μετριασμό τέτοιων προβλημάτων, κάθε βίντεο που δημιουργείται από το Gemini περιλαμβάνει ένα ψηφιακό υδατογράφημα SynthID, ενώ υπάρχει επίσης ένα ορατό υδατογράφημα Veo στα παραγόμενα βίντεο.
- 23 Αυγούστου
- 12 σχόλια
- - 4
- - Google
  - Veo
Νέα δυνατότητα του Gemini AI μετατρέπει στατικές εικόνες σε βίντεο με ήχο

Crash24 δημοσίευσε θέμα στο Νέα

Η Google λανσάρει νέα λειτουργία στο Gemini AI που μετατρέπει φωτογραφίες σε βίντεο με τεχνητή νοημοσύνη, συμπεριλαμβανομένων ήχων και διαλόγων. Η νέα δυνατότητα μετατροπής φωτογραφιών σε βίντεο τροφοδοτείται από το μοντέλο Veo 3 της Google και μπορεί να μετατρέψει εικόνες αναφοράς σε βίντεο οκτώ δευτερολέπτων με ήχο που δημιουργείται από τεχνητή νοημοσύνη, συμπεριλαμβανομένων θορύβων περιβάλλοντος, ήχων και ομιλίας. H ενημέρωση βίντεο του Gemini είναι πλέον διαθέσιμη στους συνδρομητές Google AI Ultra και Pro στη web έκδοση και "σε επιλεγμένες περιοχές" στις οποίες δεν περιλαμβάνεται για την ώρα η χώρα μας. Οι χρήστες του Gemini μπορούν να αποκτήσουν πρόσβαση στη λειτουργία κάνοντας κλικ στην επιλογή "εργαλεία" στη γραμμή προτροπής, επιλέγοντας "βίντεο" και μεταφορτώνοντας τη φωτογραφία τους μαζί με μια περιγραφή κειμένου για το πώς θέλουν να κινηθεί. Μπορούν επίσης να συμπεριληφθούν περιγραφές ήχου για διαλόγους, ηχητικά εφέ και περιβαλλοντικό θόρυβο, τα οποία, όπως αναφέρει η Google, θα είναι "τέλεια συγχρονισμένα με τα οπτικά στοιχεία". Τα τελικά βίντεο παραδίδονται ως αρχεία MP4 με ανάλυση 720p και σε αναλογία 16:9. "Μπορείτε να γίνετε δημιουργικοί ζωντανεύοντας καθημερινά αντικείμενα, δίνοντας ζωή στα σχέδια και τους πίνακές σας ή προσθέτοντας κίνηση σε σκηνές της φύσης", αναφέρει η Google. "Όλες οι δημιουργίες βίντεο περιλαμβάνουν ένα ορατό υδατογράφημα που δείχνει ότι έχουν δημιουργηθεί από τεχνητή νοημοσύνη και ένα αόρατο ψηφιακό υδατογράφημα SynthID." Μια παρόμοια λειτουργία είναι ήδη διαθέσιμη στο Flow, το εργαλείο δημιουργίας ταινιών με τεχνητή νοημοσύνη που ανακοίνωσε η Google τον Μάρτιο, αλλά τώρα οι χρήστες του Gemini μπορούν να ζωντανέψουν τις φωτογραφίες τους χωρίς να χρειάζεται να ανοίξουν άλλη εφαρμογή. Η Google αναφέρει ότι το Flow θα κυκλοφορήσει επίσης "σε επιπλέον 75 χώρες" από σήμερα, παράλληλα με την κυκλοφορία της νέας λειτουργίας βίντεο του Gemini. Διαβάστε ολόκληρο το άρθρο
- 11 Ιουλίου
- 6 απαντήσεις
- - Google
  - Gemini
  - (και 1 περισσότερα)
    Ετικέτα με:
    
    Google
    
    Gemini
    
    Veo
Νέα δυνατότητα του Gemini AI μετατρέπει στατικές εικόνες σε βίντεο με ήχο

Crash24 δημοσίευσε ένα άρθρο στο Google

Η νέα δυνατότητα μετατροπής φωτογραφιών σε βίντεο τροφοδοτείται από το μοντέλο Veo 3 της Google και μπορεί να μετατρέψει εικόνες αναφοράς σε βίντεο οκτώ δευτερολέπτων με ήχο που δημιουργείται από τεχνητή νοημοσύνη, συμπεριλαμβανομένων θορύβων περιβάλλοντος, ήχων και ομιλίας. H ενημέρωση βίντεο του Gemini είναι πλέον διαθέσιμη στους συνδρομητές Google AI Ultra και Pro στη web έκδοση και "σε επιλεγμένες περιοχές" στις οποίες δεν περιλαμβάνεται για την ώρα η χώρα μας. Οι χρήστες του Gemini μπορούν να αποκτήσουν πρόσβαση στη λειτουργία κάνοντας κλικ στην επιλογή "εργαλεία" στη γραμμή προτροπής, επιλέγοντας "βίντεο" και μεταφορτώνοντας τη φωτογραφία τους μαζί με μια περιγραφή κειμένου για το πώς θέλουν να κινηθεί. Μπορούν επίσης να συμπεριληφθούν περιγραφές ήχου για διαλόγους, ηχητικά εφέ και περιβαλλοντικό θόρυβο, τα οποία, όπως αναφέρει η Google, θα είναι "τέλεια συγχρονισμένα με τα οπτικά στοιχεία". Τα τελικά βίντεο παραδίδονται ως αρχεία MP4 με ανάλυση 720p και σε αναλογία 16:9. "Μπορείτε να γίνετε δημιουργικοί ζωντανεύοντας καθημερινά αντικείμενα, δίνοντας ζωή στα σχέδια και τους πίνακές σας ή προσθέτοντας κίνηση σε σκηνές της φύσης", αναφέρει η Google. "Όλες οι δημιουργίες βίντεο περιλαμβάνουν ένα ορατό υδατογράφημα που δείχνει ότι έχουν δημιουργηθεί από τεχνητή νοημοσύνη και ένα αόρατο ψηφιακό υδατογράφημα SynthID." Μια παρόμοια λειτουργία είναι ήδη διαθέσιμη στο Flow, το εργαλείο δημιουργίας ταινιών με τεχνητή νοημοσύνη που ανακοίνωσε η Google τον Μάρτιο, αλλά τώρα οι χρήστες του Gemini μπορούν να ζωντανέψουν τις φωτογραφίες τους χωρίς να χρειάζεται να ανοίξουν άλλη εφαρμογή. Η Google αναφέρει ότι το Flow θα κυκλοφορήσει επίσης "σε επιπλέον 75 χώρες" από σήμερα, παράλληλα με την κυκλοφορία της νέας λειτουργίας βίντεο του Gemini.
- 11 Ιουλίου
- 6 σχόλια
- - 1
- - Google
  - Gemini
  - (και 1 περισσότερα)
    Ετικέτα με:
    
    Google
    
    Gemini
    
    Veo
Η Google διαθέτει το εντυπωσιακό μοντέλο δημιουργίας βίντεο Veo 3 στην Ελλάδα και σε ολόκληρη την Ευρώπη

Hal9000 δημοσίευσε θέμα στο Νέα

Το εντυπωσιακό μοντέλο δημιουργίας βίντεο της Google, Veo 3, είναι πλέον διαθέσιμο για τους συνδρομητές Gemini Pro, προσφέροντας τη δυνατότητα δημιουργίας βίντεο τριών βίντεο ημερησίως. Το τελευταίο μοντέλο δημιουργίας βίντεο της Google, το Veo 3, είναι πλέον διαθέσιμο για τους χρήστες του Gemini AI Pro σε όλη την Ευρώπη, συμπεριλαμβανομένων της Ελλάδας, με μηνιαίο κόστος €22,99. Το Veo 3 αποτελεί διάδοχο των προηγούμενων μοντέλων δημιουργίας βίντεο της Google. Σύμφωνα με την Google, το σύστημα έχει εκπαιδευτεί σε εκατομμύρια βίντεο του YouTube και μπορεί να δημιουργήσει ρεαλιστικά βιντεοκλίπ βάσει προτροπών κειμένου. Το εργαλείο δεν είναι δωρεάν, όμως οι χρήστες μπορούν να πειραματιστούν με αυτό χωρίς κόστος χρησιμοποιώντας πιστώσεις Google Cloud. Οι χρήστες του Gemini Pro αποκτούν πρόσβαση σε τρεις δημιουργίες βίντεο ανά ημέρα. Το όριο αυτό ανανεώνεται καθημερινά, επιτρέποντας στους συνδρομητές να παράγουν νέο περιεχόμενο τακτικά. Μετά την επίτευξη του ημερήσιου ορίου, οι χρήστες επιστρέφουν στο Veo 2 του οποίου όμως η ποιότητα υπολείπεται σημαντικά σε σχέση με τη νεότερη έκδοση. Το Veo 3 είναι άμεσα διαθέσιμο μέσα από την web έκδοση του Gemini στη διεύθυνση gemini.google.com, ενώ για την ώρα δεν έχει ενεργοποιηθεί στην εφαρμογή του Gemini για iPhone και Android κάτι που αναμένεται να γίνει άμεσα. Η Google εργάζεται εντατικά τους τελευταίους μήνες για τη βελτίωση της τεχνολογίας δημιουργίας βίντεο, με την εταιρεία να ανταγωνίζεται με άλλα παρόμοια εργαλεία, συμπεριλαμβανομένου του Sora της OpenAI. Η πολύ σημαντική διαφορά είναι ότι το Veo 3 μπορεί να δημιουργήσει κλιπ διάρκειας έως οκτώ δευτερολέπτων, συμπεριλαμβανομένου ήχου και ομιλίας σε πολλές γλώσσες, συμπεριλαμβανομένων και των ελληνικών. View full article
- 3 Ιουλίου
- 39 απαντήσεις
- - Google
  - Veo
Η Google διαθέτει το εντυπωσιακό μοντέλο δημιουργίας βίντεο Veo 3 στην Ελλάδα και σε ολόκληρη την Ευρώπη

Hal9000 δημοσίευσε ένα άρθρο στο Google

Το τελευταίο μοντέλο δημιουργίας βίντεο της Google, το Veo 3, είναι πλέον διαθέσιμο για τους χρήστες του Gemini AI Pro σε όλη την Ευρώπη, συμπεριλαμβανομένων της Ελλάδας, με μηνιαίο κόστος €22,99. Το Veo 3 αποτελεί διάδοχο των προηγούμενων μοντέλων δημιουργίας βίντεο της Google. Σύμφωνα με την Google, το σύστημα έχει εκπαιδευτεί σε εκατομμύρια βίντεο του YouTube και μπορεί να δημιουργήσει ρεαλιστικά βιντεοκλίπ βάσει προτροπών κειμένου. Το εργαλείο δεν είναι δωρεάν, όμως οι χρήστες μπορούν να πειραματιστούν με αυτό χωρίς κόστος χρησιμοποιώντας πιστώσεις Google Cloud. Οι χρήστες του Gemini Pro αποκτούν πρόσβαση σε τρεις δημιουργίες βίντεο ανά ημέρα. Το όριο αυτό ανανεώνεται καθημερινά, επιτρέποντας στους συνδρομητές να παράγουν νέο περιεχόμενο τακτικά. Μετά την επίτευξη του ημερήσιου ορίου, οι χρήστες επιστρέφουν στο Veo 2 του οποίου όμως η ποιότητα υπολείπεται σημαντικά σε σχέση με τη νεότερη έκδοση. Το Veo 3 είναι άμεσα διαθέσιμο μέσα από την web έκδοση του Gemini στη διεύθυνση gemini.google.com, ενώ για την ώρα δεν έχει ενεργοποιηθεί στην εφαρμογή του Gemini για iPhone και Android κάτι που αναμένεται να γίνει άμεσα. Η Google εργάζεται εντατικά τους τελευταίους μήνες για τη βελτίωση της τεχνολογίας δημιουργίας βίντεο, με την εταιρεία να ανταγωνίζεται με άλλα παρόμοια εργαλεία, συμπεριλαμβανομένου του Sora της OpenAI. Η πολύ σημαντική διαφορά είναι ότι το Veo 3 μπορεί να δημιουργήσει κλιπ διάρκειας έως οκτώ δευτερολέπτων, συμπεριλαμβανομένου ήχου και ομιλίας σε πολλές γλώσσες, συμπεριλαμβανομένων και των ελληνικών.
- 3 Ιουλίου
- 39 σχόλια
- - 1
- - Google
  - Veo
Το Veo 3 της Google δημιουργεί εντυπωσιακά βίντεο με τη βοήθεια της AI

Crash24 δημοσίευσε θέμα στο Νέα

Η Google ανακοίνωσε το Veo 3 μόλις πριν από λίγες μέρες στο Google I/O 2025, και στο διαδίκτυο υπάρχει αναβρασμός! Η τελευταία γεννήτρια βίντεο με τεχνητή νοημοσύνη της εταιρείας έγινε viral για όλους τους σωστούς (και μερικές φορές ανησυχητικούς) λόγους. Με τη νέα του έκδοση, το Veo έλαβε μια τεράστια αναβάθμιση με τη μορφή εγγενούς παραγωγής ήχου και πλέον μπορείτε να δημιουργήσετε τα πάντα, από αφηγήσεις μέχρι ολόκληρα κλιπ που περιλαμβάνουν, μουσική, ήχους περιβάλλοντος, διαλόγους και άλλα, απλώς περιγράφοντας τι θέλετε να ακούσετε στις προτροπές (prompts). Το Veo 3 είναι επί του παρόντος διαθέσιμο στους συνδρομητές του Google AI Ultra στις ΗΠΑ μέσω της εφαρμογής Gemini ή μέσω του νέου εργαλείου δημιουργίας μίνι ταινίων της εταιρείας που ονομάζεται Flow. Υποστηρίζει δημιουργία βίντεο από κείμενο, από εικόνα και μέσω προτροπών, και τα αποτελέσματα είναι τρομακτικά αληθινά! Είναι το είδος του περιεχομένου που μπορεί να προσπεράσετε χωρίς καν να συνειδητοποιήσετε ότι δημιουργήθηκε από τεχνητή νοημοσύνη. Παρακάτω είναι μερικά από τα πιο viral, παράξενα και απίστευτα ρεαλιστικά βίντεο Veo 3 που κυκλοφορούν στα μέσα κοινωνικής δικτύωσης αυτή τη στιγμή, τα οποία πρέπει να δείτε για να τα πιστέψετε. Άνθρωποι που γνωρίζουν ότι δημιουργήθηκαν από AI Τα παρακάτω κλιπ παρουσιάζουν ανατριχιαστικά ανθρώπινους χαρακτήρες που είτε γνωρίζουν είτε αρνούνται να πιστέψουν ότι δημιουργήθηκαν με προτροπές. Ένα άλλο βίντεο φαντάζεται χαρακτήρες τεχνητής νοημοσύνης που συνειδητοποιούν την ύπαρξή τους ως συνθετικά όντα. Και τα δύο βίντεο είναι ολίγον ανατριχιαστικά, έχοντας -μεταξύ άλλων- και κινηματογραφικό feeling. Μια διαφήμιση αντικαταθλιπτικών φιλική προς τα γούνινα ζώα Πρόκειται για μια πλήρως ψεύτικη φαρμακευτική διαφήμιση για ένα αντικαταθλιπτικό που προσελκύει...σκύλους. Τα πάντα, από την υποκριτική μέχρι τη μελαγχολική μουσική, τον φωτισμό, το φόντο, ακόμη και τα κουτάβια, έχουν δημιουργηθεί με τεχνητή νοημοσύνη. Ανύπαρκτες συνεντεύξεις σε έκθεση αυτοκινήτων Tο συγκεκριμένο βίντεο παρουσιάζει ρεαλιστικούς παρουσιαστές που παίρνουν συνέντευξη από ψεύτικους επισκέπτες για ψεύτικα αυτοκίνητα σε μια ψεύτικη έκθεση αυτοκινήτων. Είναι δύσκολο για κάποιον τουλάχιστον άμεσα να διακρίνει ότι τα πάντα σε αυτό το βίντεο είναι ψεύτικα, συμπεριλαμβανομένου του πλήθους, των κινήσεων της κάμερας, του φωτισμού, των αυτοκινήτων, ακόμη και των μωρών σε καροτσάκια. Ο Will Smith τρώει μακαρόνια (ξανά) Κάποιος έπρεπε να το κάνει...ξανά. Σε αυτό το σημείο, έχει γίνει παράδοση κάθε φορά που κυκλοφορεί μια νέα γεννήτρια βίντεο τεχνητής νοημοσύνης, κάποιος να αναδημιουργεί το διαβόητο βίντεο "Ο Will Smith τρώει μακαρόνια". Με το Veo 3, η σκηνή τώρα περιλαμβάνει πλήρεις ήχους μασίματος, αν και όχι ρεαλιστικούς. Ενώ η ομοιότητα του προσώπου με τον Smith εξακολουθεί να μην είναι τέλεια, το αποτέλεσμα είναι ακόμα διασκεδαστικό. Το ντοκιμαντέρ για δημιουργία μουσικού οργάνου Μια ταινία μικρού μήκους που καταγράφει έναν καλλιτέχνη mixed-media που κατασκευάζει ένα μουσικό όργανο εμπνευσμένο από μια εθνοτική ομάδα στο Βιετνάμ. Η αφήγηση, η μουσική υπόκρουση, οι ήχοι, ακόμη και τα σχόλια του καλλιτέχνη, όλα έχουν δημιουργηθεί από τεχνητή νοημοσύνη. Μοιάζει με κάτι που θα βλέπατε στο Netflix, μέχρι να συνειδητοποιήσετε ότι τίποτα από αυτά δεν είναι πραγματικό. Είναι σαφές ότι εργαλεία όπως το Veo 3 έχουν απίστευτες δυνατότητες. Διαφημιστές, κινηματογραφιστές, εκπαιδευτικοί, καλλιτέχνες και πρακτικά οποιοσδήποτε άλλος μπορεί πλέον να δημιουργήσει ολόκληρες βιντεοπαραγωγές χωρίς ποτέ να πιάσει κάμερα ή να προσλάβει συνεργείο. Παρόλα αυτά, αυτού του είδους το περιεχόμενο τεχνητής νοημοσύνης που είναι αρκετά ρεαλιστικό, συνοδεύεται επίσης από κινδύνους παραπληροφόρησης και συναίνεσης στη δημιουργία μέσων. Σε κάθε περίπτωση το κουτί της Πανδώρας είναι πλέον ανοιχτό. Διαβάστε ολόκληρο το άρθρο
- 24 Μαϊου
- 42 απαντήσεις
- - Veo
  - Google
  - (και 1 περισσότερα)
    Ετικέτα με:
    
    Veo
    
    Google
    
    Google I/O 2025
Η Midjourney λανσάρει το πρώτο της μοντέλο δημιουργίας βίντεο με τεχνητή νοημοσύνη

nchatz δημοσίευσε θέμα στο Νέα

Η Midjourney, μια από τις πιο δημοφιλείς νεοφυείς επιχειρήσεις τεχνητής νοημοσύνης, ανακοίνωσε την Τετάρτη την κυκλοφορία του πολυαναμενόμενου μοντέλου δημιουργίας βίντεο με AI, V1. Το V1 είναι ένα μοντέλο μετατροπής εικόνας σε βίντεο, όπου οι χρήστες μπορούν να ανεβάσουν μια εικόνα - ή να χρησιμοποιήσουν μια εικόνα που δημιουργήθηκε από άλλα μοντέλα της Midjourney - και το V1 θα παράγει ένα σύνολο τεσσάρων βίντεο, με διάρκεια 5 δευτερολέπτων το καθένα, βασισμένων σε αυτή την εικόνα. Όπως και τα μοντέλα εικόνας της Midjourney, το V1 είναι διαθέσιμο μόνο μέσω Discord και μόνο σε web έκδοση κατά την αρχική κυκλοφορία του. Η κυκλοφορία του V1 φέρνει την Midjourney σε ανταγωνισμό με μοντέλα δημιουργίας βίντεο AI από άλλες εταιρείες, όπως το Sora της OpenAI, το Gen 4 της Runway, το Firefly της Adobe και το Veo 3 της Google. Ενώ πολλές εταιρείες εστιάζουν στην ανάπτυξη ελεγχόμενων μοντέλων βίντεο AI για εμπορική χρήση, η Midjourney ξεχωρίζει πάντα για τα χαρακτηριστικά μοντέλα εικόνας AI που απευθύνονται σε δημιουργικούς ανθρώπους. Όπως ξεκαθαρίζει η Midjourney, έχει μεγαλύτερους στόχους για τα μοντέλα βίντεο AI από την απλή δημιουργία B-roll για ταινίες του Χόλιγουντ ή διαφημίσεις. Σε μια ανάρτηση, ο CEO της Midjourney, David Holz, αναφέρει ότι το μοντέλο βίντεο AI είναι το επόμενο βήμα της εταιρείας προς τον τελικό της προορισμό, τη δημιουργία μοντέλων AI "ικανών για προσομοιώσεις ανοιχτού κόσμου σε πραγματικό χρόνο". Μετά τα μοντέλα βίντεο AI, η Midjourney δηλώνει ότι σχεδιάζει να αναπτύξει μοντέλα AI για την παραγωγή τρισδιάστατων απεικονίσεων, καθώς και μοντέλα AI πραγματικού χρόνου. Η κυκλοφορία του μοντέλου V1 της Midjourney έρχεται μόλις μια εβδομάδα μετά την αγωγή που κατέθεσαν εναντίον της δύο από τα πιο γνωστά κινηματογραφικά στούντιο του Χόλιγουντ: η Disney και η Universal. Η αγωγή ισχυρίζεται ότι εικόνες που δημιουργήθηκαν από τα μοντέλα εικόνας AI της Midjourney απεικονίζουν χαρακτήρες με πνευματικά δικαιώματα των στούντιο, όπως ο Homer Simpson και ο Darth Vader. Τα στούντιο του Χόλιγουντ αντιμετωπίζουν δυσκολίες στην αντιμετώπιση της αυξανόμενης δημοτικότητας των μοντέλων δημιουργίας εικόνας και βίντεο AI, όπως αυτά που αναπτύσσει η Midjourney. Υπάρχει αυξανόμενος φόβος ότι αυτά τα εργαλεία AI θα μπορούσαν να αντικαταστήσουν ή να υποτιμήσουν το έργο των δημιουργών στους αντίστοιχους τομείς τους, και αρκετές εταιρείες μέσων ενημέρωσης έχουν ισχυριστεί ότι αυτά τα προϊόντα εκπαιδεύονται σε έργα τους με πνευματικά δικαιώματα. Παρόλο που η Midjourney προσπάθησε να τοποθετηθεί ως διαφορετική από άλλες νεοφυείς επιχειρήσεις AI εικόνας και βίντεο - εστιάζοντας περισσότερο στη δημιουργικότητα παρά σε άμεσες εμπορικές εφαρμογές - η εταιρεία δεν μπορεί να ξεφύγει από αυτές τις κατηγορίες. Αρχικά, η Midjourney δηλώνει ότι θα χρεώνει 8 φορές περισσότερο για μια δημιουργία βίντεο από μια τυπική δημιουργία εικόνας, που σημαίνει ότι οι συνδρομητές θα εξαντλούν το μηνιαίο επιτρεπόμενο όριο δημιουργιών τους σημαντικά γρηγορότερα όταν δημιουργούν βίντεο αντί για εικόνες. Κατά την κυκλοφορία, ο φθηνότερος τρόπος για να δοκιμάσει κανείς το V1 είναι εγγραφόμενος στο πρόγραμμα Basic της Midjourney με κόστος 10 δολάρια το μήνα. Οι συνδρομητές του προγράμματος Pro με κόστος 60 δολάρια το μήνα και του προγράμματος Mega με κόστος 120 δολάρια το μήνα θα έχουν απεριόριστες δημιουργίες βίντεο στην πιο αργή λειτουργία "Relax" της εταιρείας. Τον επόμενο μήνα, η Midjourney δηλώνει ότι θα επανεξετάσει την τιμολόγηση για τα μοντέλα βίντεο. Το V1 έρχεται με μερικές προσαρμοσμένες ρυθμίσεις που επιτρέπουν στους χρήστες να ελέγχουν τα αποτελέσματα του μοντέλου βίντεο. Οι χρήστες μπορούν να επιλέξουν μια αυτόματη ρύθμιση animation για να κάνουν μια εικόνα να κινείται τυχαία, ή μπορούν να επιλέξουν μια χειροκίνητη ρύθμιση που επιτρέπει στους χρήστες να περιγράψουν, με κείμενο, ένα συγκεκριμένο animation που θέλουν να προσθέσουν στο βίντεό τους. Οι χρήστες μπορούν επίσης να ρυθμίσουν την ποσότητα κίνησης της κάμερας και του θέματος επιλέγοντας "χαμηλή κίνηση" ή "υψηλή κίνηση" στις ρυθμίσεις. Ενώ τα βίντεο που δημιουργούνται με το V1 διαρκούν μόνο πέντε δευτερόλεπτα, οι χρήστες μπορούν να επιλέξουν να τα επεκτείνουν κατά τέσσερα δευτερόλεπτα έως και τέσσερις φορές, που σημαίνει ότι τα βίντεο V1 θα μπορούσαν να φτάσουν τα 21 δευτερόλεπτα. Όπως και τα μοντέλα εικόνας AI της Midjourney, τα πρώτα δείγματα βίντεο του V1 φαίνονται κάπως εξωπραγματικά, παρά υπερρεαλιστικά. Η αρχική ανταπόκριση στο V1 ήταν θετική, αν και δεν είναι ακόμα σαφές πόσο καλά συγκρίνεται με άλλα κορυφαία μοντέλα βίντεο AI, τα οποία είναι στην αγορά για μήνες ή ακόμα και χρόνια. Διαβάστε ολόκληρο το άρθρο
- 20 Ιουνίου
- 15 απαντήσεις
- - Midjourney
  - Sora
  - (και 1 περισσότερα)
    Ετικέτα με:
    
    Midjourney
    
    Sora
    
    Veo
Η Midjourney λανσάρει το πρώτο της μοντέλο δημιουργίας βίντεο με τεχνητή νοημοσύνη

nchatz δημοσίευσε ένα άρθρο στο Artificial Intelligence

Το V1 είναι ένα μοντέλο μετατροπής εικόνας σε βίντεο, όπου οι χρήστες μπορούν να ανεβάσουν μια εικόνα - ή να χρησιμοποιήσουν μια εικόνα που δημιουργήθηκε από άλλα μοντέλα της Midjourney - και το V1 θα παράγει ένα σύνολο τεσσάρων βίντεο, με διάρκεια 5 δευτερολέπτων το καθένα, βασισμένων σε αυτή την εικόνα. Όπως και τα μοντέλα εικόνας της Midjourney, το V1 είναι διαθέσιμο μόνο μέσω Discord και μόνο σε web έκδοση κατά την αρχική κυκλοφορία του. Η κυκλοφορία του V1 φέρνει την Midjourney σε ανταγωνισμό με μοντέλα δημιουργίας βίντεο AI από άλλες εταιρείες, όπως το Sora της OpenAI, το Gen 4 της Runway, το Firefly της Adobe και το Veo 3 της Google. Ενώ πολλές εταιρείες εστιάζουν στην ανάπτυξη ελεγχόμενων μοντέλων βίντεο AI για εμπορική χρήση, η Midjourney ξεχωρίζει πάντα για τα χαρακτηριστικά μοντέλα εικόνας AI που απευθύνονται σε δημιουργικούς ανθρώπους. Όπως ξεκαθαρίζει η Midjourney, έχει μεγαλύτερους στόχους για τα μοντέλα βίντεο AI από την απλή δημιουργία B-roll για ταινίες του Χόλιγουντ ή διαφημίσεις. Σε μια ανάρτηση, ο CEO της Midjourney, David Holz, αναφέρει ότι το μοντέλο βίντεο AI είναι το επόμενο βήμα της εταιρείας προς τον τελικό της προορισμό, τη δημιουργία μοντέλων AI "ικανών για προσομοιώσεις ανοιχτού κόσμου σε πραγματικό χρόνο". Μετά τα μοντέλα βίντεο AI, η Midjourney δηλώνει ότι σχεδιάζει να αναπτύξει μοντέλα AI για την παραγωγή τρισδιάστατων απεικονίσεων, καθώς και μοντέλα AI πραγματικού χρόνου. Η κυκλοφορία του μοντέλου V1 της Midjourney έρχεται μόλις μια εβδομάδα μετά την αγωγή που κατέθεσαν εναντίον της δύο από τα πιο γνωστά κινηματογραφικά στούντιο του Χόλιγουντ: η Disney και η Universal. Η αγωγή ισχυρίζεται ότι εικόνες που δημιουργήθηκαν από τα μοντέλα εικόνας AI της Midjourney απεικονίζουν χαρακτήρες με πνευματικά δικαιώματα των στούντιο, όπως ο Homer Simpson και ο Darth Vader. Τα στούντιο του Χόλιγουντ αντιμετωπίζουν δυσκολίες στην αντιμετώπιση της αυξανόμενης δημοτικότητας των μοντέλων δημιουργίας εικόνας και βίντεο AI, όπως αυτά που αναπτύσσει η Midjourney. Υπάρχει αυξανόμενος φόβος ότι αυτά τα εργαλεία AI θα μπορούσαν να αντικαταστήσουν ή να υποτιμήσουν το έργο των δημιουργών στους αντίστοιχους τομείς τους, και αρκετές εταιρείες μέσων ενημέρωσης έχουν ισχυριστεί ότι αυτά τα προϊόντα εκπαιδεύονται σε έργα τους με πνευματικά δικαιώματα. Παρόλο που η Midjourney προσπάθησε να τοποθετηθεί ως διαφορετική από άλλες νεοφυείς επιχειρήσεις AI εικόνας και βίντεο - εστιάζοντας περισσότερο στη δημιουργικότητα παρά σε άμεσες εμπορικές εφαρμογές - η εταιρεία δεν μπορεί να ξεφύγει από αυτές τις κατηγορίες. Αρχικά, η Midjourney δηλώνει ότι θα χρεώνει 8 φορές περισσότερο για μια δημιουργία βίντεο από μια τυπική δημιουργία εικόνας, που σημαίνει ότι οι συνδρομητές θα εξαντλούν το μηνιαίο επιτρεπόμενο όριο δημιουργιών τους σημαντικά γρηγορότερα όταν δημιουργούν βίντεο αντί για εικόνες. Κατά την κυκλοφορία, ο φθηνότερος τρόπος για να δοκιμάσει κανείς το V1 είναι εγγραφόμενος στο πρόγραμμα Basic της Midjourney με κόστος 10 δολάρια το μήνα. Οι συνδρομητές του προγράμματος Pro με κόστος 60 δολάρια το μήνα και του προγράμματος Mega με κόστος 120 δολάρια το μήνα θα έχουν απεριόριστες δημιουργίες βίντεο στην πιο αργή λειτουργία "Relax" της εταιρείας. Τον επόμενο μήνα, η Midjourney δηλώνει ότι θα επανεξετάσει την τιμολόγηση για τα μοντέλα βίντεο. Το V1 έρχεται με μερικές προσαρμοσμένες ρυθμίσεις που επιτρέπουν στους χρήστες να ελέγχουν τα αποτελέσματα του μοντέλου βίντεο. Οι χρήστες μπορούν να επιλέξουν μια αυτόματη ρύθμιση animation για να κάνουν μια εικόνα να κινείται τυχαία, ή μπορούν να επιλέξουν μια χειροκίνητη ρύθμιση που επιτρέπει στους χρήστες να περιγράψουν, με κείμενο, ένα συγκεκριμένο animation που θέλουν να προσθέσουν στο βίντεό τους. Οι χρήστες μπορούν επίσης να ρυθμίσουν την ποσότητα κίνησης της κάμερας και του θέματος επιλέγοντας "χαμηλή κίνηση" ή "υψηλή κίνηση" στις ρυθμίσεις. Ενώ τα βίντεο που δημιουργούνται με το V1 διαρκούν μόνο πέντε δευτερόλεπτα, οι χρήστες μπορούν να επιλέξουν να τα επεκτείνουν κατά τέσσερα δευτερόλεπτα έως και τέσσερις φορές, που σημαίνει ότι τα βίντεο V1 θα μπορούσαν να φτάσουν τα 21 δευτερόλεπτα. Όπως και τα μοντέλα εικόνας AI της Midjourney, τα πρώτα δείγματα βίντεο του V1 φαίνονται κάπως εξωπραγματικά, παρά υπερρεαλιστικά. Η αρχική ανταπόκριση στο V1 ήταν θετική, αν και δεν είναι ακόμα σαφές πόσο καλά συγκρίνεται με άλλα κορυφαία μοντέλα βίντεο AI, τα οποία είναι στην αγορά για μήνες ή ακόμα και χρόνια.
- 20 Ιουνίου
- 15 σχόλια
- - 1
- - Midjourney
  - Sora
  - (και 1 περισσότερα)
    Ετικέτα με:
    
    Midjourney
    
    Sora
    
    Veo
Το Veo 3 της Google δημιουργεί εντυπωσιακά βίντεο με τη βοήθεια της AI

Crash24 δημοσίευσε ένα άρθρο στο Google

Η τελευταία γεννήτρια βίντεο με τεχνητή νοημοσύνη της εταιρείας έγινε viral για όλους τους σωστούς (και μερικές φορές ανησυχητικούς) λόγους. Με τη νέα του έκδοση, το Veo έλαβε μια τεράστια αναβάθμιση με τη μορφή εγγενούς παραγωγής ήχου και πλέον μπορείτε να δημιουργήσετε τα πάντα, από αφηγήσεις μέχρι ολόκληρα κλιπ που περιλαμβάνουν, μουσική, ήχους περιβάλλοντος, διαλόγους και άλλα, απλώς περιγράφοντας τι θέλετε να ακούσετε στις προτροπές (prompts). Το Veo 3 είναι επί του παρόντος διαθέσιμο στους συνδρομητές του Google AI Ultra στις ΗΠΑ μέσω της εφαρμογής Gemini ή μέσω του νέου εργαλείου δημιουργίας μίνι ταινίων της εταιρείας που ονομάζεται Flow. Υποστηρίζει δημιουργία βίντεο από κείμενο, από εικόνα και μέσω προτροπών, και τα αποτελέσματα είναι τρομακτικά αληθινά! Είναι το είδος του περιεχομένου που μπορεί να προσπεράσετε χωρίς καν να συνειδητοποιήσετε ότι δημιουργήθηκε από τεχνητή νοημοσύνη. Παρακάτω είναι μερικά από τα πιο viral, παράξενα και απίστευτα ρεαλιστικά βίντεο Veo 3 που κυκλοφορούν στα μέσα κοινωνικής δικτύωσης αυτή τη στιγμή, τα οποία πρέπει να δείτε για να τα πιστέψετε. Άνθρωποι που γνωρίζουν ότι δημιουργήθηκαν από AI Τα παρακάτω κλιπ παρουσιάζουν ανατριχιαστικά ανθρώπινους χαρακτήρες που είτε γνωρίζουν είτε αρνούνται να πιστέψουν ότι δημιουργήθηκαν με προτροπές. Ένα άλλο βίντεο φαντάζεται χαρακτήρες τεχνητής νοημοσύνης που συνειδητοποιούν την ύπαρξή τους ως συνθετικά όντα. Και τα δύο βίντεο είναι ολίγον ανατριχιαστικά, έχοντας -μεταξύ άλλων- και κινηματογραφικό feeling. Μια διαφήμιση αντικαταθλιπτικών φιλική προς τα γούνινα ζώα Πρόκειται για μια πλήρως ψεύτικη φαρμακευτική διαφήμιση για ένα αντικαταθλιπτικό που προσελκύει...σκύλους. Τα πάντα, από την υποκριτική μέχρι τη μελαγχολική μουσική, τον φωτισμό, το φόντο, ακόμη και τα κουτάβια, έχουν δημιουργηθεί με τεχνητή νοημοσύνη. Ανύπαρκτες συνεντεύξεις σε έκθεση αυτοκινήτων Tο συγκεκριμένο βίντεο παρουσιάζει ρεαλιστικούς παρουσιαστές που παίρνουν συνέντευξη από ψεύτικους επισκέπτες για ψεύτικα αυτοκίνητα σε μια ψεύτικη έκθεση αυτοκινήτων. Είναι δύσκολο για κάποιον τουλάχιστον άμεσα να διακρίνει ότι τα πάντα σε αυτό το βίντεο είναι ψεύτικα, συμπεριλαμβανομένου του πλήθους, των κινήσεων της κάμερας, του φωτισμού, των αυτοκινήτων, ακόμη και των μωρών σε καροτσάκια. Ο Will Smith τρώει μακαρόνια (ξανά) Κάποιος έπρεπε να το κάνει...ξανά. Σε αυτό το σημείο, έχει γίνει παράδοση κάθε φορά που κυκλοφορεί μια νέα γεννήτρια βίντεο τεχνητής νοημοσύνης, κάποιος να αναδημιουργεί το διαβόητο βίντεο "Ο Will Smith τρώει μακαρόνια". Με το Veo 3, η σκηνή τώρα περιλαμβάνει πλήρεις ήχους μασίματος, αν και όχι ρεαλιστικούς. Ενώ η ομοιότητα του προσώπου με τον Smith εξακολουθεί να μην είναι τέλεια, το αποτέλεσμα είναι ακόμα διασκεδαστικό. Το ντοκιμαντέρ για δημιουργία μουσικού οργάνου Μια ταινία μικρού μήκους που καταγράφει έναν καλλιτέχνη mixed-media που κατασκευάζει ένα μουσικό όργανο εμπνευσμένο από μια εθνοτική ομάδα στο Βιετνάμ. Η αφήγηση, η μουσική υπόκρουση, οι ήχοι, ακόμη και τα σχόλια του καλλιτέχνη, όλα έχουν δημιουργηθεί από τεχνητή νοημοσύνη. Μοιάζει με κάτι που θα βλέπατε στο Netflix, μέχρι να συνειδητοποιήσετε ότι τίποτα από αυτά δεν είναι πραγματικό. Είναι σαφές ότι εργαλεία όπως το Veo 3 έχουν απίστευτες δυνατότητες. Διαφημιστές, κινηματογραφιστές, εκπαιδευτικοί, καλλιτέχνες και πρακτικά οποιοσδήποτε άλλος μπορεί πλέον να δημιουργήσει ολόκληρες βιντεοπαραγωγές χωρίς ποτέ να πιάσει κάμερα ή να προσλάβει συνεργείο. Παρόλα αυτά, αυτού του είδους το περιεχόμενο τεχνητής νοημοσύνης που είναι αρκετά ρεαλιστικό, συνοδεύεται επίσης από κινδύνους παραπληροφόρησης και συναίνεσης στη δημιουργία μέσων. Σε κάθε περίπτωση το κουτί της Πανδώρας είναι πλέον ανοιχτό.
- 24 Μαϊου
- 42 σχόλια
- - 7
- - Veo
  - Google
  - (και 1 περισσότερα)
    Ετικέτα με:
    
    Veo
    
    Google
    
    Google I/O 2025