Προς το περιεχόμενο

Η OpenAI σοκάρει με το Sora, ένα AI εργαλείο που δημιουργεί ρεαλιστικά βίντεο από περιγραφή κειμένου


nchatz

Προτεινόμενες αναρτήσεις

Ακολουθώντας την τάση που έθεσαν καινοτόμες εταιρείες όπως η Runway και τεχνολογικά μεγαθήρια όπως η Google και η Meta, η OpenAI επιχειρεί τώρα να εισέλθει στην κατηγορία δημιουργίας βίντεο από μια προτροπή κειμένου, με εντυπωσιακά αποτελέσματα.

Συγκεκριμένα η OpenAI παρουσίασε το Sora, ένα generative AI μοντέλο που μπορεί να παράγει βίντεο με βάση περιγραφές κειμένου, ότι κάνει δηλαδή το Dall-E 3 αλλά για τη δημιουργία φωτογραφιών. Είτε το κείμενο που θα εισάγει ο χρήστης είναι συνοπτικό ή αρκετά αναλυτικό, είτε ακόμη και μια μεμονωμένη εικόνα, το Sora είναι ικανό να παράγει βίντεο υψηλής ευκρίνειας 1080p, που διαθέτει πολλούς χαρακτήρες, ποικιλία κινήσεων και περίπλοκα φόντα, σύμφωνα με την OpenAI. Τα πρώτα δοκιμαστικά βίντεο που δημοσιοποίησε η εταιρεία είναι εκπληκτικά με δεδομένο ότι τίποτα απ’ αυτά που βλέπουμε σ’ αυτά δεν είναι αληθινό, και χρειάζεται μεγαλύτερη παρατήρηση για να εντοπιστούν οι ατέλειες. 

Επιπλέον, το Sora διαθέτει την ικανότητα να βελτιώνει προϋπάρχον υλικό βίντεο προσπαθώντας να “διαισθανθεί» και να προσθέσει τα στοιχεία που λείπουν. Σύμφωνα με μια ανάρτηση στο blog της OpenAI, "το Sora παρουσιάζει μια βαθιά κατανόηση της γλώσσας, η οποία του επιτρέπει να ερμηνεύει με ακρίβεια τις οδηγίες και να δημιουργεί δυναμικούς χαρακτήρες γεμάτους ζωή και συναίσθημα. Το μοντέλο όχι μόνο αντιλαμβάνεται τις οδηγίες του χρήστη, αλλά κατανοεί παράλληλα τη φυσική ύπαρξη αυτών των στοιχείων στον πραγματικό κόσμο".

Tο Sora έχει τη δυνατότητα να δημιουργεί βίντεο σε διάφορα στυλ, είτε ρεαλιστικά λες και προέρχονται από ταινία, είτε κινούμενα σχέδια ή μονόχρωμα, ενώ μπορεί να παράγει κλιπ διάρκειας έως και ενός λεπτού. Το συγκεκριμένο χρονικό διάστημα είναι σημαντικά μεγαλύτερο από αυτό που προσφέρουν τα περισσότερα μοντέλα μετατροπής κειμένου σε βίντεο. Επιπλέον, αυτά τα βίντεο παρουσιάζουν γενικά μια λογική συνοχή, αποφεύγοντας το φαινόμενο της  "παράξενης τεχνητής νοημοσύνης", όπως αντικείμενα που κινούνται με τρόπους που αψηφούν τους νόμους της φυσικής.

Αξίζει να σημειωθεί ότι ορισμένα από τα βίντεο του Sora με ανθρωποειδείς φιγούρες, όπως ένα ρομπότ με φόντο μια πόλη ή ένα άτομο που κάνει πεζοπορία σε ένα χιονισμένο τοπίο, φαίνεται να έχουν μια αισθητική που μοιάζει να προέρχεται από βιντεοπαιχνίδι, ενδεχομένως λόγω της απλότητας των φόντων. Παρόλα αυτά, η "AI strangeness" εμφανίζεται περιστασιακά σε ορισμένα κλιπ, όπως οχήματα που αλλάζουν απότομα κατεύθυνση ή άκρα που συγχωνεύονται σε κρεβάτι.

Η OpenAI τοποθετεί το Sora ως ένα διερευνητικό ερευνητικό εργαλείο και δεν έχει αποκαλύψει πολλά σχετικά με τα δεδομένα εκπαίδευσης, εκτός από το ότι αφορούσαν περίπου 10.000 ώρες βίντεο υψηλής ποιότητας. Το μοντέλο δεν είναι ακόμη ευρέως διαθέσιμο, με τους “Red testers”, μια επιλεγμένη ομάδα της εταιρείας να έχουν αναλάβει τον έλεγχο για τυχόν κινδύνους που μπορούν να δημιουγηθούν με τη χρήση του εργαλείου. Επιπλέον η εταιρεία συνεργάζεται με εμπειρογνώμονες για τον εντοπισμό τρωτών σημείων εντός του μοντέλου, με την εμπορική διάθεσή να υπολογίζεται για τους επόμενους μήνες.


Διαβάστε ολόκληρο το άρθρο

  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

  • Απαντ. 79
  • Δημ.
  • Τελ. απάντηση

Συχνή συμμετοχή στο θέμα

Δεν υπάρχει περίπτωση να είναι καθαρό prompt to video αυτό το πράγμα. Εάν όντως είναι, μιλάμε για άλμα 5ετίας. Τα τρέχοντα εργαλεία τύπου deforum στο auto1111, το diffanimate στο comfyui, ολόκληρο το runwayml αποδομούνται ως πλήρως άχρηστα.

Λογικά είναι υφιστάμενο video που το βελτίωσαν/διαφοροποίησαν με το μοντέλο τους. Και τα prompts είναι υπερβολικά απλά για να παράγουν τέτοια αψεγάδιαστη ποιότητα χωρίς ίχνος flicker & artifacts.

  • Like 6
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Σε λίγα χρόνια πείτε αντίο στην βιομηχανία κινηματογράφου. Όσο και να ΜΗΝ θέλω να συμβεί κάτι τέτοιο, καθώς χιλιάδες κόσμου θα χάσουν την δουλειά τους, φανταστείτε τί μπορεί να κάνει κάποιος εν δυνάμει σκηνοθέτης μόνο με το prompt. Χωρίς μεγάλα budget, καθυστερήσεις, κόνξες ηθοποιών κτλ κτλ. Απλά τρομακτικό... Θα γεμίσουμε με content που δεν θα έχει ψυχή, με χιλιάδες ταινίες που θα προσπαθούν να κερδίσουν το ενδιαφέρον μας και μόλις μερικές θα είναι αξιόλογες... Θα πει κανείς, και τώρα πιο πολύ σαβούρα βλέπουμε και ξεπετιώνται σαν όαση μερικά διαμαντάκια, αλλά ειλικρινά δεν ξέρω τι μας περιμένει στο μέλλον. ΑΝ αυτό το εργαλείο βοηθήσει την βιομηχανία σε κάποιο βαθμό, ναί οκ. Αλλά πρέπει να βγούν νόμοι και περιορισμοί για το πόσο intrusive θα είναι το Sora και κάθε Sora στις δουλειές επαγγελματιών που έχουν αφιερώσει την ζωή τους στον κινηματογράφο / τηλεόραση .... Οι μανατζαρέοι στις εταιρείες παραγωγής ίσως τρίβουν τα χεράκια τους αυτή την στιγμή... 

  • Like 5
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Σαν βιντεογραφος - φωτογράφος έχω να πω ουαου και τι μας περιμένει ακόμα... Λέω επίσης σιγά σιγά να αρχίσω να ασχολούμαι και με καμια άλλη  τέχνη... γιατί η ημέρα που θα μου φανεί χρήσιμη φτάνει..

  • Like 6
  • Thanks 1
  • Sad 6
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Η A.I. Sora τεχνολογία κάνει το DeepFake να φαίνεται αρχαίο... 
Άντε να προστατευτείς από κάτι τέτοιο.
Πρέπει σύντομα να αλλάξει και το νομικό πλαίσιο για την επιβεβαίωση των ψεύτικων βίντεο.

  • Like 3
  • Thanks 4
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημοσ. (επεξεργασμένο)
4 λεπτά πριν, neced2 είπε

Η A.I. Sora τεχνολογία κάνει το DeepFake να φαίνεται αρχαίο... 
Άντε να προστατευτείς από κάτι τέτοιο.
Πρέπει σύντομα να αλλάξει και το νομικό πλαίσιο για την επιβεβαίωση των ψεύτικων βίντεο.

Από τις ψεύτικες ειδήσεις πήγαμε στα ψεύτικα video. Αυτό ονομάζεται αναβάθμιση. Η ψευτιά έχει γίνει σημαία εδώ και δεκαετίες, τελευταία αναβαθμίστηκε και η σημαία και έγινε παρδαλή.

Επεξ/σία από NiKoSmile
  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Κάθε τεχνολογικό άλμα αφαιρεί αλλά και προσθέτει ταυτόχρονα θέσεις εργασίας.

Δεν είναι ότι οι άνθρωποι θα χάσουν τις θέσεις τους από ρομπότ αλλά από άλλους ανθρώπους που γνωρίζουν να χρησιμοποιούν εργαλεία όπως σε αυτή την περίπτωση το ΑΙ.

  • Like 2
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα

  • Δημιουργία νέου...