Ένα από τα πιο εντυπωσιακά demo των τελευταίων ημερών που αφορούν την τεχνητή νοημοσύνη είναι ένα εργαλείο που σας επιτρέπει να επεξεργαστείτε μια υπάρχουσα εικόνα σύμφωνα με τις προδιαγραφές σας.

Ας πούμε ότι θέλετε να "αλλάξετε τις διαστάσεις ενός αυτοκινήτου ή να μετατρέψετε ένα χαμόγελο σε συνοφρύωμα με ένα απλό drag n drop", θα μπορούσατε να το κάνετε πολύ εύκολα με το μοντέλο που ονομάζεται DragGAN.

Το Generative Adversarial Network (GAN) έχει προς το παρόν τη μορφή ερευνητικής εργασίας, ωστόσο έχει συγκεντρώσει τέτοια προσοχή από όσους ενδιαφέρονται να δουν τις επιδείξεις του, ώστε ο ιστότοπος της ερευνητικής ομάδας “έπεσε” λόγω της μεγάλης επισκεψιμότητας.

Το The Verge συνέκρινε το DragGAN με το εργαλείο Warp του Photoshop, προσθέτοντας ότι είναι πολύ πιο ισχυρό, καθώς δεν "αλλάζει τα pixels", αλλά "επαναδημιουργεί το υποκείμενο αντικείμενο". Το ακόμα πιο εντυπωσιακό είναι ότι μπορεί και να περιστρέψει τρισδιάστατες εικόνες.

Η δυναμική ενός τέτοιου εργαλείου έγκειται στο γεγονός ότι η γεννητική τεχνητή νοημοσύνη από κείμενο σε εικόνα δεν παράγει πάντα αυτό που μπορεί να θέλετε. Έτσι, μπορείτε να επιστρέψετε εκ των υστέρων για να επεξεργαστείτε μια υπάρχουσα εικόνα, αντί να χρειάζεται να δημιουργήσετε αυτόματα μια νέα εικόνα.

Ορισμένα demos που αποτελούν μέρος της ερευνητικής εργασίας περιλαμβάνουν την προσθήκη ύψους σε ένα βουνό, την αλλαγή της θέσης ενός μοντέλου και την επεξεργασία του μήκους και του σχήματος των ρούχων του, το άνοιγμα ή το κλείσιμο του στόματος ενός λιονταριού και την αλλαγή του προσώπου ενός ατόμου από απλό βλέμμα σε χαμόγελο. Και όλα αυτά, με ελάχιστη έως και καθόλου παραμόρφωση του υπόλοιπου μέρους της εικόνας όπως μπορούμε να δούμε στο βίντεο. Με πολλά εργαλεία τεχνητής νοημοσύνης που είναι σήμερα διαθέσιμα, οι χρήστες πρέπει να αναδημιουργήσουν μια εικόνα με μια πιο συγκεκριμένη προτροπή για να έχουν ένα πιο επιθυμητό αποτέλεσμα.

Η ερευνητική ομάδα σημειώνει στο έγγραφό της ότι μπορούν να προστεθούν νέες λεπτομέρειες στο πλαίσιο της αναγέννησης των επεξεργασμένων πτυχών των εικόνων που είναι επωφελείς για την ενημέρωση. "Η προσέγγισή μας μπορεί να φανταστεί και να δημιουργήσει περιεχόμενο σχετικό εκεί που δεν υπάρχει όπως τα δόντια μέσα στο στόμα ενός λιονταριού, ενώ μπορεί να παραμορφώσει κάποιο σημείο της εικόνας ακολουθώντας την ακαμψία του αντικειμένου, όπως η κάμψη ενός ποδιού αλόγου".

Υπάρχουν πολλά brands που προσπαθούν να προσφέρουν επιλογές επεξεργασίας για το περιεχόμενο της δημιουργικής τεχνητής νοημοσύνης. Ωστόσο, οι περισσότερες δεν φτάνουν τόσο μακριά ώστε να επιτρέπουν την πραγματική επεξεργασία των εικόνων, αλλά μάλλον για πτυχές όπως η επεξεργασία γύρω από τις εικόνες. Για παράδειγμα, η εφαρμογή Designer της Microsoft σας επιτρέπει να δημιουργήσετε εικόνες ΑΙ από μια προτροπή κειμένου και μπορείτε να επιλέξετε το αγαπημένο σας από τρία αποτελέσματα. Στη συνέχεια μπορείτε να το μεταφέρετε στην εφαρμογή , όπου μπορείτε να δημιουργήσετε μια σειρά από projects όπως αναρτήσεις στα μέσα κοινωνικής δικτύωσης, προσκλήσεις, ψηφιακές καρτ ποστάλ ή γραφικά με την εικόνα ως κεντρικό σημείο. Ωστόσο, δεν μπορείτε να επεξεργαστείτε την εικόνα που δημιουργήθηκε με τεχνητή νοημοσύνη.

Για την ώρα δεν γνωρίζουμε πότε και αν το DragGAN θα κάνει την εμφάνισή του εμπορικά ως ανεξάρτητη εφαρμογή ή ως μέρος μιας υπάρχουσας εφαρμογής σχεδιασμού όπως το Photoshop.

  • Like 6
  • Confused 1