Προς το περιεχόμενο

Η τεχνητή νοημοσύνη AlphaGo της Google είναι ο καλύτερος παίκτης του Go στον κόσμο


voltmod

Προτεινόμενες αναρτήσεις

Στη τελευταία αναμέτρηση μεταξύ ανθρώπου και μηχανής, η μηχανή προηγείται. Η Τεχνητή Νοημοσύνη της Google, AlphaGo κέρδισε για δεύτερη συνεχόμενη φορά σε ισάριθμες μέρες τον παγκόσμιο πρωταθλητή του Go, Ke Jie, παίρνοντας ένα αναμφισβήτητο και καθοριστικό προβάδισμα (από τις τρεις συνολικά αναμετρήσεις)

Αυτό σημαίνει ότι η Τεχνητή Νοημοσύνη της Deepmind (εταιρείας που όπως είναι γνωστό ανήκει στην Google) μπορεί να θεωρηθεί από τώρα ότι είναι ο καλύτερος παίκτης του Go στον κόσμο, έχοντας κερδίσει τα δύο μεγαλύτερα ονόματα στον χώρο, και μάλιστα σε λιγότερο από ένα χρόνο.

 

Παρόλο που το σημερινό αποτέλεσμα δεν ήταν τόσο “κοντά” όσο ο πρώτος αγώνας, που η Τεχνητή Νοημοσύνη AlphaGo κέρδισε για μόλις μισό πόντο, ο CEO της DeepMind, Demis Hassabis δήλωσε ότι ο Ke Jie έπαιξε “τέλεια” στο μεγαλύτερο μέρος της αναμέτρησης πριν παραιτηθεί. “Για τις πρώτες εκατό κινήσεις οι δύο αντίπαλοι ήταν πιο κοντά από όσο έχουμε δει κάποιον να παίζει ενάντια στην έκδοση Master του AlphaGo” δήλωσε ο Hassabis στην συνέντευξη τύπου μετά την αναμέτρηση.

 

Ο Ke Jie δήλωσε από την μεριά του: “Το σημερινό παιχνίδι ήταν διαφορετικό από το πρώτο. Το AlphaGo έκανε ορισμένες κινήσεις που ήταν το αντίθετο από αυτό που είχα στο μυαλό μου για το πώς να αυξήσεις στο μέγιστο τις πιθανότητες να κερδίσεις. Επίσης σχημάτισα την εντύπωση ότι βρέθηκα πολύ κοντά στη νίκη στα μέσα του παιχνιδιού, αλλά ενδεχομένως το AlphaGo να μην έκανε την ίδια σκέψη. Είμαι λίγο λυπημένος, γιατί πιστεύω πως έπαιξα πολύ καλά”.


Η Τεχνητή Νοημοσύνη της DeepMind, AlphaGo βρίσκεται στη Κίνα, στα πλαίσια του πενθήμερου φόρουμ Future of Go Summit που διοργανώνει η Google και o Κινεζικός σύνδεσμος Go. Στο φόρουμ συμμετέχουν μερικοί από τους καλύτερους παίκτες Go στον κόσμο καθώς και εμπειρογνώμονες από τον χώρο της Τεχνητής Νοημοσύνης για να συζητήσουν και να εξερευνήσουν τα μυστήρια του αρχαίου επιτραπέζιου παιχνιδιού. Αναμφισβήτητα σημαντικός πόλος έλξης είναι η αναμέτρηση του AlphaGo με τον Ke Jie, με το τρίτο μεταξύ τους παιχνίδι να πραγματοποιείται το Σάββατο (το AlphaGo θα συμμετάσχει εντωμεταξύ και σε ομαδικά παιχνίδια νωρίτερα, δοκιμάζοντας την δημιουργικότητα του ακόμα και ενάντια σε πέντε παίκτες).

 

Σύμφωνα με όσα έχουν γίνει γνωστά, η τελευταία αυτή έκδοση της Τεχνητής Νοημοσύνης AlphaGo, στην οποία έχουν δώσει το όνομα “Master”, χρησιμοποιεί 10 φορές λιγότερη επεξεργαστική ισχύ από τον υπολογιστή που νίκησε τον Lee Sedol. Βλέπετε το μόνο που απαιτείται είναι ένα PC που συνδέεται στον cloud server της Google.

 

 

Link.png Site: Engadget

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

To θεμα ειναι η "τεχνικη νοημοσυνη" μια καθε φορα, να νικαει τους καλυτερους σε σκακι,ταβλι,go,οθελο κτλ χωρις να χρειαζεται επαναπρογραμματισμο.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Το Go, όπως και το σκάκι, είναι παιχνίδι πλήρους πληροφόρησης.

Δηλαδή το σύστημα AI δεν χρειάζεται να κάνει υποθέσεις για άγνωστες παραμέτρους. Πράγμα που κάνουν οι άνθρωποι με την εξομοίωση του πραγματικού κόσμου που έχουν μέσα τους.

Μόνο αν αποκτήσουν τα AI συστήματα κοινή λογική(κάποιο μοντέλο του έξω κόσμου) θα μπορεί να μιλήσει κανείς για επανάσταση στο χώρο αυτό. Μέχρι τότε θα διακρίνονται σε επιτραπέζια και άλλα καθήκοντα που απαιτούν άμεση αντίδραση στα εξωτερικά ερεθίσματα(π.χ. οδήγηση), αλλά όχι μακροπρόθεσμο σχεδιασμό και σύνδεση αιτίων-αιτιατών με μεγάλες χρονικές αποκλίσεις.

  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Το Go, όπως και το σκάκι, είναι παιχνίδι πλήρους πληροφόρησης.

Δηλαδή το σύστημα AI δεν χρειάζεται να κάνει υποθέσεις για άγνωστες παραμέτρους. Πράγμα που κάνουν οι άνθρωποι με την εξομοίωση του πραγματικού κόσμου που έχουν μέσα τους.

Μόνο αν αποκτήσουν τα AI συστήματα κοινή λογική(κάποιο μοντέλο του έξω κόσμου) θα μπορεί να μιλήσει κανείς για επανάσταση στο χώρο αυτό. Μέχρι τότε θα διακρίνονται σε επιτραπέζια και άλλα καθήκοντα που απαιτούν άμεση αντίδραση στα εξωτερικά ερεθίσματα(π.χ. οδήγηση), αλλά όχι μακροπρόθεσμο σχεδιασμό και σύνδεση αιτίων-αιτιατών με μεγάλες χρονικές αποκλίσεις.

Ψαξτο λίγο παραπάνω. Είναι παιχνίδια πλήρους πληροφόρησης αλλά δεν έχουν λυθεί και δε μπορούν να λυθούν με την παρούσα τεχνολογία. Το alphago λειτουργεί διαφορετικά.

  • Like 3
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Και ούτε πρόκειται να λυθούν. Τα άτομα του γνωστού σύμπαντος είναι λιγότερα σε αριθμό από τις πιθανές παρτίδες σκακιού.

  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Ψαξτο λίγο παραπάνω. Είναι παιχνίδια πλήρους πληροφόρησης αλλά δεν έχουν λυθεί και δε μπορούν να λυθούν με την παρούσα τεχνολογία. Το alphago λειτουργεί διαφορετικά.

 

Σε αντίθεση με το σκάκι, και άλλα παιχνίδια, η απλότητα των κανόνων και η ομοιομορφία των κομματιών έχουν σαν αποτέλεσμα ο χώρος αναζήτησης να μοιάζει "επίπεδος" και συνεπώς το να βρει κάποιος μέγιστα σε αυτών είναι πολύ δύσκολο.

 

Σχηματικά, στο σκάκι η "επιφάνεια αναζήτησης" έχει έντονα ανάγλυφα χαρακτηριστικά (μέγιστα και ελάχιστα), για πολλούς λόγους (η αξία των κομματιών, ο μικρός χώρος της σκακιέρας κλπ), και η αναζήτηση είναι πολύ ευκολότερη και αποδοτική.

 

Στο go δεν ισχύει κάτι τέτοιο. Δεν μπορείς να αποκόψεις βαριάντες (pruning) γιατί είναι ομοιόμορφος ο χώρος αναζήτησης.

 

Αυτός είναι και ο λόγος που δεν χρησιμοποιείτε αμιγώς αναλυτική αναζήτηση (χρησιμοποιούν monte carlo search trees) αλλά και τεχνητή νοημοσύνη (που δεν είναι τίποτα άλλο από μια συνάρτηση αξιολόγησης δομημένη σαν νευρωνικό δίκτυο. Αυτό είναι και το σημαντικό κομμάτι της όλης διαδικασίας. Η ικανότητα να αναγνωρίζει και να αξιολογεί τοπικά μοτίβα.

  • Like 3
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Ψαξτο λίγο παραπάνω. Είναι παιχνίδια πλήρους πληροφόρησης αλλά δεν έχουν λυθεί και δε μπορούν να λυθούν με την παρούσα τεχνολογία. Το alphago λειτουργεί διαφορετικά.

 

Όπως είπε και ο buffos πιο πάνω, πρόσφατα ένα νευρωνικό δίκτυο εκπαιδεύτηκε επιτυχώς στην αξιολόγηση της θέσεως των κομματιών(σκάκι), μέσω αναγνώρισης μοτίβων.

 

https://www.technologyreview.com/s/541276/deep-learning-machine-teaches-itself-chess-in-72-hours-plays-at-international-master/

 

Όταν λες "δεν έχουν λυθεί" τι ακριβώς εννοείς; Να υπολογίζουν όλες τις πιθανές εκβάσεις; Οι άνθρωποι παίκτες σίγουρα δεν λειτουργούν έτσι.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Όπως είπε και ο buffos πιο πάνω, πρόσφατα ένα νευρωνικό δίκτυο εκπαιδεύτηκε επιτυχώς στην αξιολόγηση της θέσεως των κομματιών(σκάκι), μέσω αναγνώρισης μοτίβων.

 

https://www.technologyreview.com/s/541276/deep-learning-machine-teaches-itself-chess-in-72-hours-plays-at-international-master/

 

Όταν λες "δεν έχουν λυθεί" τι ακριβώς εννοείς; Να υπολογίζουν όλες τις πιθανές εκβάσεις; Οι άνθρωποι παίκτες σίγουρα δεν λειτουργούν έτσι.

Πολύ καλά τα λέει ο buffos και συμφωνώ. Εσύ δε τα λες καλά. Το ότι είναι παιχνίδι πλήρους πληροφόρησης ως πληροφορία έχει αξία μόνο αν έχει λυθεί. Δηλαδή υπάρχει τρόπος να υπολογιστούν όλες οι πιθανές θέσεις από μια αρχική τοποθέτηση των πιονιων.

Εδώ υπάρχει σε λειτουργία ένα νευρωνικό δίκτυο αυτό της deep mind και όχι επίλυση. Διάλεξε τι θες να πεις.

 

Γράφεις "Το Go, όπως και το σκάκι, είναι παιχνίδι πλήρους πληροφόρησης.

Δηλαδή το σύστημα AI δεν χρειάζεται να κάνει υποθέσεις για άγνωστες παραμέτρους."

 

Που ασφαλώς και δεν ισχύει δεδομένου ότι παρότι παιχνίδι πλήρους πληροφόρησης δεν έχει λυθεί.

 

Το alphago παίζει πολύ πιο ανθρώπινα από το deep blue. Αυτό είναι και το πείραμα.

Δε βασίζεται σε επίλυση μερική ή ολική αλλά σε μοντέλα εκμάθησης πάνω σε MCTS.

 

Σε αντίθεση με το σκάκι, και άλλα παιχνίδια, η απλότητα των κανόνων και η ομοιομορφία των κομματιών έχουν σαν αποτέλεσμα ο χώρος αναζήτησης να μοιάζει "επίπεδος" και συνεπώς το να βρει κάποιος μέγιστα σε αυτών είναι πολύ δύσκολο.

 

Σχηματικά, στο σκάκι η "επιφάνεια αναζήτησης" έχει έντονα ανάγλυφα χαρακτηριστικά (μέγιστα και ελάχιστα), για πολλούς λόγους (η αξία των κομματιών, ο μικρός χώρος της σκακιέρας κλπ), και η αναζήτηση είναι πολύ ευκολότερη και αποδοτική.

 

Στο go δεν ισχύει κάτι τέτοιο. Δεν μπορείς να αποκόψεις βαριάντες (pruning) γιατί είναι ομοιόμορφος ο χώρος αναζήτησης.

 

Αυτός είναι και ο λόγος που δεν χρησιμοποιείτε αμιγώς αναλυτική αναζήτηση (χρησιμοποιούν monte carlo search trees) αλλά και τεχνητή νοημοσύνη (που δεν είναι τίποτα άλλο από μια συνάρτηση αξιολόγησης δομημένη σαν νευρωνικό δίκτυο. Αυτό είναι και το σημαντικό κομμάτι της όλης διαδικασίας. Η ικανότητα να αναγνωρίζει και να αξιολογεί τοπικά μοτίβα.

Συμφωνώ απόλυτα, δε χρησιμοποιείται μόνο MCTS, ωστόσο πέρα από την αναγνώριση μοτίβων και την εκμάθηση υπάρχει και το δυναμικό κομμάτι. Ότι αναγνωρίζει το παιχνίδι ενώ αυτό συμβαίνει και προσαρμόζεται. Δες τις δηλώσεις των δύο ανθρώπων πρωταθλητών, και οι δύο επαναλαμβάνουν συνέχεια ότι αλλάζει δραστικά από παιχνίδι σε παιχνίδι και μέσα στο παιχνίδι.

Παρεμπιπτόντως το elo rating του είναι στον Θεό και ανεβαίνει.

  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Πολύ καλά τα λέει ο buffos και συμφωνώ. Εσύ δε τα λες καλά. Το ότι είναι παιχνίδι πλήρους πληροφόρησης ως πληροφορία έχει αξία μόνο αν έχει λυθεί. Δηλαδή υπάρχει τρόπος να υπολογιστούν όλες οι πιθανές θέσεις από μια αρχική τοποθέτηση των πιονιων.

Εδώ υπάρχει σε λειτουργία ένα νευρωνικό δίκτυο αυτό της deep mind και όχι επίλυση. Διάλεξε τι θες να πεις.

 

Γράφεις "Το Go, όπως και το σκάκι, είναι παιχνίδι πλήρους πληροφόρησης.

Δηλαδή το σύστημα AI δεν χρειάζεται να κάνει υποθέσεις για άγνωστες παραμέτρους."

 

Που ασφαλώς και δεν ισχύει δεδομένου ότι παρότι παιχνίδι πλήρους πληροφόρησης δεν έχει λυθεί.

 

Πλήρους πληροφόρησης είναι ένα game όταν όλες οι αναγκαίες για την επόμενη κίνηση πληροφορίες είναι διαθέσιμες.

Δηλαδή ρίχνεις μια ματιά στη σκακιέρα και βλέπεις τη διάταξη των δικών σου πιονιών και του αντιπάλου. Δεν κρύβονται τα κομμάτια του αντιπάλου σου όπως κρύβεται π.χ. ο εχθρικός στρατός στο starcraft.

Επίσης, το παρελθόν του game(παλιότερες κινήσεις) δεν παίζει κανένα ρόλο στην απόφαση για την τρέχουσα κίνηση. Μπορεί ο Κασπάροφ π.χ. να πάρει έναν αγώνα στη μέση και να τον κερδίσει στη συνέχεια χωρίς να ενδιαφέρεται μετά από ποιές κινήσεις έφτασαν τα πράγματα εκεί που τα παρέλαβε.  

 

Στην αληθινή ζωή, αν βρίσκεσαι π.χ. μέσα σε ένα κτίριο και θες να βγεις από αυτό, δεν μπορείς να το κάνεις αν δεν διαθέτεις μνήμη για να θυμάσαι τη δομή του.

 

Όταν κάποιος σου πει καταλάθος "Ο σκύλος έτρεξε και έπιασε την λάμπα" εσύ καταλαβαίνεις ότι ήθελε να πει "μπάλα" κατά πάσα πιθανότητα, γιατί φέρνεις στο μυαλό σου σχετικές εικόνες, βάσει των εμπειριών σου. Εικόνες αποθηκευμένες στη μνήμη σου που δεν έχουν καμία σχέση με τα ερεθίσματα που έχεις εκείνη τη στιγμή μπροστά σου(αυτόν που σου μιλάει).

Το μυαλό σου ταξιδεύει σε μέλλον, παρελθόν και σε υποθετικά μέρη για να δώσει λύσεις. Έχεις ένα μοντέλο του έξω κόσμου μέσα σου.

 

Όταν αποκτήσουν τέτοιες δυνατότητες τα AI συστήματα τα ξαναλέμε. Εμένα πάντως δεν με βλέπω ζωντανό μέχρι τότε.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα

  • Δημιουργία νέου...