Την Τρίτη, η Meta AI ανακοίνωσε την ανάπτυξη του Cicero, η πρώτη Τεχνητή Νοημοσύνη (ΤΝ) που επιτυγχάνει επιδόσεις σε ανθρώπινο επίπεδο στο στρατηγικό επιτραπέζιο παιχνίδι Diplomacy. Είναι ένα αξιοσημείωτο επίτευγμα γιατί το παιχνίδι απαιτεί βαθιές διαπροσωπικές διαπραγματευτικές δεξιότητες, κάτι που σημαίνει ότι ο Cicero έχει αποκτήσει μια ορισμένη γνώση της γλώσσας που είναι απαραίτητη για να κερδίσει το παιχνίδι.
Ακόμη και πριν ο Deep Blue κερδίσει τον Garry Kasparov στο σκάκι το 1997, τα επιτραπέζια παιχνίδια ήταν ένα χρήσιμο μέτρο για το επίτευγμα της τεχνητής νοημοσύνης. Το 2015, ένα άλλο εμπόδιο έπεσε όταν η AlphaGo νίκησε τον master του Go Lee Sedol. Και τα δύο αυτά παιχνίδια ακολουθούν ένα σχετικά σαφές σύνολο αναλυτικών κανόνων (αν και οι κανόνες του Go είναι συνήθως απλοποιημένοι για την τεχνητή νοημοσύνη του υπολογιστή).
Αλλά με το Diplomacy, ένα μεγάλο μέρος του παιχνιδιού περιλαμβάνει κοινωνικές δεξιότητες. Οι παίκτες πρέπει να δείξουν ενσυναίσθηση, να χρησιμοποιήσουν φυσική γλώσσα και να χτίσουν σχέσεις για να κερδίσουν — ένα δύσκολο έργο για έναν παίκτη υπολογιστή. Έχοντας αυτό κατά νου, η εταιρία ρώτησε: «Μπορούμε να δημιουργήσουμε πιο αποτελεσματικούς και ευέλικτους πράκτορες που να μπορούν να χρησιμοποιούν τη γλώσσα για να διαπραγματεύονται, να πείθουν και να συνεργάζονται με τους ανθρώπους για να επιτύχουν στρατηγικούς στόχους παρόμοιους με τον τρόπο που κάνουν οι άνθρωποι;»
Σύμφωνα με την Meta, η απάντηση είναι ναι. Ο Cicero έμαθε τις δεξιότητές του παίζοντας μια διαδικτυακή έκδοση του Diplomacy στο https://webdiplomacy.net/.
Για να δημιουργήσει το Cicero, η Meta συγκέντρωσε μοντέλα τεχνητής νοημοσύνης για στρατηγικό συλλογισμό (παρόμοιο με το AlphaGo) και επεξεργασία φυσικής γλώσσας (παρόμοια με το GPT-3) και τα συνέταξε σε έναν παράγοντα. Κατά τη διάρκεια κάθε παιχνιδιού, ο Κικέρων εξετάζει την κατάσταση του ταμπλό του παιχνιδιού και το ιστορικό συνομιλιών και προβλέπει πώς θα ενεργήσουν οι άλλοι παίκτες. Κατασκευάζει ένα σχέδιο που εκτελεί μέσω ενός γλωσσικού μοντέλου που μπορεί να δημιουργήσει διάλογο που μοιάζει με άνθρωπο, επιτρέποντάς του να συντονιστεί με άλλους παίκτες.
H Meta AI αποκαλεί τις δεξιότητες φυσικής γλώσσας του Cicero «ελεγχόμενο μοντέλο διαλόγου», όπου βρίσκεται η καρδιά της προσωπικότητας του Cicero. Όπως το GPT-3, ο Cicero αντλεί από ένα μεγάλο σώμα κειμένου στο Διαδίκτυο που έχει ανακτηθεί από τον Ιστό. «Για να δημιουργήσουμε ένα ελεγχόμενο μοντέλο διαλόγου, ξεκινήσαμε με ένα μοντέλο γλώσσας τύπου BART 2,7 δισεκατομμυρίων παραμέτρων, προεκπαιδευμένο σε κείμενο από το Διαδίκτυο και συντονισμένο σε πάνω από 40.000 ανθρώπινα παιχνίδια στο https://webdiplomacy.net/. Το μοντέλο που προέκυψε κατέκτησε τις περιπλοκές ενός πολύπλοκου παιχνιδιού. «Ο Cicero μπορεί να συμπεράνει, για παράδειγμα, ότι αργότερα στο παιχνίδι θα χρειαστεί την υποστήριξη ενός συγκεκριμένου παίκτη», λέει ο Meta AI, «και στη συνέχεια να δημιουργήσει μια στρατηγική για να κερδίσει την εύνοια αυτού του ατόμου—και ακόμη και να αναγνωρίσει τους κινδύνους και τις ευκαιρίες που βλέπει αυτός ο παίκτης, από την ιδιαίτερη σκοπιά τους».
Recommended Comments
There are no comments to display.
Create an account or sign in to comment
You need to be a member in order to leave a comment
Create an account
Sign up for a new account in our community. It's easy!
Register a new accountSign in
Already have an account? Sign in here.
Sign In Now