Jump to content



  • astrolabos
    astrolabos

    Η Google σχεδιάζει μοντέλο γλώσσας τεχνητής νοημοσύνης που υποστηρίζει τις 1.000 πιο ομιλούμενες γλώσσες

    Η Google ανακοίνωσε ένα φιλόδοξο νέο έργο για την ανάπτυξη ενός ενιαίου μοντέλου γλώσσας τεχνητής νοημοσύνης που υποστηρίζει τις «1.000 πιο ομιλούμενες γλώσσες» στον κόσμο. Ως πρώτο βήμα προς αυτόν τον στόχο, η εταιρεία αποκαλύπτει ένα μοντέλο AI εκπαιδευμένο σε περισσότερες από 400 γλώσσες, το οποίο περιγράφει ως «τη μεγαλύτερη γλωσσική κάλυψη που παρατηρείται σε μοντέλο ομιλίας σήμερα». Η «Πρωτοβουλία 1.000 Γλωσσών» της Google δεν εστιάζει σε κάποια συγκεκριμένη λειτουργικότητα, αλλά στη δημιουργία ενός ενιαίου συστήματος με τεράστιο εύρος γνώσης σε όλες τις γλώσσες του κόσμου.

    Μιλώντας στο The Verge, ο Zoubin Ghahramani, αντιπρόεδρος έρευνας στο Google AI, είπε ότι η εταιρεία πιστεύει ότι η δημιουργία ενός μοντέλου αυτού του μεγέθους θα διευκολύνει τη μεταφορά διαφόρων λειτουργιών τεχνητής νοημοσύνης σε γλώσσες που παρουσιάζονται ελάχιστα σε διαδικτυακούς χώρους και σε σύνολα δεδομένων εκπαίδευσης AI ( επίσης γνωστές ως "γλώσσες χαμηλών πόρων"). «Έχοντας ένα ενιαίο μοντέλο που είναι εκτεθειμένο και εκπαιδευμένο σε πολλές διαφορετικές γλώσσες, έχουμε πολύ καλύτερη απόδοση στις γλώσσες μας με χαμηλούς πόρους», λέει ο Ghahramani. "Ο τρόπος με τον οποίο φτάνουμε στις 1.000 γλώσσες δεν είναι χτίζοντας 1.000 διαφορετικά μοντέλα. Οι γλώσσες είναι σαν οργανισμούς, έχουν εξελιχθεί η μία από την άλλη και έχουν ορισμένες ομοιότητες. Έχουμε κάνει αρκετά θεαματική πρόοδο σε αυτό που ονομάζουμε μάθηση μηδενικής λήψης όταν ενσωματώνουμε δεδομένα από μια νέα γλώσσα στο μοντέλο 1.000 γλωσσών μας και έχουμε τη δυνατότητα να μεταφράσουμε [ό,τι έμαθε] από μια γλώσσα με υψηλούς πόρους σε μια γλώσσα χαμηλών πόρων."

    Ωστόσο, η πρόσβαση σε δεδομένα αποτελεί πρόβλημα κατά την εκπαίδευση σε τόσες πολλές γλώσσες, και η Google λέει ότι για να υποστηρίξει την εργασία στο μοντέλο των 1.000 γλωσσών θα χρηματοδοτήσει τη συλλογή δεδομένων για γλώσσες χαμηλών πόρων, συμπεριλαμβανομένων ηχογραφήσεων και γραπτών κειμένων . Η εταιρεία λέει ότι δεν έχει άμεσα σχέδια για το πού θα εφαρμόσει τη λειτουργικότητα αυτού του μοντέλου -- μόνο ότι αναμένει ότι θα έχει μια σειρά χρήσεων στα προϊόντα της Google, από τη Μετάφραση Google έως τους υπότιτλους του YouTube και πολλά άλλα. «Ένα από τα πραγματικά ενδιαφέροντα πράγματα σχετικά με τα μεγάλα γλωσσικά μοντέλα και την γλωσσική έρευνα γενικά είναι ότι μπορούν να κάνουν πολλές και πολλές διαφορετικές εργασίες», λέει ο Ghahramani. "Το ίδιο μοντέλο γλώσσας μπορεί να μετατρέψει εντολές για ένα ρομπότ σε κώδικα, μπορεί να λύσει μαθηματικά προβλήματα, μπορεί να κάνει μετάφραση. Τα πραγματικά ενδιαφέροντα πράγματα σχετικά με τα γλωσσικά μοντέλα είναι ότι γίνονται αποθήκες πολλών γνώσεων και εξετάζοντάς τα σε διαφορετικές τρόπους με τους οποίους μπορείτε να φτάσετε σε διαφορετικά κομμάτια χρήσιμης λειτουργικότητας."


    Πηγή
    Φωτογραφία: Alex Castro / The Verge
×
×
  • Δημιουργία...

Important Information

Ο ιστότοπος theLab.gr χρησιμοποιεί cookies για να διασφαλίσει την καλύτερη εμπειρία σας κατά την περιήγηση. Μπορείτε να προσαρμόσετε τις ρυθμίσεις των cookies σας , διαφορετικά θα υποθέσουμε ότι είστε εντάξει για να συνεχίσετε.