Στα χνάρια του ChatGPT, δημιουργήθηκε ένα νέο εργαλείο τεχνητής νοημοσύνης που μπορεί να δημιουργήσει μουσική. Αφού ξεκινήσαμε από την συγγραφή και την δημιουργία έργων τέχνης, η τεχνητή νοημοσύνη μπορεί πλέον να δημιουργήσει μουσική χρησιμοποιώντας απλό κείμενο. Αυτό γίνεται μέσω του νέου συστήματος Τ.Ν. της Google που ονομάζεται MusicLM που μπορεί να δημιουργήσει μουσική για οποιοδήποτε μουσικό είδος και περίσταση.
Η Google περιγράφει το MusicLM ως «ένα μοντέλο που δημιουργεί μουσική υψηλής πιστότητας από περιγραφές σε απλό κείμενο». Μπορεί να δημιουργήσει σύνθετες συνθέσεις στα 24 kHz που παραμένουν συνεχείς για αρκετά λεπτά. Οι περιγραφές των κειμένων είναι εξαιρετικά λεπτομερείς και περιλαμβάνουν το ύφος, το είδος, ακόμη και τη διάθεση και το ρυθμό της μελωδίας.
Αυτό που είναι εκπληκτικό είναι ότι η τεχνητή νοημοσύνη καταφέρνει να συλλάβει επίσης αποχρώσεις όπως μελωδίες και διαθέσεις. Μπορείτε να ακούσετε πώς ακούγεται η μουσική που δημιουργείται από AI στο ερευνητικό έγγραφο της Google.
Δεν είναι η πρώτη φορά που η Τεχνητή Νοημοσύνη χρησιμοποιείται για τη δημιουργία μουσικής. Έχουν γίνει πολλές προσπάθειες όπως το Riffusion, το Dance Diffusion και το AudioML που ανήκει στην Google. Ακόμη και το OpenAI του ChatGPT έχει τη δική του Τεχνητή Νοημοσύνη που δημιουργεί μουσική, που ονομάζεται Jukebox, αλλά δεν ήταν τόσο επιτυχημένο όσο το MusicLM στη δημιουργία πολυεπίπεδων μελωδιών.
Το MusicLM εκπαιδεύτηκε σε ένα σύνολο δεδομένων 280.000 ωρών μουσικής για να δημιουργήσει τραγούδια με κάποιο επίπεδο πολυπλοκότητας. Η Τ.Ν. παίρνει τις περιγραφές και δημιουργεί μια «ιεραρχική εργασία μοντελοποίησης ακολουθίας σε ακολουθία» (hierarchical sequence-to-sequence modeling task) και μπορεί να δημιουργήσει μια μουσική αφήγηση που κυμαίνεται έως και 5 λεπτά με βάση τη διάρκεια της περιγραφής.
Υπάρχει όμως ένα θέμα. Η Google έχει εκπαιδεύσει την τεχνητή νοημοσύνη σε μουσική που προστατεύεται από πνευματικά δικαιώματα και εξαιτίας αυτού, οι ερευνητές διαπίστωσαν ότι το 1% των παραδειγμάτων μπορεί να συσχετιστεί με υπάρχοντα τραγούδια. Αυτό θα μπορούσε να εγείρει πολλές ηθικά θέματα, καθώς η τεχνητή νοημοσύνη θα μπορούσε εύκολα να αντιγράψει υλικό το οποίο προστατεύεται από πνευματικά δικαιώματα και αυτός είναι ο λόγος για τον οποίο η Google δεν θα κυκλοφορήσει αυτό το εργαλείο σύντομα.
Οι συν-συγγραφείς της ερευνητικής εργασίας το αναγνώρισαν αυτό λέγοντας: «Τονίζουμε έντονα την ανάγκη για περισσότερη μελλοντική δουλειά για την αντιμετώπιση αυτών των κινδύνων που σχετίζονται με τη μουσική παραγωγή».
Ωστόσο, η Google έχει διαθέσει 5.500 παραδείγματα ζευγαριών μουσικής-κειμένου για όποιον θέλει να ακούσει τις δημιουργίες του MusicLM.
Ενώ το ChatGPT έχει κατακλύσει τον κόσμο, ίσως να μην συμβεί το ίδιο και στο MusicLM, καθώς δεν θα κυκλοφορήσει, τουλάχιστον σύντομα, αλλά είναι ένα άλλο μεγάλο βήμα στην πρόοδο της τεχνητής νοημοσύνης.
Recommended Comments
Create an account or sign in to comment
You need to be a member in order to leave a comment
Create an account
Sign up for a new account in our community. It's easy!
Register a new accountSign in
Already have an account? Sign in here.
Sign In Now