Η OpenAI αποκαλύπτει το Sora: Τη γεννήτρια μετατροπής κειμένου σε βίντεο του OpenAI

Από astrolabos

Φεβρουάριος 16, 2024
Από astrolabos • Φεβρουάριος 16, 2024

Η OpenAI αποκαλύπτει το Sora: Τη γεννήτρια μετατροπής κειμένου σε βίντεο του OpenAI

Followers 2
Η OpenAI παρουσίασε το μοντέλο μετατροπής κειμένου σε βίντεο με την ονομασία Sora, με στόχο να ανταγωνιστεί τεχνολογικούς γίγαντες όπως η Google, η Microsoft. Το Sora, που προβάλλεται ως διεκδικητής στο εξελισσόμενο τοπίο της τεχνητής νοημοσύνης, φέρνει μοναδικά χαρακτηριστικά και δυνατότητες στο τραπέζι, διαφοροποιώντας το από τους ανταγωνιστές του.

Η αποκάλυψη του Sora ακολουθεί το Lumiere της Google, και όπως και το αντίστοιχό του, έχει σχεδιαστεί για να μετατρέπει κείμενο σε περιεχόμενο βίντεο. Ειδικότερα, το Sora μπορεί να δημιουργήσει βίντεο μήκους έως και 1 λεπτού, ξεπερνώντας τους περιορισμούς του Lumiere της Google. Η εξέλιξη αυτή σηματοδοτεί την κλιμακούμενη κούρσα εξοπλισμών στον τομέα της δημιουργικής τεχνητής νοημοσύνης, καθώς οι μεγάλοι παίκτες κοιτάζουν πέρα από την παραγωγή κειμένου και εικόνων, προσπαθώντας να εδραιώσουν τις θέσεις τους σε έναν τομέα που αναμένεται να φτάσει σε έσοδα 1,3 τρισεκατομμυρίων δολαρίων μέχρι το 2032.

Η απόφαση της OpenAI να περιορίσει τη διαθεσιμότητα του Sora απηχεί τη στρατηγική που εφάρμοσε η Google με το Lumiere. Ωστόσο, το Sora διαφοροποιείται στο ότι επιτρέπει στους χρήστες να δημιουργούν βίντεο διάρκειας έως και ενός λεπτού, προσφέροντας μεγαλύτερη ευελιξία στη δημιουργία περιεχομένου.

Η OpenAI σχεδιάζει να διαθέσει το Sora σε "κόκκινες ομάδες", εμπειρογνώμονες σε τομείς όπως η παραπληροφόρηση, το περιεχόμενο μίσους και η προκατάληψη, οι οποίοι θα διεξάγουν δοκιμές στο μοντέλο κατ'αντιπαράθεση. Επιπλέον, εικαστικοί καλλιτέχνες, σχεδιαστές και κινηματογραφιστές θα κληθούν να παράσχουν ανατροφοδότηση, τονίζοντας τη σημασία των διαφορετικών προοπτικών για την τελειοποίηση της τεχνολογίας. Η αντιπαραθετική δοκιμή αποσκοπεί στην αντιμετώπιση των ανησυχιών που σχετίζονται με τη δημιουργία deep fakes, ένα σημαντικό ζήτημα στην κοινότητα της τεχνητής νοημοσύνης.

Ένα από τα αξιοσημείωτα πλεονεκτήματα του Sora είναι η ικανότητά του να ερμηνεύει μακροσκελείς προτροπές, συμπεριλαμβανομένων εκείνων που περιέχουν μέχρι και 135 λέξεις. Αξιοποιώντας την προηγούμενη εργασία του OpenAI με μοντέλα όπως το Dall-E και το GPT, το Sora μπορεί να δημιουργήσει ποικίλες και ρεαλιστικές σκηνές, από ανθρώπους και ζώα μέχρι αστικά τοπία και υποβρύχια περιβάλλοντα. Η τεχνική αναδιήγησης του μοντέλου, δανεισμένη από το Dall-E 3, του επιτρέπει να παράγει εξαιρετικά περιγραφικές λεζάντες για οπτικά δεδομένα εκπαίδευσης, ενισχύοντας τις δυνατότητες δημιουργίας σκηνών.

Τα δείγματα βίντεο του Sora αποδεικνύουν την ικανότητά του στη δημιουργία σύνθετων σκηνών με πολλούς χαρακτήρες, συγκεκριμένους τύπους κίνησης και ακριβείς λεπτομέρειες των θεμάτων και του φόντου. Το μοντέλο υπερβαίνει την απλή κατανόηση της προτροπής του χρήστη, επιδεικνύοντας μια κατανόηση του τρόπου με τον οποίο υπάρχουν στοιχεία στον φυσικό κόσμο.

Παρά τα δυνατά του σημεία, το Sora δεν είναι χωρίς περιορισμούς. Η OpenAI αναγνωρίζει ότι το μοντέλο μπορεί να δυσκολεύεται να απεικονίσει με ακρίβεια τη φυσική πολύπλοκων σκηνών και να κατανοήσει την αιτία και το αποτέλεσμα. Ένα παράδειγμα που παρέχεται αποκαλύπτει περιπτώσεις όπου ένα άτομο μπορεί να δαγκώσει ένα μπισκότο, αλλά το μπισκότο μπορεί να μην έχει το αντίστοιχο σημάδι δαγκώματος. Επιπλέον, το Sora παρουσιάζει προκλήσεις στη διάκριση μεταξύ αριστερού και δεξιού, όπως και πολλοί από εμάς αντιμετωπίζουν το ίδιο πρόβλημα.

Το OpenAI οραματίζεται το Sora ως ένα θεμελιώδες μοντέλο για την κατανόηση και την προσομοίωση του πραγματικού κόσμου, σηματοδοτώντας ένα σημαντικό βήμα προς την επίτευξη της τεχνητής γενικής νοημοσύνης (AGI). Η AGI αντιπροσωπεύει μια πιο προηγμένη μορφή τεχνητής νοημοσύνης, που μοιάζει πολύ με την ανθρώπινη νοημοσύνη και περιλαμβάνει ένα ευρύτερο φάσμα εργασιών.

Ενώ η OpenAI δεν έχει αποκαλύψει την ευρεία διαθεσιμότητα του Sora, η εταιρεία τονίζει τη σημασία της λήψης "αρκετών σημαντικών μέτρων ασφαλείας" πριν από την κυκλοφορία του. Τα βήματα αυτά περιλαμβάνουν την τήρηση των υφιστάμενων προτύπων ασφαλείας, απαγορεύοντας περιεχόμενο που περιλαμβάνει ακραία βία, σεξουαλικό περιεχόμενο, εικόνες μίσους, ομοιώματα διασημοτήτων και άλλα. Η OpenAI αναγνωρίζει την εξελισσόμενη φύση των εφαρμογών τεχνητής νοημοσύνης και τονίζει τη σημασία της μάθησης από την πραγματική χρήση για την ενίσχυση των μέτρων ασφαλείας με την πάροδο του χρόνου.
openai

sora

μετατροπή κειμένου σε βίντεο

τεχνητή νοημοσύνη
Πηγή
Φωτογραφία: Lisa Lacy/CNET
Κοινοποίηση
https://www.thelab.gr/news/%CF%84%CE%B5%CF%87%CE%BD%CE%B7%CF%84%CE%AE-%CE%BD%CE%BF%CE%B7%CE%BC%CE%BF%CF%83%CF%8D%CE%BD%CE%B7/%CE%B7-openai-%CE%B1%CF%80%CE%BF%CE%BA%CE%B1%CE%BB%CF%8D%CF%80%CF%84%CE%B5%CE%B9-%CF%84%CE%BF-sora-%CF%84%CE%B7-%CE%B3%CE%B5%CE%BD%CE%BD%CE%AE%CF%84%CF%81%CE%B9%CE%B1-%CE%BC%CE%B5%CF%84%CE%B1%CF%84%CF%81%CE%BF%CF%80%CE%AE%CF%82-%CE%BA%CE%B5%CE%B9%CE%BC%CE%AD%CE%BD%CE%BF%CF%85-%CF%83%CE%B5-%CE%B2%CE%AF%CE%BD%CF%84%CE%B5%CE%BF-%CF%84%CE%BF%CF%85-openai/
Followers 2
Ακολουθήστε μας στο Google News για να λαμβάνετε πρώτοι όλες τις τεχνολογικές μας ειδήσεις καθώς και τις τελευταίες μας κριτικές προϊόντων.

Go to ειδήσεις

User Feedback
0 Comments
Recommended Comments

There are no comments to display.

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!
Register a new account

Sign in

Already have an account? Sign in here.
Sign In Now

Similar Content
- Η Meta αρχίζει να χρησιμοποιεί δεδομένα Ευρωπαίων χρηστών για την εκπαίδευση των AI μοντέλων της
  
  By astrolabos, 23 ώρες πριν
  - meta
  - δεδομένα
  - (και 3 επιπλέον)
    
    Tagged with:
    
    meta
    
    δεδομένα
    
    εκπαίδευση
    
    ευρωπαϊκή ένωση
    
    τεχνητή νοημοσύνη
  - 1 comment
  - 119 views
- Η NVIDIA εγκαινιάζει την αμερικανική παραγωγή υπερυπολογιστών ΤΝ με τα πρώτα εργοστάσια σε Αριζόνα και Τέξας
  
  By astrolabos, Δευτέρα at 02:38 μμ
  - amkor
  - blackwell
  - (και 8 επιπλέον)
    
    Tagged with:
    
    amkor
    
    blackwell
    
    foxconn
    
    nvidia
    
    spil
    
    tsmc
    
    wistron
    
    ηπα
    
    τεχνητή νοημοσύνη
    
    υπερυπολογιστής
  - 2 comments
  - 226 views
- OLMoTrace: Το εργαλείο που δείχνει από πού προέρχεται η πληροφορία μιας απάντησης TN
  
  By astrolabos, Πέμπτη at 03:06 μμ
  - black box
  - glass box
  - (και 3 επιπλέον)
    
    Tagged with:
    
    black box
    
    glass box
    
    olmotrace
    
    open-source
    
    τεχνητή νοημοσύνη
  - 0 comments
  - 246 views
- WHAMM: Η Microsoft παρουσιάζει ρεαλιστικό gameplay με ΤΝ μέσα από μοντέλο που «παίζει» Quake II σε πραγματικό χρόνο
  
  By astrolabos, Απρίλιος 6
  - gameplay
  - microsoft
  - (και 3 επιπλέον)
    
    Tagged with:
    
    gameplay
    
    microsoft
    
    quake ii
    
    whamm
    
    τεχνητή νοημοσύνη
  - 0 comments
  - 260 views
- Η Microsoft εντοπίζει 20 νέες ευπάθειες σε GRUB2, U-Boot και Barebox μέσω εργαλείου ΤΝ
  
  By astrolabos, Απρίλιος 2
  - barebox
  - grub2
  - (και 3 επιπλέον)
    
    Tagged with:
    
    barebox
    
    grub2
    
    microsoft
    
    u-boot
    
    τεχνητή νοημοσύνη
  - 1 comment
  - 322 views

Sign In

Η OpenAI αποκαλύπτει το Sora: Τη γεννήτρια μετατροπής κειμένου σε βίντεο του OpenAI

User Feedback

Recommended Comments

Create an account or sign in to comment

Create an account

Sign in

Similar Content

Η Meta αρχίζει να χρησιμοποιεί δεδομένα Ευρωπαίων χρηστών για την εκπαίδευση των AI μοντέλων της

Η NVIDIA εγκαινιάζει την αμερικανική παραγωγή υπερυπολογιστών ΤΝ με τα πρώτα εργοστάσια σε Αριζόνα και Τέξας

OLMoTrace: Το εργαλείο που δείχνει από πού προέρχεται η πληροφορία μιας απάντησης TN

WHAMM: Η Microsoft παρουσιάζει ρεαλιστικό gameplay με ΤΝ μέσα από μοντέλο που «παίζει» Quake II σε πραγματικό χρόνο

Η Microsoft εντοπίζει 20 νέες ευπάθειες σε GRUB2, U-Boot και Barebox μέσω εργαλείου ΤΝ

Αρχική

Blogs

Νέο Περιεχόμενο

Important Information