Το OpenAI κυκλοφορεί το Point-E, το οποίο είναι σαν το DALL-E αλλά για 3D μοντελοποίηση

Από astrolabos

Δεκέμβριος 21, 2022
Από astrolabos • Δεκέμβριος 21, 2022

Το OpenAI κυκλοφορεί το Point-E, το οποίο είναι σαν το DALL-E αλλά για 3D μοντελοποίηση

Followers 2
Η OpenAI, η startup τεχνητής νοημοσύνης του Elon Musk, που βρίσκεται πίσω από τη δημοφιλή συσκευή δημιουργίας κειμένου σε εικόνα DALL-E, ανακοίνωσε την Τρίτη την κυκλοφορία μιας νεότερης μηχανής δημιουργίας εικόνων, την POINT-E, η οποία μπορεί να παράγει τρισδιάστατα "σύννεφα σημείων" απευθείας από μηνύματα κειμένου. Ενώ τα υπάρχοντα συστήματα όπως το DreamFusion της Google απαιτούν συνήθως πολλές ώρες — και GPU — για να δημιουργήσουν τις εικόνες τους, το Point-E χρειάζεται μόνο μία GPU και ένα ή δύο λεπτά.

Τα συστήματα Text-to-Image όπως το DALL-E 2 και το Craiyon του OpenAI, το DeepAI, το Lensa του Prisma Lab ή το Stable Diffusion του HuggingFace, έχουν κερδίσει γρήγορα δημοτικότητα, φήμη και αλλά και αρνητικές κριτικές τα τελευταία χρόνια. Το κείμενο σε 3D είναι ένα παρακλάδι αυτής της έρευνας. Το Point-E, σε αντίθεση με παρόμοια συστήματα, "εκμεταλλεύεται ένα μεγάλο σώμα ζευγών (κείμενο, εικόνα), επιτρέποντάς του να ακολουθεί ποικίλες και πολύπλοκες οδηγίες, ενώ το μοντέλο από εικόνα σε 3D εκπαιδεύεται σε ένα μικρότερο σύνολο ζευγαριών δεδομένων (εικόνα και 3D)», έγραψε η ερευνητική ομάδα OpenAI με επικεφαλής τον Alex Nichol στο Point E: A System for Generating 3D Point Cloud from Complex Prompts, που δημοσιεύτηκε την περασμένη εβδομάδα. "Για να δημιουργήσουμε ένα τρισδιάστατο αντικείμενο από γραμμή εντολών κειμένου, πρώτα δειγματίζουμε μια εικόνα χρησιμοποιώντας το μοντέλο κειμένου σε εικόνα και, στη συνέχεια, δειγματίζουμε ένα τρισδιάστατο αντικείμενο που εξαρτάται από την δειγματοληπτική εικόνα. Και τα δύο αυτά βήματα μπορούν να εκτελεστούν σε μερικά δευτερόλεπτα, και δεν απαιτούν ακριβές διαδικασίες βελτιστοποίησης».

Εάν εισαγάγατε ένα μήνυμα κειμένου, ας πούμε, "Μια γάτα που τρώει ένα burrito", το Point-E θα δημιουργήσει πρώτα μια συνθετική προβολή 3D απόδοσης της εν λόγω γάτας που τρώει burrito. Στη συνέχεια, θα τρέξει αυτή την εικόνα που δημιουργείται μέσω μιας σειράς μοντέλων διάχυσης για να δημιουργήσει το τρισδιάστατο νέφος σημείων RGB της αρχικής εικόνας - πρώτα δημιουργώντας ένα χονδροειδές μοντέλο νέφους 1.024 σημείων και μετά ένα λεπτότερο 4.096 σημείων. «Στην πράξη, υποθέτουμε ότι η εικόνα περιέχει τις σχετικές πληροφορίες από το κείμενο και δεν ρυθμίζουμε ρητά τα σύννεφα σημείων στο κείμενο», επισημαίνει η ερευνητική ομάδα.

Αυτά τα μοντέλα διάχυσης εκπαιδεύτηκαν το καθένα σε «εκατομμύρια» τρισδιάστατα μοντέλα, όλα μετατράπηκαν σε τυποποιημένες μορφές. «Ενώ η μέθοδός μας αποδίδει χειρότερα σε σχέση με τις τεχνικές αιχμής», παραδέχεται η ομάδα, «παράγει δείγματα σε μικρό κλάσμα του χρόνου». Εάν θέλετε να το δοκιμάσετε μόνοι σας, το OpenAI έχει δημοσιεύσει τον Open Source κώδικα του έργου στο Github.
3d

dall-e

openai

point-e
Πηγή
2

2
Κοινοποίηση
https://www.thelab.gr/news/tech-industry/%CF%84%CE%BF-openai-%CE%BA%CF%85%CE%BA%CE%BB%CE%BF%CF%86%CE%BF%CF%81%CE%B5%CE%AF-%CF%84%CE%BF-point-e-%CF%84%CE%BF-%CE%BF%CF%80%CE%BF%CE%AF%CE%BF-%CE%B5%CE%AF%CE%BD%CE%B1%CE%B9-%CF%83%CE%B1%CE%BD-%CF%84%CE%BF-dall-e-%CE%B1%CE%BB%CE%BB%CE%AC-%CE%B3%CE%B9%CE%B1-3d-%CE%BC%CE%BF%CE%BD%CF%84%CE%B5%CE%BB%CE%BF%CF%80%CE%BF%CE%AF%CE%B7%CF%83%CE%B7-r8206/
Followers 2
Ακολουθήστε μας στο Google News για να λαμβάνετε πρώτοι όλες τις τεχνολογικές μας ειδήσεις καθώς και τις τελευταίες μας κριτικές προϊόντων.

Go to ειδήσεις

User Feedback
0 Comments
Recommended Comments

There are no comments to display.

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!
Register a new account

Sign in

Already have an account? Sign in here.
Sign In Now

Similar Content
- Η Samsung παρουσιάζει τις νέες οθόνες Odyssey για το 2025 με έμφαση σε 3D χωρίς γυαλιά και OLED 4K στα 240Hz
  
  By astrolabos, Μάρτιος 24
  - 3d
  - 240hz
  - (και 3 επιπλέον)
    
    Tagged with:
    
    3d
    
    240hz
    
    odyssey
    
    oled 4k
    
    samsung
  - 0 comments
  - 519 views
- Η Microsoft αναπτύσσει νέα γενιά AI μοντέλων που ανταγωνίζονται OpenAI και Anthropic
  
  By astrolabos, Μάρτιος 8
  - ai μοντέλα
  - anthropic
  - (και 5 επιπλέον)
    
    Tagged with:
    
    ai μοντέλα
    
    anthropic
    
    claude
    
    gpt
    
    microsoft
    
    openai
    
    τεχνητή νοημοσύνη
  - 0 comments
  - 400 views
- OpenAI: Έρχεται το GPT-4.5 και το GPT-5 με Ενοποιημένη Νοημοσύνη
  
  By astrolabos, Φεβρουάριος 14
  - altman
  - chain-of-thought
  - (και 5 επιπλέον)
    
    Tagged with:
    
    altman
    
    chain-of-thought
    
    chatgpt
    
    gpt-4.5
    
    gpt-5
    
    openai
    
    τεχνητή νοημοσύνη
  - 0 comments
  - 413 views
- Η OpenAI Σχεδιάζει τα Δικά της Τσιπ Τεχνητής Νοημοσύνης για να Μειώσει την Εξάρτηση από την Nvidia
  
  By astrolabos, Φεβρουάριος 11
  - broadcom
  - chatgpt
  - (και 5 επιπλέον)
    
    Tagged with:
    
    broadcom
    
    chatgpt
    
    nvidia
    
    openai
    
    reuters
    
    taping out
    
    tsmc
  - 0 comments
  - 337 views
- Το Χάρβαρντ διαθέτει ανοιχτό dataset 1 εκατομμυρίου βιβλίων για εκπαίδευση Τεχνητής Νοημοσύνης
  
  By astrolabos, Δεκέμβριος 19, 2024
  - idi
  - institutional data initiative
  - (και 4 επιπλέον)
    
    Tagged with:
    
    idi
    
    institutional data initiative
    
    microsoft
    
    openai
    
    τεχνητή νοημοσύνη
    
    χάρβαρντ
  - 0 comments
  - 407 views

Sign In

Το OpenAI κυκλοφορεί το Point-E, το οποίο είναι σαν το DALL-E αλλά για 3D μοντελοποίηση

User Feedback

Recommended Comments

Create an account or sign in to comment

Create an account

Sign in

Similar Content

Η Samsung παρουσιάζει τις νέες οθόνες Odyssey για το 2025 με έμφαση σε 3D χωρίς γυαλιά και OLED 4K στα 240Hz

Η Microsoft αναπτύσσει νέα γενιά AI μοντέλων που ανταγωνίζονται OpenAI και Anthropic

OpenAI: Έρχεται το GPT-4.5 και το GPT-5 με Ενοποιημένη Νοημοσύνη

Η OpenAI Σχεδιάζει τα Δικά της Τσιπ Τεχνητής Νοημοσύνης για να Μειώσει την Εξάρτηση από την Nvidia

Το Χάρβαρντ διαθέτει ανοιχτό dataset 1 εκατομμυρίου βιβλίων για εκπαίδευση Τεχνητής Νοημοσύνης

Αρχική

Blogs

Νέο Περιεχόμενο

Important Information