Η OpenAI ανακοίνωσε ότι η δυνατότητα δημιουργίας εικόνων είναι πλέον εγγενής στο GPT‑4o, καθιστώντας το μοντέλο ικανό να κατανοεί και να παράγει εικόνες με ακρίβεια, γνώση συμφραζομένων και φωτορεαλιστικό ύφος. Η λειτουργία αυτή βασίζεται σε ενοποιημένη εκπαίδευση εικόνας και κειμένου, δίνοντας έμφαση όχι μόνο στην αισθητική, αλλά και στη χρηστικότητα—όπως διαγράμματα, λογότυπα, και οπτικά βοηθήματα επικοινωνίας.
Μια από τις βασικές καινοτομίες είναι η επαναληπτική δημιουργία μέσω διαλόγου, όπου ο χρήστης μπορεί να βελτιώνει την εικόνα με φυσικό τρόπο μέσα από συνομιλία, κρατώντας σταθερά χαρακτηριστικά μεταξύ διαφορετικών εκδοχών. Το GPT‑4o επίσης ξεχωρίζει στην απόδοση κειμένου μέσα στην εικόνα και στον χειρισμό πολλαπλών αντικειμένων με σαφείς ιδιότητες—ξεπερνώντας τους περιορισμούς προηγούμενων μοντέλων που τα έβρισκαν δύσκολα με περισσότερα από 5–8 στοιχεία.
Ωστόσο, η OpenAI αναγνωρίζει πολλαπλούς περιορισμούς στο σύστημα. Αυτοί περιλαμβάνουν προβλήματα περικοπής (cropping), λανθασμένες αποδόσεις (hallucinations), δυσκολία στην απόδοση μικρού και πυκνού κειμένου, περιορισμένη ακρίβεια σε γραφήματα, και προκλήσεις στην επεξεργασία πολύγλωσσου κειμένου. Η λεπτομερής επεξεργασία και οι συνθέσεις με πολλές πληροφορίες παραμένουν τεχνικά δύσκολες.
Η OpenAI υποστηρίζει ότι όλα τα παραγόμενα γραφικά φέρουν μεταδεδομένα C2PA για σκοπούς ιχνηλασιμότητας, ενώ εφαρμόζει αυστηρές πολιτικές ασφάλειας: μπλοκάρονται αιτήματα που σχετίζονται με παιδική κακοποίηση, deepfakes ή περιεχόμενο με πραγματικά πρόσωπα σε μη αποδεκτά πλαίσια. Η ασφάλεια ελέγχεται με τη βοήθεια ενός δεύτερου LLM που έχει εκπαιδευτεί για την κατανόηση πολιτικών και πιθανών ασαφειών.
Η λειτουργία είναι ήδη διαθέσιμη στους χρήστες των εκδόσεων Free, Plus, Pro και Team, ενώ θα ακολουθήσει υποστήριξη για Enterprise και Edu, καθώς και μέσω API για developers. Η OpenAI επισημαίνει ότι η δημιουργία εικόνας απαιτεί περισσότερο χρόνο επεξεργασίας – περίπου ένα λεπτό ανά εικόνα – λόγω της αυξημένης λεπτομέρειας.
Η ενσωμάτωση αυτής της λειτουργίας μετατρέπει τη δημιουργία εικόνας από αισθητικό εντυπωσιασμό σε ένα εργαλείο υψηλής χρησιμότητας, χωρίς όμως να κρύβει τις τεχνολογικές και δεοντολογικές προκλήσεις που τη συνοδεύουν.
Recommended Comments
Create an account or sign in to comment
You need to be a member in order to leave a comment
Create an account
Sign up for a new account in our community. It's easy!
Register a new accountSign in
Already have an account? Sign in here.
Sign In Now