Jump to content



  • astrolabos
    astrolabos

    Ανάλυση του Ray Tracing στις Intel Battlemage GPUs από το Chips and Cheese

    Στο πρόσφατο άρθρο του Chips and Cheese, ο Chester Lam εξετάζει σε βάθος την απόδοση του ray tracing στην αρχιτεκτονική Intel Battlemage, χρησιμοποιώντας ως παράδειγμα το Cyberpunk 2077 με path tracing ενεργοποιημένο. Ο συντάκτης επικεντρώνεται στο πώς η GPU Arc B580 χειρίζεται τον φόρτο εργασίας του ray tracing, αντί να εστιάζει στην απόλυτη απόδοση, που είναι ήδη αντικείμενο ανάλυσης από μεγαλύτερα τεχνολογικά μέσα.

    Η Στρατηγική της Intel στο Ray Tracing

    Η Intel έχει δώσει έμφαση στα πρόσθετα χαρακτηριστικά των GPUs της από την εποχή του Alchemist, επενδύοντας σε ray tracing accelerators, μονάδες πολλαπλασιασμού μητρών (matrix multiplication units) και hardware video codecs. Με την Battlemage, αυτή η στρατηγική συνεχίζεται, με ιδιαίτερη προσοχή στο ray tracing, καθώς όλο και περισσότερα παιχνίδια ενσωματώνουν σχετικές τεχνικές φωτισμού.

    Η Arc B580 δοκιμάστηκε σε Cyberpunk 2077 σε ανάλυση 1080p χωρίς upscaling, όπου απέδωσε 12 FPS. Ανάλυση μέσω του Intel Graphics Performance Analyzer (GPA) έδειξε ότι οι ray tracing κλήσεις καταναλώνουν το μεγαλύτερο μέρος του frame time, αν και το παιχνίδι εξακολουθεί να εκτελεί ορισμένες μικρές rasterization κλήσεις.

    Ray Tracing Hardware: Τι αλλάζει με την Battlemage;

    Το Ray Tracing Accelerator (RTA) της Battlemage είναι ζωτικής σημασίας για τη βελτίωση της απόδοσης BVH traversal (Bounding Volume Hierarchy). Σε σχέση με τις Alchemist και Meteor Lake, η Battlemage αυξάνει τον αριθμό των traversal pipelines από 2 σε 3, βελτιώνοντας τον ρυθμό box tests στα 18 ανά κύκλο και διπλασιάζοντας τον ρυθμό των triangle intersection tests.

    Για την αποφυγή συμφόρησης στη μνήμη, η BVH cache διπλασιάστηκε από 8 KB σε 16 KB, επιτρέποντας στη GPU να διαχειρίζεται 16 δισεκατομμύρια BVH nodes ανά δευτερόλεπτο. Ο αλγόριθμος traversal της Intel βασίζεται σε short stack traversal με restart trail, που μειώνει την ανάγκη για μεγάλο stack, αλλά αυξάνει την ανάγκη για pointer chasing.

    Τι έδειξαν οι μετρήσεις

    Η Arc B580 επεξεργάστηκε 467,9 εκατομμύρια ακτίνες ανά δευτερόλεπτο, με μέσο όρο 39,5 traversal steps ανά ακτίνα. Ωστόσο, η αξιοποίηση των μονάδων ray-box και ray-triangle ήταν χαμηλή (1.55% και 1.04% αντίστοιχα), υποδεικνύοντας ότι ο περιοριστικός παράγοντας δεν είναι η ίδια η RTA, αλλά η γενικότερη αρχιτεκτονική της GPU.

    Αντίθετα, τα δεδομένα από το GPA έδειξαν ότι το Ray Tracing Frontend αντιμετωπίζει bottlenecks λόγω traversal stalls, κάτι που μπορεί να εξηγεί την προσθήκη ενός τρίτου traversal pipeline.

    Caching και Memory Latency

    Η απόδοση του BVH caching βελτιώθηκε, καθώς η 16 KB cache μείωσε την πίεση στη L1 cache. Το παιχνίδι χρησιμοποιούσε 1.03 TB/s bandwidth για BVH traversal, το οποίο η L1 cache μπορούσε να διαχειριστεί χωρίς προβλήματα. Ωστόσο, η hit rate της L1 cache ήταν κάτω από 60%, ενώ η texture cache hit rate μόλις 30%, δείχνοντας αδυναμία συγκράτησης δεδομένων.

    Το L2 cache (18 MB) αποδείχθηκε επαρκές για το workload, διαχειριζόμενο πάνω από 1 TB/s traffic, ενώ το GDDR6 setup (192-bit, 456 GB/s) χρησιμοποίησε 334.27 GB/s από το διαθέσιμο bandwidth, χωρίς σημάδια συμφόρησης.

    Path Tracing στο Cyberpunk 2077 vs Port Royal

    Το Cyberpunk 2077 path tracing mode είναι ιδιαίτερα απαιτητικό και φαίνεται ότι η Battlemage δυσκολεύεται να διαχειριστεί τον φόρτο εργασίας, κυρίως λόγω της μεγάλης ποσότητας hit/miss shaders που εκτελούνται στο shader array. Αντίθετα, στο 3DMark Port Royal, που χρησιμοποιεί raytraced reflections και shadows, η GPU απέδωσε καλύτερα, αφού:

    • Η BVH cache είχε υψηλότερο hit rate, βελτιώνοντας την ταχύτητα traversal.
    • Ο φόρτος εργασίας στα shader units ήταν χαμηλότερος, με μικρότερη επιβάρυνση στα Xe Cores.

    Αυτό δείχνει ότι η Intel πιθανότατα σχεδίασε τη Battlemage με πιο παραδοσιακά raytracing workloads στο μυαλό της, παρά για πλήρες path tracing, το οποίο παραμένει πολύ απαιτητικό για mid-range GPUs.

    Συμπεράσματα

    Η Intel Battlemage παρουσιάζει σημαντικές βελτιώσεις στο ray tracing, ειδικά με την αύξηση των traversal pipelines και BVH cache. Ωστόσο, τα υψηλά latencies και το χαμηλό ALU utilization δείχνουν ότι εξακολουθούν να υπάρχουν περιορισμοί, ιδιαίτερα σε απαιτητικά path tracing workloads.

    Το Cyberpunk 2077 με path tracing αναδεικνύει τις αδυναμίες της Arc B580, αλλά το Port Royal δείχνει ότι η GPU είναι πιο αποδοτική σε πιο "παραδοσιακά" ray tracing σενάρια.

    Μελλοντικά, η Intel σχεδιάζει περαιτέρω βελτιώσεις στο ray tracing με την αρχιτεκτονική Xe3, που θα περιλαμβάνει sub-triangle opacity culling και νέες δομές δεδομένων. Προς το παρόν, η Battlemage φαίνεται να έχει σχεδιαστεί για ρεαλιστικά raytracing workloads σε mainstream GPUs, παρά για απαιτητικές τεχνικές όπως το πλήρες path tracing.


    Πηγή
    Φωτογραφία: PC Gamer
×
×
  • Δημιουργία...

Important Information

Ο ιστότοπος theLab.gr χρησιμοποιεί cookies για να διασφαλίσει την καλύτερη εμπειρία σας κατά την περιήγηση. Μπορείτε να προσαρμόσετε τις ρυθμίσεις των cookies σας , διαφορετικά θα υποθέσουμε ότι είστε εντάξει για να συνεχίσετε.