Jump to content



AMD Bulldozer Benchmarks Leaked


nikpoth

Recommended Posts

  • Replies 2,5k
  • Created
  • Last Reply
Ετσι θα εκπληρουν τα στανταρ της ΑΜD; πχ διαχειριση ενεργειας..

H ΑΜD δεν αναγνωρίζει καμιά συμβατότητα μεταξύ BULLDOZER και μητρικών σε απλό AM3 socket.

Από μόνοι τους οι κατασκευαστές θα δώσουν την συμβατότητα με νέα bios στις μητρικές που κατά τις δοκιμές αποδείχτηκε πως μπορούν να δουλέψουν τους Bd χωρίς πρόβλημα ...

Link to comment
Share on other sites

Για αυτό να μην πάρετε μητρικές ακόμα... Περιμένετε να βγούν και μετά από 1 μήνα αφού βγουν και τα revision από τις μητρικές τότε αγοράστε...

Όποιος βιάζεται σκοντάφτει.......

Θυμάστε το σκηνικό με τους Intel, για το πρόβλημα που είχε ακουστεί με τους Sandybridge... ;)

Link to comment
Share on other sites

Για αυτό να μην πάρετε μητρικές ακόμα... Περιμένετε να βγούν και μετά από 1 μήνα αφού βγουν και τα revision από τις μητρικές τότε αγοράστε...

Όποιος βιάζεται σκοντάφτει.......

Θυμάστε το σκηνικό με τους Intel, για το πρόβλημα που είχε ακουστεί με τους Sandybridge... ;)

Ξέρεις πως μπορούμε να μάθουμε τι αλλαγές έχουν γίνει από rev σε rev για κάποιο μοντέλο μητρικής που κυκλοφορεί?

Link to comment
Share on other sites

Πραγματικά προσπαθώ να καταλάβω τί παίζει..Στο XS ο chew είπε το εξής:

Δηλαδή είναι τετραπύρηνος με κάτι σαν ΗΤ ή physical 8core? :slap:

Σύμφωνα με τα διαγράμματα της AMD, ουσιαστικά πρόκειται για «υβριδικό» 8πύρηνο (αν μπορεί να μου επιτραπεί η λέξη υβριδικός), δηλαδή:

• Για πράξεις ακεραίων (Integer) είναι the real thing 8πύρηνος, αφού διαθέτει 8 αυτόνομες μονάδες επεξεργασίας integer εντολών (ξεχωριστή L1 cache), οργανωμένες ανά δύο σε έναν Bulldozer core.

• Για πράξεις κινητής υποδιαστολής θεωρείται 4πύρηνος με SMT (σχεδόν ίδιο με αυτό που ονομάζει η Intel HyperThreading).

Στις παρακάτω εικόνες φαίνεται πιο καθαρά όλο το παραπάνω:

eightcore.jpg

bulldozerhaber4_dh_fx57.jpg

Link to comment
Share on other sites

Νομίζω πως δεν έχει καμία σχέση με το Hyperthreading της Intel. Η Intel,για να δουλέψει το hyperthreading, εκμεταλλεύεται κενούς κύκλους ενός πυρήνα και όχι 2 πυρήνες όπως κάνει η AMD .

Link to comment
Share on other sites

Για integer πράξεις έχεις δίκιο, δεν χρησιμοποιείται HyperThreading. Εκεί που χρησιμοποιείται είναι στις Floating Point μονάδες επεξεργασίας (4 στο σύνολο). Απλά έχει κάποιες διαφοροποιήσεις η υλοποίηση του SMT από την AMD σε σχέση με αυτό που η Intel έχει ονομάσει HTΤ.

wiki: SMT (Simultaneous_multithreading)

Link to comment
Share on other sites

Πραγματικά προσπαθώ να καταλάβω τί παίζει..Στο XS ο chew είπε το εξής:

Δηλαδή είναι τετραπύρηνος με κάτι σαν ΗΤ ή physical 8core? :slap:

Όπως το καταλαβαίνω εγώ, η αρχιτεκτονική του Bulldozer είναι μια πιο Hardware εκδοχή του HT της Intel και το οποίο είναι πολύ πιο flexible. 4Core modules, 8 computational units

Link to comment
Share on other sites

Στην περίπτωση της Intel η μόνη αλλαγή που έχει γίνει ώστε να δουλέψει το HT είναι να διπλασιαστεί ο αριθμός των περισσότερων registers και του instruction pointer ενώ ο αριθμός των πυρήνων και της L1&L2 cache παραμένει ο ίδιος. Αντίθετα η AMD διπλασιάζει τους πυρήνες καθώς και την L1. Γι' αυτό είπα ότι είναι μια σχεδόν εντελώς διαφορετική SMT υλοποίηση από το HT και σαφώς δεν είναι σχεδόν το ίδιο με το HT. Αν μάλιστα πετύχει στον πειραματισμό της θα μιλάμε για θεωρητική αύξηση της απόδοσης κατά 80% έναντι του 30% που προσφέρει το HT.

Link to comment
Share on other sites

Αν μάλιστα πετύχει στον πειραματισμό της θα μιλάμε για θεωρητική αύξηση της απόδοσης κατά 80% έναντι του 30% που προσφέρει το HT.

Η απόδοση στην περίπτωση του HT,είμαι μεταξύ 15-30% άρα είναι σχεδόν σίγουρο ότι η υλοποίηση του SMT κατα τα λεγόμενα της AMD θα είναι καλύτερη.Αυτό δίνει σίγουρα ένα πλεονέκτημα όσον αφορά την μείωση της διαφοράς ανάμεσα σε clock2clock καταστάσεις και τον ίδιο αριθμό απαιτούμενων πυρήνων.

Προσωπικά δεν θεωρώ "πυρήνες" αυτή την μίξη που κάνουν(γιαυτό και ονομάστηκε module).Αυτό λέει και ο chew.

Link to comment
Share on other sites

απ'οτι εχω καταλαβει, απο αυτα που λενε, ο καθε μεσα σε 1 module, ο καθε πυρηνας ειναι 80% αυτονομος (σε συγκριση με παλιοτερη αρχιτεκτονικη) και 20% μοιραζεται καποιο τμημα με τον αλλο πυρηνα του module.

Συνεπως δε μιλαμε μεν για καθαρο 8πυρηνο, αλλα σε καμια περιπτωση για 4πυρηνο+HT. Αν χρησιμοποιησουμε αυτα (τα δικα τους) νουμερα, θα μπορουσαμε ισως να τον πουμε 8x0.8= 6.4απυρηνο χαχ. Βεβαια και αυτο μαλλον δεν ειναι σωστο, σημασια εχει οταν τρεχεις κατι που χρησιμοποιει ολους τους πυρηνες ποση ειναι η αποδοση του καθενος.

Αν πχ ειχαμε 1 module με 2 πυρηνες, τοτε αν ο καθενας ειναι 80% αυτονομος, μπακαλιστικα αν χρησιμοποιουνται και οι 2 ταυτοχρονα ισως το αποτελεσμα ειναι το εναπομεινον 20% να δουλευει μια για τον ενα μια για τον αλλον και να καταληγουμε σε 2 πυρηνες αποδοσης 90%. Αρα πολλαπλασιαζοντας αυτο επι 4 modules να εχουμε τελικα εναν 7.2απυρηνο.

Για αστεια τα λεω τα παραπανω ετσι? Μη τα παρει κανεις τοις μετρητοις....απλα σιγουρα δεν ειναι 8πυρηνος, αλλα σε καμια περιπτωση δεν ειναι 4πυρηνος+HT

Αυτο που εχει για μενα ενδιαφερον ειναι σε single thread εφαρμογες πως θα δουλεψει το συστημα. Γιατι τοτε, αν σε ενα Module δουλευει μονο ο ενας πυρηνας τα πραγματα ειναι οπως λενε και αντι για 80% εχεις 100% αποδοση ενος πυρηνα (επειδη δεν εχει να μοιραστει κατι με τον δευτερο πυρηνα του Module) τα πραγματα ειναι μια χαρα, γιατι σημαινει οτι μεχρι 4 πυρηνες, εχεις πληρη αποδοση, και απο 5 και πανω χανεις λιγο αλλα δε σε νοιαζει γιατι ειναι πολυ καλυτερα απο HT anyway.

Αλλα αν τυχον το shared κομματι του Module δε χρησιμοποιειται ετσι και δεν εχεις τη μεγιστη αποδοση ενος πυρηνα οπως με παλιοτερες αρχιτεκτονικες, εχεις θεμα, γιατι στα benchmarks Καλα θα τα παει, αλλα στην πραξη, ποσες εφαρμογες ειναι πανω απο 4πυρηνες εκει εξω? Θα θυσιαζεις αποδοση καθημερινα χωρις λογο με τον ολοκαινουριο σου επεξεργαστη...και ηταν ηδη πισω σε single core performance η AMD, αμα γινει ετσι ουτε λογος για να φτασει/ξεπερασει sandy...

Link to comment
Share on other sites

απ'οτι εχω καταλαβει, απο αυτα που λενε, ο καθε μεσα σε 1 module, ο καθε πυρηνας ειναι 80% αυτονομος (σε συγκριση με παλιοτερη αρχιτεκτονικη) και 20% μοιραζεται καποιο τμημα με τον αλλο πυρηνα του module.

Συνεπως δε μιλαμε μεν για καθαρο 8πυρηνο, αλλα σε καμια περιπτωση για 4πυρηνο+HT. Αν χρησιμοποιησουμε αυτα (τα δικα τους) νουμερα, θα μπορουσαμε ισως να τον πουμε 8x0.8= 6.4απυρηνο χαχ. Βεβαια και αυτο μαλλον δεν ειναι σωστο, σημασια εχει οταν τρεχεις κατι που χρησιμοποιει ολους τους πυρηνες ποση ειναι η αποδοση του καθενος.

Αν πχ ειχαμε 1 module με 2 πυρηνες, τοτε αν ο καθενας ειναι 80% αυτονομος, μπακαλιστικα αν χρησιμοποιουνται και οι 2 ταυτοχρονα ισως το αποτελεσμα ειναι το εναπομεινον 20% να δουλευει μια για τον ενα μια για τον αλλον και να καταληγουμε σε 2 πυρηνες αποδοσης 90%. Αρα πολλαπλασιαζοντας αυτο επι 4 modules να εχουμε τελικα εναν 7.2απυρηνο.

Για αστεια τα λεω τα παραπανω ετσι? Μη τα παρει κανεις τοις μετρητοις....απλα σιγουρα δεν ειναι 8πυρηνος, αλλα σε καμια περιπτωση δεν ειναι 4πυρηνος+HT

Ελα, παλιωσε αυτο το αστειο! http://www.thelab.gr/amd-epeksergastes/amd-bulldozer-benchmarks-leaked-91130-53.html#post1063082988

:p:P:P

Link to comment
Share on other sites

Βασικα διπλα στην οκταβιτ γινεται μια προσπαθεια να καταλαβει κανεις πως δουλευει ο BULDOZER..

Αρχικα αυτο το βιντεο κατι λεει.. ΑΛΛΑ για να ΔΟΥΛΕΥΕΙ ΣΤΟ 100% το CPU θα πρεπει το προγραμμα να ποστηριζει AVX και ΧΟΡ αλλιως στο FPU ειναι 128 και 128..

[ame=http://www.youtube.com/watch?v=VIs1CxuUrpc&feature=player_embedded]AMD Cores: "Bulldozer" and "Bobcat" - YouTube[/ame]

Link to comment
Share on other sites

Βασικα διπλα στην οκταβιτ γινεται μια προσπαθεια να καταλαβει κανεις πως δουλευει ο BULDOZER..

Αρχικα αυτο το βιντεο κατι λεει.. ΑΛΛΑ για να ΔΟΥΛΕΥΕΙ ΣΤΟ 100% το CPU θα πρεπει το προγραμμα να ποστηριζει AVX και ΧΟΡ αλλιως στο FPU ειναι 128 και 128..

Οχι δεν είναι έτσι αλλά το ΑΝΑΠΟΔΟ !!! !!!! Ο Bulldozer μπορεί να δουλέψει στο 100% ακόμα και σε ΜΗ ΑVΧ 256ΒΙΤ ενώ ο SANDYBRIDGE ΟΧΙ !!!!!

Απλά να έχετε σαν σημείο αναφοράς της σκέψης σας πως η AMD στο BULLDOZER εννοποίησε 2 πυρήνες οι οποίοι είχαν 128bit FPU ο κάθε ένας και όχι 2 πυρήνες που είχαν 256bit fpu ώστε να πει κανείς πως αφαιρέθηκε ποσότητα της fpu από τους 2 .....

Floating Point Unit

Και εδώ το Floating Point Unit αποτελείτε από το FP Scheduler και το FP Execution Unit. Ο Scheduler μετασχηματίζει τι μικροεντολές MacroOPs σε τέσσερις(4) MicroOPs και τις στέλνει στο FP Execution Unit το οποίο έχει και αυτό τέσσερις πόρτες επεξεργασίας (PipeLines).

Όπως είπαμε παραπάνω το FP Unit είναι κοινό ανά δυο Threads και έτσι οι τέσσερις μικροεντολές MicroOPs μπορεί όλες να είναι από το ίδιο Thread η από δυο διαφορετικά. Δηλαδή ένα Thread μπορεί να χρησιμοποιήσει όλο το FP Unit (άσχετα αν είναι AVX η όχι).

Το FP unit έχει δυο 128-bit FMACs , κάθε FMAC μπορεί να κάνει ADD και MUL ταυτόχρονα. Ένα Thread μπορεί να χρησιμοποιήσει και τα δυο FMACs η δυο Threads μπορούν να χρησιμοποιήσουν από ένα FMAC.

Όταν έχουμε AVX (256-bit) τότε μόνο ένα Thread μπορεί να γίνει Execute.

Δηλαδή σε όλες τις περιπτώσεις μπορεί να κάνει την FPU είτε ενοιαία είτε κομμένη ανά 128bit (ανάλογα τη ζητείται για επεξεργασία) και ο μόνος περιορισμός είναι πως στις 256ΒΙΤ ΑVX εντολές την χρησιμοποιεί μόνο το ένα thread ανά module άρα σε αυτή την περίπτωση θα συμπεριφερθεί σαν 4-πύρηνος !!!!

Συμπερασματικά η κοινή FPU είναι πλεονέκτημα και όχι μειονέκτημα, αφού σε περιπτώσεις που τρέχουμε μια εφαρμογή που τρέχει σε λιγότερο ή έως 4-πυρήνες (Πχ. στους πυρήνες (0,1)-(2,3)-(4,5)-(6,7) θα έχει ο κάθε πυρήνας διαθέσιμα +128bit FPU από τον δεύτερο πυρήνα του module που μένει ανενεργός που στην περίπτωση πχ. του THUBAN απλά καθόταν και δεν αξιοπιούταν..... !

Αλλο πλεονέκτημα αυτής της αρχιτεκτονικής είναι πως μπορεί να ΑΠΕΝΕΡΓΟΠΟΙΕΊΤΑΙ ένα ΟΛΟΚΛΗΡΟ MODULE αν ΔΕΝ χρειάζεται οπότε σε idle η μερικού load καταστάσεις ο επεξεργαστής θα είναι πολύ πιο efficient σε σχέση με τον THUBAN, K10, K10,5 κ.λ.π. άσχετα αν σε πλήρη φορτίο το θερμικό αποβαλόμενο ποσό ενέργειας TDP θα είναι το ίδιο με τον thuban !

Αλλο θετικό στο κομμάτι "κατανάλωση ενέργειας & πλάνο ενεργειας" είναι πως μπορούμε διαλέγοντας πλανο ενέργειας ανάμεσα σε ταχύτητα και σε κατανάλωση, να τρέξουμε τον επεξεργαστή με τρόπους που μέχρι τώρα δεν μπορούσαμε ελέγχοντας το μέγεθος της ενεργής CACHE και της ενεργής FPU πέρα από την συχνότητα και τους πυρήνες ..... !!!

Πχ. Αν έχουμε ένα πρόγραμμα που τρέχει σε 2 πυρήνες τότε αν θέλουμε μεγάλη εξοικονόμηση ενέργεια θα το τρέξουμε επάνω σους πυρήνες (0-1),(2-3),(4-5),(6-7) με συναλική χρησιμοποιούμενη L2 CACHE 2MB και ενεργή την fpu (256bit) του πρώτου module, ενώ αν θέλουμε να το τρέξουμε όσο το δυνατόν ταχύτερα θα χρησιμοποιοήσουμε τους πυρήνες πχ.: (0-1),(2-3),(4-5),(6-7) όπου η συνολική χρησιμοποιούμενη L2 CACHE θα είναι 4MB (2MB για κάθε core) και τρέχουμε με όλη την FPU και των 2 modules (2x 256 = μιλώντας για μέγεθος)...

Για να γίνουν όλα τα παραπάνω μάλλον θα χρειαστεί κάποιος driver από την AMD όπως πχ του COOL n QUIET που υπήρχε στα XP !!! αλλιως από μόνα τους τα Win δεν νομίζω να μπορούν να καταλάβουν την διαφορά ανά core/module κ.λ.π.......:hmm::hmm::hmm:

Link to comment
Share on other sites

Archived

This topic is now archived and is closed to further replies.

×
×
  • Δημιουργία...

Important Information

Ο ιστότοπος theLab.gr χρησιμοποιεί cookies για να διασφαλίσει την καλύτερη εμπειρία σας κατά την περιήγηση. Μπορείτε να προσαρμόσετε τις ρυθμίσεις των cookies σας , διαφορετικά θα υποθέσουμε ότι είστε εντάξει για να συνεχίσετε.