astrovasilis Σεπτέμβριος 14, 2011 #1201 Κοινοποίηση Σεπτέμβριος 14, 2011 Ετσι θα εκπληρουν τα στανταρ της ΑΜD; πχ διαχειριση ενεργειας.. Link to comment Share on other sites More sharing options...
adpanos Σεπτέμβριος 15, 2011 #1202 Κοινοποίηση Σεπτέμβριος 15, 2011 Ετσι θα εκπληρουν τα στανταρ της ΑΜD; πχ διαχειριση ενεργειας..H ΑΜD δεν αναγνωρίζει καμιά συμβατότητα μεταξύ BULLDOZER και μητρικών σε απλό AM3 socket. Από μόνοι τους οι κατασκευαστές θα δώσουν την συμβατότητα με νέα bios στις μητρικές που κατά τις δοκιμές αποδείχτηκε πως μπορούν να δουλέψουν τους Bd χωρίς πρόβλημα ... Link to comment Share on other sites More sharing options...
aris20 Σεπτέμβριος 15, 2011 #1203 Κοινοποίηση Σεπτέμβριος 15, 2011 Για αυτό να μην πάρετε μητρικές ακόμα... Περιμένετε να βγούν και μετά από 1 μήνα αφού βγουν και τα revision από τις μητρικές τότε αγοράστε... Όποιος βιάζεται σκοντάφτει....... Θυμάστε το σκηνικό με τους Intel, για το πρόβλημα που είχε ακουστεί με τους Sandybridge... Link to comment Share on other sites More sharing options...
adpanos Σεπτέμβριος 15, 2011 #1204 Κοινοποίηση Σεπτέμβριος 15, 2011 Για αυτό να μην πάρετε μητρικές ακόμα... Περιμένετε να βγούν και μετά από 1 μήνα αφού βγουν και τα revision από τις μητρικές τότε αγοράστε...Όποιος βιάζεται σκοντάφτει....... Θυμάστε το σκηνικό με τους Intel, για το πρόβλημα που είχε ακουστεί με τους Sandybridge... Ξέρεις πως μπορούμε να μάθουμε τι αλλαγές έχουν γίνει από rev σε rev για κάποιο μοντέλο μητρικής που κυκλοφορεί? Link to comment Share on other sites More sharing options...
gregorisvas Σεπτέμβριος 16, 2011 #1205 Κοινοποίηση Σεπτέμβριος 16, 2011 Πραγματικά προσπαθώ να καταλάβω τί παίζει..Στο XS ο chew είπε το εξής: BD is physically a 4 core 8 thread part. Δηλαδή είναι τετραπύρηνος με κάτι σαν ΗΤ ή physical 8core? Link to comment Share on other sites More sharing options...
billpeppas Σεπτέμβριος 16, 2011 #1206 Κοινοποίηση Σεπτέμβριος 16, 2011 8πύρηνος είναι τυπικοθεωρητικά, απλά κάθε 2 πυρήνες μοιράζονται μερικούς "πόρους". Link to comment Share on other sites More sharing options...
zaxos Σεπτέμβριος 16, 2011 #1207 Κοινοποίηση Σεπτέμβριος 16, 2011 Πραγματικά προσπαθώ να καταλάβω τί παίζει..Στο XS ο chew είπε το εξής:Δηλαδή είναι τετραπύρηνος με κάτι σαν ΗΤ ή physical 8core? Σύμφωνα με τα διαγράμματα της AMD, ουσιαστικά πρόκειται για «υβριδικό» 8πύρηνο (αν μπορεί να μου επιτραπεί η λέξη υβριδικός), δηλαδή: • Για πράξεις ακεραίων (Integer) είναι the real thing 8πύρηνος, αφού διαθέτει 8 αυτόνομες μονάδες επεξεργασίας integer εντολών (ξεχωριστή L1 cache), οργανωμένες ανά δύο σε έναν Bulldozer core. • Για πράξεις κινητής υποδιαστολής θεωρείται 4πύρηνος με SMT (σχεδόν ίδιο με αυτό που ονομάζει η Intel HyperThreading). Στις παρακάτω εικόνες φαίνεται πιο καθαρά όλο το παραπάνω: Link to comment Share on other sites More sharing options...
cna Σεπτέμβριος 16, 2011 #1208 Κοινοποίηση Σεπτέμβριος 16, 2011 Νομίζω πως δεν έχει καμία σχέση με το Hyperthreading της Intel. Η Intel,για να δουλέψει το hyperthreading, εκμεταλλεύεται κενούς κύκλους ενός πυρήνα και όχι 2 πυρήνες όπως κάνει η AMD . Link to comment Share on other sites More sharing options...
zaxos Σεπτέμβριος 16, 2011 #1209 Κοινοποίηση Σεπτέμβριος 16, 2011 Για integer πράξεις έχεις δίκιο, δεν χρησιμοποιείται HyperThreading. Εκεί που χρησιμοποιείται είναι στις Floating Point μονάδες επεξεργασίας (4 στο σύνολο). Απλά έχει κάποιες διαφοροποιήσεις η υλοποίηση του SMT από την AMD σε σχέση με αυτό που η Intel έχει ονομάσει HTΤ.wiki: SMT (Simultaneous_multithreading) Link to comment Share on other sites More sharing options...
NoDsl Σεπτέμβριος 16, 2011 #1210 Κοινοποίηση Σεπτέμβριος 16, 2011 Πραγματικά προσπαθώ να καταλάβω τί παίζει..Στο XS ο chew είπε το εξής:Δηλαδή είναι τετραπύρηνος με κάτι σαν ΗΤ ή physical 8core? Όπως το καταλαβαίνω εγώ, η αρχιτεκτονική του Bulldozer είναι μια πιο Hardware εκδοχή του HT της Intel και το οποίο είναι πολύ πιο flexible. 4Core modules, 8 computational units Link to comment Share on other sites More sharing options...
cna Σεπτέμβριος 16, 2011 #1211 Κοινοποίηση Σεπτέμβριος 16, 2011 Στην περίπτωση της Intel η μόνη αλλαγή που έχει γίνει ώστε να δουλέψει το HT είναι να διπλασιαστεί ο αριθμός των περισσότερων registers και του instruction pointer ενώ ο αριθμός των πυρήνων και της L1&L2 cache παραμένει ο ίδιος. Αντίθετα η AMD διπλασιάζει τους πυρήνες καθώς και την L1. Γι' αυτό είπα ότι είναι μια σχεδόν εντελώς διαφορετική SMT υλοποίηση από το HT και σαφώς δεν είναι σχεδόν το ίδιο με το HT. Αν μάλιστα πετύχει στον πειραματισμό της θα μιλάμε για θεωρητική αύξηση της απόδοσης κατά 80% έναντι του 30% που προσφέρει το HT. Link to comment Share on other sites More sharing options...
ganastasiou Σεπτέμβριος 17, 2011 #1212 Κοινοποίηση Σεπτέμβριος 17, 2011 Αν μάλιστα πετύχει στον πειραματισμό της θα μιλάμε για θεωρητική αύξηση της απόδοσης κατά 80% έναντι του 30% που προσφέρει το HT.Η απόδοση στην περίπτωση του HT,είμαι μεταξύ 15-30% άρα είναι σχεδόν σίγουρο ότι η υλοποίηση του SMT κατα τα λεγόμενα της AMD θα είναι καλύτερη.Αυτό δίνει σίγουρα ένα πλεονέκτημα όσον αφορά την μείωση της διαφοράς ανάμεσα σε clock2clock καταστάσεις και τον ίδιο αριθμό απαιτούμενων πυρήνων.Προσωπικά δεν θεωρώ "πυρήνες" αυτή την μίξη που κάνουν(γιαυτό και ονομάστηκε module).Αυτό λέει και ο chew. Link to comment Share on other sites More sharing options...
Blinky Σεπτέμβριος 17, 2011 #1213 Κοινοποίηση Σεπτέμβριος 17, 2011 απ'οτι εχω καταλαβει, απο αυτα που λενε, ο καθε μεσα σε 1 module, ο καθε πυρηνας ειναι 80% αυτονομος (σε συγκριση με παλιοτερη αρχιτεκτονικη) και 20% μοιραζεται καποιο τμημα με τον αλλο πυρηνα του module.Συνεπως δε μιλαμε μεν για καθαρο 8πυρηνο, αλλα σε καμια περιπτωση για 4πυρηνο+HT. Αν χρησιμοποιησουμε αυτα (τα δικα τους) νουμερα, θα μπορουσαμε ισως να τον πουμε 8x0.8= 6.4απυρηνο χαχ. Βεβαια και αυτο μαλλον δεν ειναι σωστο, σημασια εχει οταν τρεχεις κατι που χρησιμοποιει ολους τους πυρηνες ποση ειναι η αποδοση του καθενος.Αν πχ ειχαμε 1 module με 2 πυρηνες, τοτε αν ο καθενας ειναι 80% αυτονομος, μπακαλιστικα αν χρησιμοποιουνται και οι 2 ταυτοχρονα ισως το αποτελεσμα ειναι το εναπομεινον 20% να δουλευει μια για τον ενα μια για τον αλλον και να καταληγουμε σε 2 πυρηνες αποδοσης 90%. Αρα πολλαπλασιαζοντας αυτο επι 4 modules να εχουμε τελικα εναν 7.2απυρηνο.Για αστεια τα λεω τα παραπανω ετσι? Μη τα παρει κανεις τοις μετρητοις....απλα σιγουρα δεν ειναι 8πυρηνος, αλλα σε καμια περιπτωση δεν ειναι 4πυρηνος+HTΑυτο που εχει για μενα ενδιαφερον ειναι σε single thread εφαρμογες πως θα δουλεψει το συστημα. Γιατι τοτε, αν σε ενα Module δουλευει μονο ο ενας πυρηνας τα πραγματα ειναι οπως λενε και αντι για 80% εχεις 100% αποδοση ενος πυρηνα (επειδη δεν εχει να μοιραστει κατι με τον δευτερο πυρηνα του Module) τα πραγματα ειναι μια χαρα, γιατι σημαινει οτι μεχρι 4 πυρηνες, εχεις πληρη αποδοση, και απο 5 και πανω χανεις λιγο αλλα δε σε νοιαζει γιατι ειναι πολυ καλυτερα απο HT anyway.Αλλα αν τυχον το shared κομματι του Module δε χρησιμοποιειται ετσι και δεν εχεις τη μεγιστη αποδοση ενος πυρηνα οπως με παλιοτερες αρχιτεκτονικες, εχεις θεμα, γιατι στα benchmarks Καλα θα τα παει, αλλα στην πραξη, ποσες εφαρμογες ειναι πανω απο 4πυρηνες εκει εξω? Θα θυσιαζεις αποδοση καθημερινα χωρις λογο με τον ολοκαινουριο σου επεξεργαστη...και ηταν ηδη πισω σε single core performance η AMD, αμα γινει ετσι ουτε λογος για να φτασει/ξεπερασει sandy... Link to comment Share on other sites More sharing options...
gaig Σεπτέμβριος 17, 2011 #1214 Κοινοποίηση Σεπτέμβριος 17, 2011 απ'οτι εχω καταλαβει, απο αυτα που λενε, ο καθε μεσα σε 1 module, ο καθε πυρηνας ειναι 80% αυτονομος (σε συγκριση με παλιοτερη αρχιτεκτονικη) και 20% μοιραζεται καποιο τμημα με τον αλλο πυρηνα του module.Συνεπως δε μιλαμε μεν για καθαρο 8πυρηνο, αλλα σε καμια περιπτωση για 4πυρηνο+HT. Αν χρησιμοποιησουμε αυτα (τα δικα τους) νουμερα, θα μπορουσαμε ισως να τον πουμε 8x0.8= 6.4απυρηνο χαχ. Βεβαια και αυτο μαλλον δεν ειναι σωστο, σημασια εχει οταν τρεχεις κατι που χρησιμοποιει ολους τους πυρηνες ποση ειναι η αποδοση του καθενος. Αν πχ ειχαμε 1 module με 2 πυρηνες, τοτε αν ο καθενας ειναι 80% αυτονομος, μπακαλιστικα αν χρησιμοποιουνται και οι 2 ταυτοχρονα ισως το αποτελεσμα ειναι το εναπομεινον 20% να δουλευει μια για τον ενα μια για τον αλλον και να καταληγουμε σε 2 πυρηνες αποδοσης 90%. Αρα πολλαπλασιαζοντας αυτο επι 4 modules να εχουμε τελικα εναν 7.2απυρηνο. Για αστεια τα λεω τα παραπανω ετσι? Μη τα παρει κανεις τοις μετρητοις....απλα σιγουρα δεν ειναι 8πυρηνος, αλλα σε καμια περιπτωση δεν ειναι 4πυρηνος+HT Ελα, παλιωσε αυτο το αστειο! http://www.thelab.gr/amd-epeksergastes/amd-bulldozer-benchmarks-leaked-91130-53.html#post1063082988 :P:P Link to comment Share on other sites More sharing options...
astrovasilis Σεπτέμβριος 17, 2011 #1215 Κοινοποίηση Σεπτέμβριος 17, 2011 Βασικα διπλα στην οκταβιτ γινεται μια προσπαθεια να καταλαβει κανεις πως δουλευει ο BULDOZER.. Αρχικα αυτο το βιντεο κατι λεει.. ΑΛΛΑ για να ΔΟΥΛΕΥΕΙ ΣΤΟ 100% το CPU θα πρεπει το προγραμμα να ποστηριζει AVX και ΧΟΡ αλλιως στο FPU ειναι 128 και 128..[ame=http://www.youtube.com/watch?v=VIs1CxuUrpc&feature=player_embedded]AMD Cores: "Bulldozer" and "Bobcat" - YouTube[/ame] Link to comment Share on other sites More sharing options...
adpanos Σεπτέμβριος 18, 2011 #1216 Κοινοποίηση Σεπτέμβριος 18, 2011 Βασικα διπλα στην οκταβιτ γινεται μια προσπαθεια να καταλαβει κανεις πως δουλευει ο BULDOZER.. Αρχικα αυτο το βιντεο κατι λεει.. ΑΛΛΑ για να ΔΟΥΛΕΥΕΙ ΣΤΟ 100% το CPU θα πρεπει το προγραμμα να ποστηριζει AVX και ΧΟΡ αλλιως στο FPU ειναι 128 και 128.. Οχι δεν είναι έτσι αλλά το ΑΝΑΠΟΔΟ !!! !!!! Ο Bulldozer μπορεί να δουλέψει στο 100% ακόμα και σε ΜΗ ΑVΧ 256ΒΙΤ ενώ ο SANDYBRIDGE ΟΧΙ !!!!! Απλά να έχετε σαν σημείο αναφοράς της σκέψης σας πως η AMD στο BULLDOZER εννοποίησε 2 πυρήνες οι οποίοι είχαν 128bit FPU ο κάθε ένας και όχι 2 πυρήνες που είχαν 256bit fpu ώστε να πει κανείς πως αφαιρέθηκε ποσότητα της fpu από τους 2 ..... Floating Point UnitΚαι εδώ το Floating Point Unit αποτελείτε από το FP Scheduler και το FP Execution Unit. Ο Scheduler μετασχηματίζει τι μικροεντολές MacroOPs σε τέσσερις(4) MicroOPs και τις στέλνει στο FP Execution Unit το οποίο έχει και αυτό τέσσερις πόρτες επεξεργασίας (PipeLines). Όπως είπαμε παραπάνω το FP Unit είναι κοινό ανά δυο Threads και έτσι οι τέσσερις μικροεντολές MicroOPs μπορεί όλες να είναι από το ίδιο Thread η από δυο διαφορετικά. Δηλαδή ένα Thread μπορεί να χρησιμοποιήσει όλο το FP Unit (άσχετα αν είναι AVX η όχι). Το FP unit έχει δυο 128-bit FMACs , κάθε FMAC μπορεί να κάνει ADD και MUL ταυτόχρονα. Ένα Thread μπορεί να χρησιμοποιήσει και τα δυο FMACs η δυο Threads μπορούν να χρησιμοποιήσουν από ένα FMAC. Όταν έχουμε AVX (256-bit) τότε μόνο ένα Thread μπορεί να γίνει Execute. Δηλαδή σε όλες τις περιπτώσεις μπορεί να κάνει την FPU είτε ενοιαία είτε κομμένη ανά 128bit (ανάλογα τη ζητείται για επεξεργασία) και ο μόνος περιορισμός είναι πως στις 256ΒΙΤ ΑVX εντολές την χρησιμοποιεί μόνο το ένα thread ανά module άρα σε αυτή την περίπτωση θα συμπεριφερθεί σαν 4-πύρηνος !!!! Συμπερασματικά η κοινή FPU είναι πλεονέκτημα και όχι μειονέκτημα, αφού σε περιπτώσεις που τρέχουμε μια εφαρμογή που τρέχει σε λιγότερο ή έως 4-πυρήνες (Πχ. στους πυρήνες (0,1)-(2,3)-(4,5)-(6,7) θα έχει ο κάθε πυρήνας διαθέσιμα +128bit FPU από τον δεύτερο πυρήνα του module που μένει ανενεργός που στην περίπτωση πχ. του THUBAN απλά καθόταν και δεν αξιοπιούταν..... ! Αλλο πλεονέκτημα αυτής της αρχιτεκτονικής είναι πως μπορεί να ΑΠΕΝΕΡΓΟΠΟΙΕΊΤΑΙ ένα ΟΛΟΚΛΗΡΟ MODULE αν ΔΕΝ χρειάζεται οπότε σε idle η μερικού load καταστάσεις ο επεξεργαστής θα είναι πολύ πιο efficient σε σχέση με τον THUBAN, K10, K10,5 κ.λ.π. άσχετα αν σε πλήρη φορτίο το θερμικό αποβαλόμενο ποσό ενέργειας TDP θα είναι το ίδιο με τον thuban ! Αλλο θετικό στο κομμάτι "κατανάλωση ενέργειας & πλάνο ενεργειας" είναι πως μπορούμε διαλέγοντας πλανο ενέργειας ανάμεσα σε ταχύτητα και σε κατανάλωση, να τρέξουμε τον επεξεργαστή με τρόπους που μέχρι τώρα δεν μπορούσαμε ελέγχοντας το μέγεθος της ενεργής CACHE και της ενεργής FPU πέρα από την συχνότητα και τους πυρήνες ..... !!! Πχ. Αν έχουμε ένα πρόγραμμα που τρέχει σε 2 πυρήνες τότε αν θέλουμε μεγάλη εξοικονόμηση ενέργεια θα το τρέξουμε επάνω σους πυρήνες (0-1),(2-3),(4-5),(6-7) με συναλική χρησιμοποιούμενη L2 CACHE 2MB και ενεργή την fpu (256bit) του πρώτου module, ενώ αν θέλουμε να το τρέξουμε όσο το δυνατόν ταχύτερα θα χρησιμοποιοήσουμε τους πυρήνες πχ.: (0-1),(2-3),(4-5),(6-7) όπου η συνολική χρησιμοποιούμενη L2 CACHE θα είναι 4MB (2MB για κάθε core) και τρέχουμε με όλη την FPU και των 2 modules (2x 256 = μιλώντας για μέγεθος)... Για να γίνουν όλα τα παραπάνω μάλλον θα χρειαστεί κάποιος driver από την AMD όπως πχ του COOL n QUIET που υπήρχε στα XP !!! αλλιως από μόνα τους τα Win δεν νομίζω να μπορούν να καταλάβουν την διαφορά ανά core/module κ.λ.π.......:hmm: Link to comment Share on other sites More sharing options...
billpeppas Σεπτέμβριος 18, 2011 #1217 Κοινοποίηση Σεπτέμβριος 18, 2011 Κυκλοφορία στα μέσα του Οκτώβρη για τους FX τελικά. Επιβεβαιωμένη πληροφορία Link to comment Share on other sites More sharing options...
GeorgeMan Σεπτέμβριος 18, 2011 #1218 Κοινοποίηση Σεπτέμβριος 18, 2011 Κυκλοφορια = καταστηματα ή τοτε θα γινει το launch και θα τρεχουμε να προλαβουμε τα 5 κομματια που θα ερθουν; Link to comment Share on other sites More sharing options...
billpeppas Σεπτέμβριος 18, 2011 #1219 Κοινοποίηση Σεπτέμβριος 18, 2011 Δεν το διευκρινίζει Εκτίμηση μου ότι θα είναι κάτι μεταξύ paperlaunch & light availability, δηλαδή άντε να έχουμε περί τα 50 CPU σε κάθε χώρα και καμμιά 300αριά @ USA. Link to comment Share on other sites More sharing options...
Dovakin Σεπτέμβριος 18, 2011 #1220 Κοινοποίηση Σεπτέμβριος 18, 2011 ...Για να γίνουν όλα τα παραπάνω μάλλον θα χρειαστεί κάποιος driver από την AMD και συ τώρα περιμένεις να βγάλει driver η AMD που θα πραγματοποιεί όλα αυτα? Link to comment Share on other sites More sharing options...
Recommended Posts
Archived
This topic is now archived and is closed to further replies.