DarthMoul Φεβρουάριος 21, 2009 Author #41 Κοινοποίηση Φεβρουάριος 21, 2009 Sorry αν έχει υπωθεί πουθενά, αλλά μου διαφεύγει, ο κώδικας που είναι διαθέσιμος ?Πληροφορίες για το ποιός compiler χρησιμοποιήθηκε και με ποιά flags υπάρχει ?Ότι χρειάζεσαι είναι εδώ. Χρησιμοποιούμε πάντα τον native compiler του κάθε λειτουργικού με default settings. Φυσικά όποιος θέλει κάνει compile με τα settings και τον compiler που νομίζει ότι θα τον ευνοήσουν. Link to comment Share on other sites More sharing options...
Indiana Φεβρουάριος 21, 2009 #42 Κοινοποίηση Φεβρουάριος 21, 2009 35 στο SPI???ΕΛΕΟΣΣΣΣΣΣΣΣΣΣΣΣΣΣΣ:046: :046: :046: Εγώ με τον Opt 144 στα 2.9 έβγαζα 28!!! ρε χαζούλη, χαίρω πολύ...δεν κάνω τίποτα σοβαρό πια...αυτό σε πείραξε ή η διαφορά με το systester? που είναι χαώδης... να μείνουμε στο θέμα μας... @darth: είναι θέμα κώδικα τέτοια διαφορά σε μένα? Link to comment Share on other sites More sharing options...
stealth1442169213 Φεβρουάριος 21, 2009 #43 Κοινοποίηση Φεβρουάριος 21, 2009 800αρες μνημες με 5αρια.64 bit vista sp13600mhz Πως τα καταφερες και εβγαλες 14.414s και στα δυο? Αυτό που ψάχνω εδώ είναι κατά πόσο είναι δίκαια τα παράπονα που διαβάζω σε διάφορα forums, από ανθρώπους που έχουν Intel, ότι ο tester αδικεί την Intel. Οχι απο μενα παντως Υποθετικη ερωτηση...αν τον κλειδωνες, εφτιαχνες και validation data base υπηρχε περιπτωση να τον δεχοταν το hwbot για benchmark στην θεση του SuperPi? stealth Link to comment Share on other sites More sharing options...
DarthMoul Φεβρουάριος 21, 2009 Author #44 Κοινοποίηση Φεβρουάριος 21, 2009 @darth: είναι θέμα κώδικα τέτοια διαφορά σε μένα? Αν έτρεξε ο ίδιος κώδικας και στους δύο, δεν νομίζω να είναι θέμα κώδικα. Κάτι άλλο έχει συμβεί. Μπορεί να έτρεχε κάτι στο background ή να έχει πρόβλημα η cache και να αναγκάζεται να κάνει ecc corrections που δεν είναι ορατά σε εσένα. Αν δεν έτρεχε κάτι στο background, κοίταξε τι διαφορές έχετε στο hw. DarthMoul added 2 Minutes and 48 Seconds later... Υποθετικη ερωτηση...αν τον κλειδωνες, εφτιαχνες και validation data base υπηρχε περιπτωση να τον δεχοταν το hwbot για benchmark στην θεση του SuperPi? stealth Πιστεύω θα το δεχόταν μαζί με το SuperPi, όχι στην θέση του. Δεν πρόκειται να το κλείσω πάντως. Link to comment Share on other sites More sharing options...
Indiana Φεβρουάριος 21, 2009 #45 Κοινοποίηση Φεβρουάριος 21, 2009 Αν έτρεξε ο ίδιος κώδικας και στους δύο, δεν νομίζω να είναι θέμα κώδικα. Κάτι άλλο έχει συμβεί. Μπορεί να έτρεχε κάτι στο background ή να έχει πρόβλημα η cache και να αναγκάζεται να κάνει ecc corrections που δεν είναι ορατά σε εσένα. Αν δεν έτρεχε κάτι στο background, κοίταξε τι διαφορές έχετε στο hw.δεν πρόκειται να δω σε super pi κάτω από 30 sec χωρίς να αγγίξω τα 3ghz...δεν είναι θέμα background, είναι θέμα προγράμματος...όλοι οι amd μάχονται να κατεβούν σε sec στο super pi, ενώ στο δικό σου πρόγραμμα πετάνε.... Link to comment Share on other sites More sharing options...
biller1442169134 Φεβρουάριος 21, 2009 #46 Κοινοποίηση Φεβρουάριος 21, 2009 Στα 64bit Vista SP1 Link to comment Share on other sites More sharing options...
A-L-I-V-E Φεβρουάριος 21, 2009 #47 Κοινοποίηση Φεβρουάριος 21, 2009 Phenom 9950 @ 3306 (14x228) 4GB DDR2 @ 456MHz 4-4-4-12 Vista SP2 32bit Link to comment Share on other sites More sharing options...
MADKiller7 Φεβρουάριος 21, 2009 #48 Κοινοποίηση Φεβρουάριος 21, 2009 Μια παρενθεση οφφ τοπικ,παρατηρησε κανεις να βελτιωνεται το Ο/C μονο με τον systester?Παρολο που τρεχω πολλα τεστ σταθεροτητας για να βρω το χρυσο σημειο του 7750ΒΕ με 8GB ram σε ο/c και σταθεροτητα,μετα απο 8 loop 128Μ στον systester εγινε σταθερος στα 3270 με ~1.375-1.38 ρευμα και 4*2GB@930,πριν εκανε fail σε ολα τα προγραμματα και ηθελε 1.40 για τα ιδια.ΧΡ 64bit ολα αυτα.ΧΡ64 αποτελεσματα δεχεστε σε screenshot? Link to comment Share on other sites More sharing options...
stealth1442169213 Φεβρουάριος 21, 2009 #49 Κοινοποίηση Φεβρουάριος 21, 2009 όλοι οι amd μάχονται να κατεβούν σε sec στο super pi, ενώ στο δικό σου πρόγραμμα πετάνε.... ...εν αντιθεσει με τους Intel που τα πανε το ιδιο καλα και στα δυο. stealth Link to comment Share on other sites More sharing options...
viper1442169065 Φεβρουάριος 21, 2009 #50 Κοινοποίηση Φεβρουάριος 21, 2009 δεν πρόκειται να δω σε super pi κάτω από 30 sec χωρίς να αγγίξω τα 3ghz...δεν είναι θέμα background, είναι θέμα προγράμματος...Εύκολα κάτω από 30.Εγώ πώς το έκανα?? Link to comment Share on other sites More sharing options...
Nos-Dio1442169068 Φεβρουάριος 21, 2009 #51 Κοινοποίηση Φεβρουάριος 21, 2009 Πως τα καταφερες και εβγαλες 14.414s και στα δυο?stealth χεχε μου εβγαλε το pi λιγοτερο μπορει και το system αλλα επειδη 2 φορες μου εβγαλαν και τα δυο τους 14.414...ειπα δεν μπορει..."θελουν" να το ποσταρω:033: Θελω να ποσταρω και απο το P3 μου να δω...:046: Αυτα τα προγραμματα επηρεαζονται αρκετα απο την μνημη...πρεπει να βαλω τις d9dqt να κατεβουν λιγο οι χρονοι Link to comment Share on other sites More sharing options...
nicksoti1442169068 Φεβρουάριος 21, 2009 #52 Κοινοποίηση Φεβρουάριος 21, 2009 Το superpi σου δεν βλεπω.Νομιζω ο Λουκας ζητησε και superpi για να δουμε τη διαφορα μεταξυ των δυο μετροπρογραμματων... ...και επίσης σε 32 bit κι εσύ postαρες 64:) κάπου 27.5 βγάζω Pi. Και στο κάτω κάτω υπάρχουν άπειρα databases με superpi σε Phenom, σε όλες τις συχνότητες. Δηλαδή αν postara screenshot με 20 sec θα με πίστευες; Το θέμα δεν είναι αν βγάλω 27 ή 25 ή 30, το θέμα είναι η χαοτική διαφορά με το stability tester σε ΑΜΔ. Σε Intel έχει νόημα η σύγκριση γιατί βγάζουν παραπλήσιο. ΠΑΡΑΤΗΡΗΣΗ: Αν στο tester δηλώσετε afinity μόνο σε ένα core, το score βελτιώνεται ελαφρώς, αλλά πάντα. Link to comment Share on other sites More sharing options...
backgroundman Φεβρουάριος 21, 2009 #53 Κοινοποίηση Φεβρουάριος 21, 2009 Καλησπέρα, έκανα και εγώ κάποιες μετρήσεις στα 6 μηχανήματα που μπορώ να έχω πρόσβαση. Τα 2 απο αυτά (C2D - Conroe και AMD Opteron148) έχω πρόσβαση μόνο μέσω VNC. Όλα τα μηχανήματα (6) τρέχουν Window$XP Pro SP2. Στα 3 Intel μηχανήματα (P4C-HT, C2D-Conroe και C2D-Merom (laptop)) παρατηρήθηκαν μικρές διαφορές ανάμεσα στα 2 προγράμματα. Η μεγαλύτερη διαφορά ήταν αυτή του P4C-HT (~3,8sec). Στα 3 AMD μηχανήματα (Opteron148, Opteron170 και Phenom9950) οι διαφορές ήταν πολύ μεγάλες. Στην ουσία το systester 1.0.0 υπολόγιζε τα 1Μ ψηφία στο μισό και λίγο λιγότερο χρόνο απο το superPi 1.5mod. Τα αποτελέσματα φαίνονται στο παρακάτω πίνακα : Επιπλέον έκανα και άλλο ένα πείραμα. Το ένα απο τα AMD μηχανήματα (Opteron170) έχει και Linux (Gentoo x86_64 - 2.6.24-r8). Είπα λοιπόν να κάνω μετρήσεις και στο Linux. Ετρεξα λοιπόν το superPi 1.5mod και το systester 1.0.0 (win32 binary) μέσω wine (v 1.1.4) και επιπλέον το systester amd64 binary, το systester sources κάνοντας compile με τα default CFLAGS (-march=opteron -O2 -pipe) και το systester sources κάνοντας compile με τα CFLAGS του συστήματος (-march=opteron -O2 -msse3 -funroll-loops -finline-limit=900 -falign-functions=64 -fomit-frame-pointer -pipe) Οι διαφορές για τα 3 τελευταία systester είναι της τάξης του ~0.1 sec οπότε δεν έχει τόση σημασία να μπουν και τα 3 στο πείραμα. Οι διαφορές στα 2 προγράμματα (win32 binaries) ανάμεσα στα Window$ και στο Linux (wine ver 1.1.4) είναι πολύ μικρές με το systester να χάνει 0.6 sec στο wine ενώ το superPi να κερδίζει περίπου 0,2 sec στο wine. Οι διαφορές αυτές είναι μέσα στο στατιστικό σφάλμα των 2 προγραμμάτων αν τα τρέξουμε πολλαπλές φορές. Η διαφορά μεταξύ των 2 προγραμμάτων παρέμεινε και στο Linux (wine). To systester για linux [x86_64] (compile με custom flags) χρειάστηκε λιγότερο απο το μισό χρόνο που χρειάστηκε το systester win32 binary και λιγότερο απο το 1/4 του χρόνου που χρειάστηκε το superPi win32 binary για τον υπολογισμό των 1Μ ψηφίων του π (52% και 77% αντίστοιχα). Όλα αυτά φαίνονται στο παρακάτω γράφημα : Όσον αφορά την κουβέντα για το ποιο πρόγραμμα ευνοεί ποιον επεξεργαστή, το μόνο για το οποίο μπορούμε να μιλήσουμε είναι το systester, για το οποίο ξέρουμε τον κώδικα και μπορούμε να δούμε τι ακριβώς κάνει. Απ'οσο ξέρω στο systester χρησιμοποιείται η βιβλιοθήκη gmp (GNU Multiple Precision Arithmetic Library). Στο site της GMP υπάρχει ένας πίνακας με μετρήσεις του gmp-chudnovsky (πρόγραμμα υπολογισμού ψηφίων του π) στον οποίο φαίνεται οτι στα ίδια GHz οι επεξεργαστές της AMD (Opteron) είναι περίπου 20% ποιο γρήγοροι απο τους αντίστοιχους επεξεργαστές της Intel (Core2) για υπολογισμούς μεγάλου αριθμόυ ψηφίων του π. Αν τις παραπανω μετρήσεις (εξαιρώντας τον P4C-HT - αρκετά παλιά αρχιτεκτονική) τις κατατάξουμε σε αύξουσα σειρά με βάση τα GHz του επεξεργαστή και όπου έχουμε "ισοπαλία", με βάση τα ΜΗz της μνήμης τότε παρατηρούμε το εξής "παράδοξο" : (1) Στο systester έχουμε ομαλή πτώση του χρόνου εκτέλεσης σε σχέση με την αύξηση των GHz του επεξεργαστή εκτός απο μια πολύ μικρή διαφορά στους 2 opteron, όπου ο Optoren170 στα 2.35GHz υπολογίζει ~1sec πιο γρήγορα απο τον Opteron148 στα 2.64GHz. Στη συγκεκριμένη περίπτωση πιστεύω οτι η μικρή διαφορά οφείλεται στη διαφορά 100MHz στο χρονισμών των μνημών των 2 συστημάτων. (2) Στο SuperPi έχουμε 2 διαφορετικές γραμμές, μια για κάθε εταιρία κατασκευής επεξεργαστών. Όσον αφορά την Intel υπάρχει ομαλή πτώση του χρόνου εκτέλεσης με την άυξηση των MHz της μνήμης, μιας και οι 2 επεξεργαστές (C2D) είναι χρονισμένοι στα ίδια GHz. Στην AMD υπάρχει ομαλή πτώση σε σχέση με τα GHz του επεξεργαστή. Το παράδοξο είναι οτι ανάμεσα στις 2 εταιρίες υπάρχει ένα χάσμα περίπου 10 sec, το οποίο "συναντιέται" στα 26 sec μεταξύ του C2D T7250 στα 2GHz και του Phenom9950 στα 3GHz. Στο συγκεκριμένο "ζευγάρι" επεξεργαστών ενώ η διαφορά τους στα GHz είναι 50% υπέρ του Phenom η διαφορά τους στο SuperPi είναι της τάξης του 1.9% ενώ η διαφορά τους στο systester είναι της τάξης του 52%. Το γράφημα φαίνεται παρακάτω : Αν λάβουμε υπόψη μας τα παραπάνω για τη βιβλιοθήκη GMP, ως δεδομένα και αυξήσουμε τους χρόνους του systester για τους επεξεργαστές της AMD κατα 20% παρατηρούμε οτι πάλι η πτώση του χρόνου επεξεργασίας σε σχέση με τα GHz του επεξεργαστή είναι ομαλή (πιο ομαλή απο πριν στο σημείο αλλαγής του κατασκευαστή). Αυτο μας οδηγεί στο συμπέρασμα οτι η διαφορά μεταξύ του systester και του SuperPi για τους επεξεργαστές της AMD δεν οφείλεται στη χρήση ή όχι της βιβλιοθήκης GMP. To γράφημα φαίνεται παρακάτω : Απο τον αλγόριθμο Gauss-Legendre για τον υπολογισμό του π βλέπουμε οτι όλες οι πράξεις που γίνονται είναι πράξεις μεταξύ floating-point αριθμών, οπότε τον κύριο λόγο για τους υπολογισμούς τον έχει η FPU του επεξεργαστή. Η FPU ενός επεξεργαστή κατα κύριο λόγο θα πρέπει να ακολουθεί ένα συγκεκριμένο standard (IEEE 754) και απο εκεί και πέρα η απόδοση της εξαρτάται απο την εκάστοτε υλοποίηση, τα διάφορα "optimizations" του κατασκευαστή και τον χρονισμό της. Στα "optimizations" αναφέρονται τα διάφορα "κόλπα" που κάνουν οι κατασκευαστές για γρήγορο υπολογισμό συγκεκριμένων συναρτήσεων και οι διάφορες περετέρω εντολές. Απο το τελευταίο γράφημα είναι ξεκάθαρο οτι οι FPUs των επεξεργαστών Intel και AMD δεν διαφέρουν πάρα πολύ σε απόδοση παρα μόνο αν είναι χρονισμένες σε μεγαλύτερα GHz. Σε διαφορετική περίπτωση το γράφημα του systester (ή του systester + 20%) θα ήταν πολύ διαφορετικό. Αν για παράδειγμα η FPU ενός Intel επεξεργαστή είχε "optimizations" για τον υπολογισμό του π με βάση τον αλγόριθμο Gauss-Legendre (SuperPi) τότε θα υπήρχε η ίδια διαφορά και στο systester χρησιμοποιόντας τον ίδιο αλγόρθμο και κάντοντας τους ίδιους υπολογισμούς. Λαμβάνοντας υπόψην οτι ο κώδικας του systester είναι ανοιχτός και διαθέσιμος σε όλους σε αντίθεση με τον κώδικα του superPi, που για λόγους που δε μπορώ να καταλάβω, παραμένει κλειστός και "σφραγισμένος", εγώ μόνο ένα λογικό συμπέρασμα μπορώ να βγάλω. Το superPi μάλλον ευνοεί τους επεξεργαστές της Intel. Παραθέτω και τα screenshots απο τα "πειράματα" Link to comment Share on other sites More sharing options...
backgroundman Φεβρουάριος 21, 2009 #54 Κοινοποίηση Φεβρουάριος 21, 2009 και το τελευταίο screenshot απο το linux... Link to comment Share on other sites More sharing options...
DarthMoul Φεβρουάριος 21, 2009 Author #55 Κοινοποίηση Φεβρουάριος 21, 2009 ΧΡ64 αποτελεσματα δεχεστε σε screenshot?Τα πάντα δεχόμαστε αλλά δεν μπορούμε να κάνουμε σύγκριση με το super pi που είναι 32 bits. Η 32 bit έκδοση του tester τρέχει και σε 64μπιτα win, οπότε μπορείς να συμμετέχεις κανονικά. Επίσης 32 και 64 bit εκδόσεις του tester μπορούν να συνυπάρχουν χωρίς πρόβλημα στο ίδιο σύστημα και δεν χρειάζεται να βγάλεις την μία για να βάλεις την άλλη. Link to comment Share on other sites More sharing options...
stealth1442169213 Φεβρουάριος 21, 2009 #56 Κοινοποίηση Φεβρουάριος 21, 2009 WOW,πολυ καλη δουλεια!!!!!Ευχαριστουμε backgroundman:)stealth Link to comment Share on other sites More sharing options...
DarthMoul Φεβρουάριος 21, 2009 Author #57 Κοινοποίηση Φεβρουάριος 21, 2009 @backgroundman:Το ξέρω από καιρό ότι η μεθοδικότητα σου είναι παρομοιώδης, αλλά σήμερα με άφησες άφωνο!!! Νομίζω πιο θεμελιωμένη απάντηση στα ερωτηματικά μας δεν θα μπορούσαμε να έχουμε. Link to comment Share on other sites More sharing options...
Nos-Dio1442169068 Φεβρουάριος 21, 2009 #58 Κοινοποίηση Φεβρουάριος 21, 2009 Αν μαζευτουνε πολλα δεδομενα και μεταβλητες οπως:cpu type,l2 cache,mem timings,mem type etc, μπορω να σας κανω μια στατιστικη αναλυση δεδομενων με το spss..τωρα που την περασα και ξερω:033: :046: .Απο βδομαδα που θα τελειωσει η εξεταστικη.Να βγει πχ ενα γραμμικο μοντελο που να ερμηνευει το pi σε σχεση με τα μυρια,μνημη κλπ.Ποσο pi θα ειχαμε με 12ghz,20mbl2 και μνημες 3ghz???...ε αυτο.. Link to comment Share on other sites More sharing options...
Indiana Φεβρουάριος 21, 2009 #59 Κοινοποίηση Φεβρουάριος 21, 2009 Εύκολα κάτω από 30.Εγώ πώς το έκανα??οι μνήμες μου δεν το επιτρέπουν...να σφίξω timings...με 3-4-4 μέχρι 270 με 275 μπορούσα να παίξω.....τεσπα... να δούμε και άλλες μετρήσεις..:033: Link to comment Share on other sites More sharing options...
backgroundman Φεβρουάριος 21, 2009 #60 Κοινοποίηση Φεβρουάριος 21, 2009 @backgroundman:Το ξέρω από καιρό ότι η μεθοδικότητα σου είναι παρομοιώδης, αλλά σήμερα με άφησες άφωνο!!! Νομίζω πιο θεμελιωμένη απάντηση στα ερωτηματικά μας δεν θα μπορούσαμε να έχουμε.Ευχαριστώ πολύ. Απο τις πρώτες εκδόσεις του systester (με τον Gauss-Legendre) είχα παρατηρήσει τις διαφορές που είχε με το SuperPI στους επεξεργαστές της AMD και τις διαφορές που ΔΕΝ ειχε στους Intel. Αμέσως μου μπήκαν ιδέες μιας και το SuperPi χρησιμοποιείται πολύ για μέτρηση επιδόσεων απο πολλούς χρήστες (σχετικούς και μη). Διάβαζα σε διάφορα site οτι υποψιάζονται "πειραγμένους" τους νέους Intel ωστε να τρέχουν πιο γρήγορα το superPI. Κάτι τέτοιο βέβαια θα είχε αποτέλεσμα και στο systester, πράγμα που δεν ήταν αλήθεια. Αμέσως υποψιάστηκα το superPI.Το συγκεκριμένο thread με έβαλε στο "κόπο" να κάνω τις μετρήσεις και να βγάλω τις γραφικές.Αυτό που φαίνεται καθαρά για μένα δεν είναι οτι το superPi ευνοεί τους Intel (όπως γράφω παραπάνω) αλλα οτι το SuperPi "κρατάει" πίσω τους AMD. Προφανώς (για μένα) έχουν "πειράξει" το superPi. Σε εμένα φαίνεται καθαρά πλέον οτι το superPi τρέχειάλλο κώδικα για AMD και άλλο για Intel. Εγώ δε βρίσκω άλλη λογική εξηγηση για τέτοιες διαφορές στους ίδιους υπολογισμούς... Αυτό βέβαια απο τη στιγμή που ο κώδικας του SuperPi είναι κλειστός και "σφραγισμένος" δε μπορεί να το επιβεβαιώσει κανείς. Αλήθεια ξέρει κανείς γιατι ένα προγραμματάκι του κ*λου που διανέμεται δωρεάν και χρησιμοποιείται απο τους περισσότερους για τη κατάταξη των επεξεργαστών, πρέπει να είναι κλειστού κώδικα. Ποτέ δε κατάλαβα τη μανία των περισσοτέρων για χαμηλότερα νούμερα στο superPi. Απο την εμπειρία μου τα χαμηλότερα νούμερα στο superPi δε σημαίνουν τίποτα απολύτως για τον επεξεργαστή (ειδικά αν είναι AMD)... Link to comment Share on other sites More sharing options...
Recommended Posts
Archived
This topic is now archived and is closed to further replies.