slaught Μάϊος 25, 2007 #41 Μάϊος 25, 2007 καλα κανω εγω και κραταω τον opteronμηπως βγουνε μονο 64 εφαρμογεςΦιλε αυτες θα αργησουν πολυ.Αυτο οι προγραμματιστες βαριουνται και που ζουν.
WAntilles Μάϊος 25, 2007 #42 Μάϊος 25, 2007 Darth Moul, παίζει ρόλο εάν gmp και systester είναι compiled με -msse3 ή όχι;
DarthMoul Μάϊος 25, 2007 #43 Μάϊος 25, 2007 Darth Moul, παίζει ρόλο εάν gmp και systester είναι compiled με -msse3 ή όχι;Η gmp χρησμοποιεί μόνο mmx αν τα βρει διαθέσιμα. Τα sse δεν της προσφέρουν απολύτως τίποτα.
WAntilles Μάϊος 25, 2007 #44 Μάϊος 25, 2007 Λοιπόν ορίστε και αποτελέσματα από Arch Linux amd64 με gmp 4.2.1 και systester 0.6. Η CPU είναι ένας stock AMD K8 Toledo στα 2.2GHz χωρίς πουθενά κλοκάρισμα. Ο systester βγάζει λάθος συχνότητα γιατί όταν ξεκινά το πρόγραμμα δεν υπάρχει φόρτος και λόγω power throttling είναι πεσμένη φυσιολογικά η CPU στο 1.0GHz.
WAntilles Μάϊος 25, 2007 #45 Μάϊος 25, 2007 Εδώ έχει μετρήσεις από το gmpbench. Έτσι για να έχετε μια ιδέα που περίπου παίζει η CPU σας. Και που παίζει και η x86 πλατφόρμα Δείτε εδώ τις 2 πρώτες γραμμές: CPU MHz GMPbench OptimalOpteron/Athlon64 2600 8995 16000 @ 3GHzCore2 3000 7570 11000 @ 3GHz Και δείτε το Optimal στο τέλος. Διαβάστε την υποσημείωση στη σελίδα για το Optimal: The last column, "Optimal", is an estimate of what could be attained by writing optimized assembly code for this processor. Και παρατηρείστε ότι μας λέει τιμή για τα ίδια GHz, άρα άμεσα συγκρίσιμα. Δηλαδή βλέπουμε πόσο πιο προηγμένος και καλοσχεδιασμένος είναι σαν CPU ο AMD K8. Είναι 3.25 παλαιότερη τεχνολογία και όμως μπορεί να δώσει 16/11 = 1.45 ή 45% καλύτερο IPCC.
DarthMoul Μάϊος 25, 2007 #46 Μάϊος 25, 2007 Wan γιατί δεν γράφεις όλες τις παρατηρήσεις. Νομίζω είναι χρήσιμες:Notes: The last column, "Optimal", is an estimate of what could be attained by writing optimized assembly code for this processor. There was no assembly loop support for Opteron/Athlon64 in GMP 4.1.4. We therefore include two results above for Opteron, 32-bit results using the Athlon32 assembly loops, and 64-bit results using plain C with inline assembly. The performance for the Pentium 4 EM64T processors disappoints. There are performance problems with many instructions GMP depends on: 64-bit multiply, integer right shift, and conditional moves and set-on-condition instructions all need around 10 (ten!) cycles. See also this report: http://swox.com/doc/x86-timing.pdf The 32-bit 90nm Pentium 4 processors (Prescott) run GMP applications slower than older Pentium 4 processors. The reason is that Prescott has longer latencies for SSE2 instructions and memory loads. UltraSPARC 3's terrible scores are a result of its uniquely poor integer multiply support (unsuitable architectural support + simplistic integer multiply implementation).
WAntilles Μάϊος 25, 2007 #47 Μάϊος 25, 2007 Να και τα αποτελέσματα από τον "μικρούλη" AMD K7 Barton στα 2.0GHz (10x200). Αλήθεια, Darth Moul, γιατί δεν έχουμε επιλογή για ένα μόνο thread;
DarthMoul Μάϊος 25, 2007 #48 Μάϊος 25, 2007 Αλήθεια, Darth Moul, γιατί δεν έχουμε επιλογή για ένα μόνο thread;Γιατί δεν φτιάχτηκε για bench αλλά για άλλο λόγο. Είναι μεγάλη ιστορία που ξεκίνησε από αυτό εδώ το thread.
WAntilles Μάϊος 25, 2007 #49 Μάϊος 25, 2007 Όταν ο Barton κλήθηκε να κάνει 2 threads αντί για 1, αυτό τί από τα παρακάτω σημαίνει:α. Ότι είχε να κάνει 2πλή δουλειάβ. Ότι είχε να κάνει την ίδια δουλειά μοιρασμένη σε 2 κομμάτιαΥποθέτω ότι ισχύει το α. Πέφτω μέσα;
SLN Μάϊος 25, 2007 #50 Μάϊος 25, 2007 Όταν ο Barton κλήθηκε να κάνει 2 threads αντί για 1, αυτό τί από τα παρακάτω σημαίνει:α. Ότι είχε να κάνει 2πλή δουλειάβ. Ότι είχε να κάνει την ίδια δουλειά μοιρασμένη σε 2 κομμάτιαΥποθέτω ότι ισχύει το α. Πέφτω μέσα;Υπολογισε τον μισο χρονο περιπου για τον barton σου αν ετρεχε 2 threads σε single core. Το stab tester του Λουκα ειχε βγει περιπου την ιδια εποχη με τους Χ2 και ειχαμε μεινει ολοι λαλακες οταν ο Βαιος ειχε ποσταρει το πρωτο σκορ με τον 4400+ του που μας εριχνε μισο χρονο σε ολους.
DarthMoul Μάϊος 25, 2007 #51 Μάϊος 25, 2007 Όταν ο Barton κλήθηκε να κάνει 2 threads αντί για 1, αυτό τί από τα παρακάτω σημαίνει:α. Ότι είχε να κάνει 2πλή δουλειάβ. Ότι είχε να κάνει την ίδια δουλειά μοιρασμένη σε 2 κομμάτιαΥποθέτω ότι ισχύει το α. Πέφτω μέσα;Ναι το α είναι.
WAntilles Μάϊος 25, 2007 #52 Μάϊος 25, 2007 Άρα σύμφωνα με το τεστ αυτό, στην ίδια συχνότητα, ένας San Diego είναι ταχύτερος ενός Barton κατά 11% περίπου.
panoc Μάϊος 25, 2007 Author #53 Μάϊος 25, 2007 Άρα σύμφωνα με το τεστ αυτό, στην ίδια συχνότητα, ένας San Diego είναι ταχύτερος ενός Barton κατά 11% περίπου.λαθος συλογισμος.η σωστος οπως σε καθε bench ειναι.συμφωνα με το αποτελεσμα σε αυτο το bench ο san diego ειναι 11% ταχυτερος απο τον barton.αληθεια για πες στοιχεια cpu.
DarthMoul Μάϊος 25, 2007 #55 Μάϊος 25, 2007 Να και ενα απο μενα.Δεν ειναι κομματακι ασχημο?Μάλλον το τρέχεις με την παλιά gmp. Με την καινούργια οι χρόνοι είναι οι μισοί.
cabrinha Μάϊος 25, 2007 #56 Μάϊος 25, 2007 Αυτο πως το ελεγχω? Εφοσον ειναι εγκατεστημενη μεσα απο synaptic δουλευει αμεσα ή πρεπει να κανω κατι εγω?
DarthMoul Μάϊος 25, 2007 #57 Μάϊος 25, 2007 Αυτο πως το ελεγχω? Εφοσον ειναι εγκατεστημενη μεσα απο synaptic δουλευει αμεσα ή πρεπει να κανω κατι εγω?Το binary του tester που τρέχεις είναι στατικό. Μόνο αν κατεβάσεις τα sources και τρέξεις το build script (αν τρέξει σωστά στην διανομή σου. δεν ξέρω) θα πάρεις εκτελέσιμο με την καινούργια gmp.
WAntilles Μάϊος 26, 2007 #59 Μάϊος 26, 2007 Και αυτό πρέπει να είναι δυσμενές τεστ ακόμα και για τους K8 διότι όταν είχα μεταβεί από τον Barton 2.0GHz στον Winchester 2.0GHz, οι χρόνοι emerge στο Gentoo είχαν πέσει στα 2/3, δηλαδή +50%.
Recommended Posts
Archived
This topic is now archived and is closed to further replies.