Jump to content



Linux 64Bit VS 32Bit- fight : A64 X2 VS C2D / score: 1 - 1


panoc

Recommended Posts

καλα κανω εγω και κραταω τον opteron

μηπως βγουνε μονο 64 εφαρμογες

Φιλε αυτες θα αργησουν πολυ.Αυτο οι προγραμματιστες βαριουνται και που ζουν.

  • Replies 58
  • Created
  • Last Reply
Darth Moul, παίζει ρόλο εάν gmp και systester είναι compiled με -msse3 ή όχι;

Η gmp χρησμοποιεί μόνο mmx αν τα βρει διαθέσιμα. Τα sse δεν της προσφέρουν απολύτως τίποτα.

Λοιπόν ορίστε και αποτελέσματα από Arch Linux amd64 με gmp 4.2.1 και systester 0.6.

attachment.php?attachmentid=15622&stc=1&d=1180107726

Η CPU είναι ένας stock AMD K8 Toledo στα 2.2GHz χωρίς πουθενά κλοκάρισμα.

Ο systester βγάζει λάθος συχνότητα γιατί όταν ξεκινά το πρόγραμμα δεν υπάρχει φόρτος και λόγω power throttling είναι πεσμένη φυσιολογικά η CPU στο 1.0GHz.

post-1802-1442174651,724_thumb.png

Εδώ έχει μετρήσεις από το gmpbench. Έτσι για να έχετε μια ιδέα που περίπου παίζει η CPU σας. Και που παίζει και η x86 πλατφόρμα :p

Δείτε εδώ τις 2 πρώτες γραμμές:

CPU			MHz	GMPbench	Optimal
Opteron/Athlon64 2600 8995 16000 @ 3GHz
Core2 3000 7570 11000 @ 3GHz

Και δείτε το Optimal στο τέλος.

Διαβάστε την υποσημείωση στη σελίδα για το Optimal:

The last column, "Optimal", is an estimate of what could be attained by writing optimized assembly code for this processor.

Και παρατηρείστε ότι μας λέει τιμή για τα ίδια GHz, άρα άμεσα συγκρίσιμα.

Δηλαδή βλέπουμε πόσο πιο προηγμένος και καλοσχεδιασμένος είναι σαν CPU ο AMD K8.

Είναι 3.25 παλαιότερη τεχνολογία και όμως μπορεί να δώσει 16/11 = 1.45 ή 45% καλύτερο IPCC.

Wan γιατί δεν γράφεις όλες τις παρατηρήσεις. Νομίζω είναι χρήσιμες:

Notes:

  • The last column, "Optimal", is an estimate of what could be attained by writing optimized assembly code for this processor.
  • There was no assembly loop support for Opteron/Athlon64 in GMP 4.1.4. We therefore include two results above for Opteron, 32-bit results using the Athlon32 assembly loops, and 64-bit results using plain C with inline assembly.
  • The performance for the Pentium 4 EM64T processors disappoints. There are performance problems with many instructions GMP depends on: 64-bit multiply, integer right shift, and conditional moves and set-on-condition instructions all need around 10 (ten!) cycles. See also this report: http://swox.com/doc/x86-timing.pdf
  • The 32-bit 90nm Pentium 4 processors (Prescott) run GMP applications slower than older Pentium 4 processors. The reason is that Prescott has longer latencies for SSE2 instructions and memory loads.
  • UltraSPARC 3's terrible scores are a result of its uniquely poor integer multiply support (unsuitable architectural support + simplistic integer multiply implementation).

Να και τα αποτελέσματα από τον "μικρούλη" AMD K7 Barton στα 2.0GHz (10x200).

attachment.php?attachmentid=15623&stc=1&d=1180115047

Αλήθεια, Darth Moul, γιατί δεν έχουμε επιλογή για ένα μόνο thread;

post-1802-1442174652,669_thumb.png

Αλήθεια, Darth Moul, γιατί δεν έχουμε επιλογή για ένα μόνο thread;

Γιατί δεν φτιάχτηκε για bench αλλά για άλλο λόγο. Είναι μεγάλη ιστορία που ξεκίνησε από αυτό εδώ το thread.

Όταν ο Barton κλήθηκε να κάνει 2 threads αντί για 1, αυτό τί από τα παρακάτω σημαίνει:

α. Ότι είχε να κάνει 2πλή δουλειά

β. Ότι είχε να κάνει την ίδια δουλειά μοιρασμένη σε 2 κομμάτια

Υποθέτω ότι ισχύει το α. Πέφτω μέσα;

Όταν ο Barton κλήθηκε να κάνει 2 threads αντί για 1, αυτό τί από τα παρακάτω σημαίνει:

α. Ότι είχε να κάνει 2πλή δουλειά

β. Ότι είχε να κάνει την ίδια δουλειά μοιρασμένη σε 2 κομμάτια

Υποθέτω ότι ισχύει το α. Πέφτω μέσα;

Υπολογισε τον μισο χρονο περιπου για τον barton σου αν ετρεχε 2 threads σε single core. Το stab tester του Λουκα ειχε βγει περιπου την ιδια εποχη με τους Χ2 και ειχαμε μεινει ολοι λαλακες οταν ο Βαιος ειχε ποσταρει το πρωτο σκορ με τον 4400+ του που μας εριχνε μισο χρονο σε ολους.

Όταν ο Barton κλήθηκε να κάνει 2 threads αντί για 1, αυτό τί από τα παρακάτω σημαίνει:

α. Ότι είχε να κάνει 2πλή δουλειά

β. Ότι είχε να κάνει την ίδια δουλειά μοιρασμένη σε 2 κομμάτια

Υποθέτω ότι ισχύει το α. Πέφτω μέσα;

Ναι το α είναι.

Άρα σύμφωνα με το τεστ αυτό, στην ίδια συχνότητα, ένας San Diego είναι ταχύτερος ενός Barton κατά 11% περίπου.

Άρα σύμφωνα με το τεστ αυτό, στην ίδια συχνότητα, ένας San Diego είναι ταχύτερος ενός Barton κατά 11% περίπου.

λαθος συλογισμος.

η σωστος οπως σε καθε bench ειναι.

συμφωνα με το αποτελεσμα σε αυτο το bench ο san diego ειναι 11% ταχυτερος απο τον barton.

αληθεια για πες στοιχεια cpu.

Να και ενα απο μενα.

Δεν ειναι κομματακι ασχημο?

Μάλλον το τρέχεις με την παλιά gmp. Με την καινούργια οι χρόνοι είναι οι μισοί.

Αυτο πως το ελεγχω? Εφοσον ειναι εγκατεστημενη μεσα απο synaptic δουλευει αμεσα ή πρεπει να κανω κατι εγω?

Αυτο πως το ελεγχω? Εφοσον ειναι εγκατεστημενη μεσα απο synaptic δουλευει αμεσα ή πρεπει να κανω κατι εγω?

Το binary του tester που τρέχεις είναι στατικό. Μόνο αν κατεβάσεις τα sources και τρέξεις το build script (αν τρέξει σωστά στην διανομή σου. δεν ξέρω) θα πάρεις εκτελέσιμο με την καινούργια gmp.

Και αυτό πρέπει να είναι δυσμενές τεστ ακόμα και για τους K8 διότι όταν είχα μεταβεί από τον Barton 2.0GHz στον Winchester 2.0GHz, οι χρόνοι emerge στο Gentoo είχαν πέσει στα 2/3, δηλαδή +50%.

Archived

This topic is now archived and is closed to further replies.

×
×
  • Δημιουργία...

Important Information

Ο ιστότοπος theLab.gr χρησιμοποιεί cookies για να διασφαλίσει την καλύτερη εμπειρία σας κατά την περιήγηση. Μπορείτε να προσαρμόσετε τις ρυθμίσεις των cookies σας , διαφορετικά θα υποθέσουμε ότι είστε εντάξει για να συνεχίσετε.