Jump to content



AMD ZEN thread


jesus

Recommended Posts

https://www.extremetech.com/extreme/188776-how-l1-and-l2-cpu-caches-work-and-why-theyre-an-essential-part-of-modern-chips

Συν αυτό εδώ το άρθρο που εξηγεί γιατί ακόμα και με πολύ μικρά cache miss ratios της τάξης του 2% μπορεί τελικά η καθυστέρηση να είναι μεγάλη.

 

Εκείνο που έχω σκεφτεί και που μπορεί να βοηθήσουν οι κβαντικοί είναι το να βρίσκονται αποθηκευμένα σε μια κβαντική μνήμη τα αποτελέσματα όλων των πιθανών branches για ένα πολύ στενό πρόβλημα και καθώς προχωράει το θρεντ να παίρνεις έτοιμα αποτελέσματα, χωρίς ανάγκη υπολογισμών.

 

Επίσης υπάρχει ένα πράγμα που λέγεται speculative multithreading, αλλά δεν έχω καταλάβει ακριβώς πώς λειτουργεί. Νομίζω ότι είναι η πρόβλεψη εξέλιξης και μετά η εκτέλεση ενός ολόκληρου θρεντ, αλλά λέγεται ότι είναι πολύ δύσκολο στην εφαρμογή του.

Link to comment
Share on other sites

Επειδή το machine learning είναι πολύ higher level κομμάτι και πλέον σχεδόν όλα τα πανεπιστήμια έχουν αρχίσει και επικεντρώνονται εκεί, θα δούμε πολλά ωραία πραγματάκια τα επόμενα χρόνια. Απ' ότι έχω δει εδώ και 2-3 χρόνια κάποιοι έχουν αρχίσει να επικεντρώνονται ακόμα και στην cache και υπάρχουν papers που έχουν στήσει πλατφόρμες σε simics και κάνουν emulations για cache αλγόριθμους. To πιο εντυπωσιακό είναι ότι υπάρχουν αποτελέσματα. Τα χρησιμοποιούμε πολύ και στην δουλειά για audio (όχι εγώ προσωπικά, αλλά έχω παίξει και έχω δει τα αποτελέσματα) και πραγματικά όποιος αποφασίσει να ασχοληθεί με τον τομέα, θα έχει δουλειά για τα επόμενα χρόνια. Δυστυχώς και για μένα το unsupervised learning (που χρησιμοποιείται για την cache) μου είναι παντελώς εξωγήινο για να καταλάβω τι κάνουν και είναι ένας άλλος κόσμος σε σχέση με το supervised.

 

Οι κβαντικοί μπορούν να κάνουν πολύ γρήγορους υπολογισμούς, αλλά είναι το μέσο, όχι η ουσία. Φυσικά και η ταχύτητα του μέσου είναι εξίσου σημαντική. Απλά αυτό που επιτυγχάνουν είναι ότι μπορούν να υπολογίσουν πιο γρήγορα την επόμενη 2η, 3η κλπ πιθανότητα. Δηλαδή θα υλοποιήσουν πιο γρήγορα τον αλγόριθμο. Εξίσου σημαντικό. Ένα πολύ καλό pre-fetching network με γρήγορο μέσο, θα κλείσει την ψαλίδα cpu-data fetch.

 

Το multithreading, είναι software υλοποίηση. Δεν ξέρω τι νέο ετοιμάζουν, αλλά η τωρινή αρχιτεκτονική δεν είναι bottleneck ουσιαστικά. Ίσως γίνει bottleneck όταν λυθούν τα προηγούμενα.

 

Λογικά και η intel και η amd, πρέπει να έχουν στρατιές από τέτοιους μηχανικούς και δεν θα μου έκανε καθόλου εντύπωση αν η intel χτυπήσει σύντομα με κάτι που να έχει να κάνει με την cache. Ακόμα και αν δεν έχουν κάτι, σίγουρα πρέπει να ρίχνουν πολύ έρευνα εκεί. Αν και με την μικρή εμπειρία που είχα με την intel, έχω καταλάβει ότι είναι ναι μεν κολοσσός, αλλά κάνουν και αλλοπρόσαλλες κινήσεις, χωρίς καμία λογική, τουλάχιστον στο embedded.

Έγινε επεξεργασία από Jaco
  • Like 1
Link to comment
Share on other sites

Το unsupervised learning απλά ψάχνει για μοτίβα παντού. Όταν ανακαλύψει μοτίβα σε μια εφαρμογή ήχου π.χ. θα ξέρει τι θα ζητήσει η cpu μετά(σε κάποιες περιπτώσεις). Ενώ στο supervised του λες εξαρχής ότι υπάρχει ένα μοτίβο ανάμεσα σε πακέτα δεδομένων(φωτογραφίες π.χ.) και ψάχνει να βρει ποιό είναι. Το πρόβλημα είναι ότι ακόμα και λίγα cache misses καθυστερούν τη cpu. Και πάντα θα υπάρχουν.

 

Το speculative multithreading(hardware λύση) είναι να έχεις π.χ. 100 cores να τρέχουν 100 πιθανές εξελίξεις ενός θρεντ. Καθώς προχωράει το θρεντ βλέπεις αν υπάρχει σωστή πρόβλεψη από τις 100 υποθετικές(speculative) διακλαδώσεις και παίρνεις τα αποτελέσματα. Αυτό όμως λένε ότι είναι παλούκι στην πράξη(το έχουν ήδη ψάξει οι μεγάλοι).

Με τους κβαντικούς θα έχεις στη μνήμη τους π.χ. 1 εκατοντάκις διαφορετικές πιθανές διακλαδώσεις και θα παίρνεις κατευθείαν το αποτέλεσμα χωρίς υπολογισμό εκείνη τη στιγμή. 

Link to comment
Share on other sites

Εντάξει ξέρω τι είναι το καθένα, το supervised το έχω δουλέψει, απλά διαβάζοντας το unsupervised και ριχνοντας μία ματιά στα libs του scikit και την θεωρία πίσω από αυτά, σήκωσα τα χέρια ψηλά.

 

Για τους κβαντικούς που λες, δε νομίζω οτι ισχύει αυτο στην περίπτωση της cache. Δηλαδη, οι διακλαδωσεις δεν εχουν τοσο νόημα, η μνημη ειναι άπειρη όπως και το επόμενο άγνωστο byte. Σημασία έχει το να "τρεξεις" το neural network σου. Εκει θες ταχύτητα.

  • Like 1
Link to comment
Share on other sites

Δόθηκε επίσημα απάντηση/ επιβεβαίωση για την ταχύτητα του Infinity Fabric (IF) που εκτός όλων των άλλων, συνδέει και τα CCX μεταξύ τους.

 

Είναι 256bit bi-directional και τρέχει στην ταχύτητα της μνήμης (SDR), δηλαδή τρέχει πάντα στο μισό της DDR4.

Άρα, αν η μνήμη DDR4 που υποστηρίζει ο memory controller είναι 2133ΜΗz, το IF τρέχει στα 1066MHz.

 

Αυτός είναι ένας σημαντικός λόγος, όποιος πάρει RyZen να στοχεύσει στις ταχύτερες μνήμες που σηκώνει το motherboard με overclocking, όχι μόνο για το αυξημένο memory bandwidth που ισχύει για όλες τις CPU αλλά και το αυξημένο interconnection speed των CCX που ανάλογα με το workload επηρεάζει πολύ περισσότερο την ταχύτητα της CPU σε σύγκριση με το increased memory bandwidth, που έτσι κι αλλιώς θα το έχεις με αυξημένη ταχύτητα μνήμης.

 

Αυτό πιθανόν εξηγεί την αναλογικά μεγαλύτερη αύξηση στο συνολικό perfomance της CPU όταν αυξάνει η ταχύτητα της μνήμης π.χ στο προηγούμενο post με το video και την απόδοση στα games σε σχέση με το memory speed.

 

Εδώ η απάντηση της AMD:

481927462be9.jpg

Έγινε επεξεργασία από NikosD
  • Like 5
Link to comment
Share on other sites

Και με την βούλα η Microsoft κόβει τον RyZen (και τον Kabylake) από τα παλαιότερα λειτουργικά της.

Μόνο Windows 10 updates λέει για RyZen, χωρίς κάποιο τεχνικό λόγο.

 

Απλά είναι η πολιτική της.

Αυτό σημαίνει ότι ο Windows Scheduler των Windows 10 θα φτιαχτεί σίγουρα ;)

 

http://hothardware.com/news/microsoft-disables-windows-update-on-ryzen-kaby-lake-pcs-running-windows-7-windows-8

  • Like 3
Link to comment
Share on other sites

Έχω ένα αίσθημα οτι η AMD ρίχνει τιμές αλλά παράλληλα ανοίγει το δρόμο στους κατασκευαστές του υπόλοιπου hardware ώστε να μπορέσουν να σπρώξουν ακριβό υλικό που θα έχει διαφορά στους επεξεργαστές της. Ουσιαστικά τους δίνει "πράσινο" (pun) φως για ακριβό motherboard μνήμες μοιράζοντας το κέρδος της αλλά προσελκύωντας εταιρείες να υποστηρίξουν τον Ryzen? Υπερβολή να το σκέφτομαι αυτό;

Έγινε επεξεργασία από konnos
  • Like 1
Link to comment
Share on other sites

Ακριβώς όπως το συζητούσαμε κι εμείς στην προηγούμενη σελίδα, υπολογισμένο με τις απλούστερες δυνατές υποθέσεις. Απλά, εξακολουθούμε να μην έχουμε πραγματικά core failure rates (και δεν περιμένω να δούμε ποτέ). Αυτή η πολιτική δε δίνει τις καλύτερες επιδόσεις, αλλά τουλάχιστον δίνει τα πιο προβλέψιμα αποτελέσματα. Το μη χείρον, βέλτιστον.

Link to comment
Share on other sites

πριν 2 λεπτά, το μέλος acct έγραψε:

Ακριβώς όπως το συζητούσαμε κι εμείς στην προηγούμενη σελίδα, υπολογισμένο με τις απλούστερες δυνατές υποθέσεις. Απλά, εξακολουθούμε να μην έχουμε πραγματικά core failure rates (και δεν περιμένω να δούμε ποτέ). Αυτή η πολιτική δε δίνει τις καλύτερες επιδόσεις, αλλά τουλάχιστον δίνει τα πιο προβλέψιμα αποτελέσματα. Το μη χείρον, βέλτιστον.

 

+ ότι αν ισχύουν τα παραπάνω, όλα τα chip (εκτός από τα σπάνια 4+0) δυνητικά θα ξεκλειδώνουν.

Έγινε επεξεργασία από Trexx
Link to comment
Share on other sites

11 minutes ago, Trexx said:

 

+ ότι αν ισχύουν τα παραπάνω, όλα τα chip (εκτός από τα σπάνια 4+0) δυνητικά θα ξεκλειδώνουν.

Εκτός κι αν μπορεί να το κόψει η AMD μέσα από τον μικροκώδικα του επεξεργαστή...

Link to comment
Share on other sites

21 minutes ago, Trexx said:

+ ότι αν ισχύουν τα παραπάνω, όλα τα chip (εκτός από τα σπάνια 4+0) δυνητικά θα ξεκλειδώνουν.

Ναι, αν κάποιοι πυρήνες είναι λειτουργικοί και απενεργοποιημένοι. Αν όμως το πρόβλημα είναι στην cache; Λογικά γι αυτό κάποιοι R5 έχουν και λιγότερη L3. Στην προσπάθεια να ξεκλειδώσεις το τσιπ μπορείς εύκολα να καταλήξεις με ένα ωραίοτατο blue screen machine. Σαν proof-of-concept, θα το δοκίμαζα, αλλά είναι μια διαδικασία που δε συμπαθώ για συστήματα παραγωγής.

Έγινε επεξεργασία από acct
"κάποιοι R5"
  • Like 1
Link to comment
Share on other sites

Επιστράτευσα τη cache ως παράδειγμα. Δεν έχω ακριβή εικόνα των σφαλμάτων που συναντάνε. Αν, ως άλλο παράδειγμα, έχουν και κάποιο ποσοστό σφαλμάτων στο uncore, όταν βγουν οι Naples μπορεί να αρχίσουμε να βλέπουμε defective Naples να κυκλοφορούν ως R series. Κι εκεί δε θα πόνταρα στην πιθανότητα να ξεκλειδώνουν αξιόπιστα. Γενικά, δεν απολαμβάνω αυτό που είναι ίσως η μεγαλύτερη χαρά των φανατικών overclockers: να παίζω με την πιθανότητα να μου κάτσει το λότο με καλό τσιπάκι.

  • Like 2
Link to comment
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
×
×
  • Δημιουργία...

Important Information

Ο ιστότοπος theLab.gr χρησιμοποιεί cookies για να διασφαλίσει την καλύτερη εμπειρία σας κατά την περιήγηση. Μπορείτε να προσαρμόσετε τις ρυθμίσεις των cookies σας , διαφορετικά θα υποθέσουμε ότι είστε εντάξει για να συνεχίσετε.