eloydark Δημοσιεύτηκε Οκτώβριος 15, 2010 #1 Κοινοποίηση Δημοσιεύτηκε Οκτώβριος 15, 2010 Καλημέρα συνφορουμίτες,Το παρόν νήμα δεν αφορά χρήση PC και windows συνεπώς αν περιμένετε να διαβάσετε κάτι τέτοιο αλλάξτε καρτέλα για να μην με βρίζετε αργότερα!Στην αγορά κυκλοφορούν αυτή την στιγμή πολλές διαφορετικές προσεγγίσεις για έξτρα υπολογιστικούς πόρους. Ας θεωρήσουμε ότι θέλουμε να κατασκευάσουμε μια μονάδα που να κάνει τεχνητή στερεοσκοπική όραση, αντίστροφο κινηματικό αλυσίδας πολλών βαθμών ελευθερίας, τρισδιάστατα b-surfaces και μετασχηματισμούς με quaternions και πολλά άλλα ωραία σε πραγματικό χρόνο, και εννοείται ότι οι αλγόριθμοι/προγραμματισμός θα γίνει από εμάς συνεπώς δεν είναι απαραίτητο κάποιο end-user friendly environment (πχ αναγκαστικά CUDA για λόγους ευκολίας και συμβατότητας). Ας αναφέρω μερικά παραδείγματα για να καταλάβετε τι ακριβώς ψάχνω:Μία λύση είναι το κλασσικό CUDA σε μία δυνατή nVidia VGA, που έχει σαφές προβάδισμα στους μετασχηματισμούς με quaternions λόγω αρχιτεκτονικής αλλά δεν ξέρω πως τα πάει σε άλλου είδους προβλήματα (πχ, singular value decomposition, stereo vision κλπ)Άλλη λύση είναι ένα GigaAccel180 με τους Cell της ΙΒΜ πάνωΆλλη λύση είναι η χρήση FPGA ξεχωριστά για κάθε πρόβλημα, optimised για το κάθε task. Η λύση αυτή έχει μεγάλο προτέρημα την ενεργειακή απόδοση (που αποτελεί κρίτηριο για την χρήση που επιθυμώ)Κλπ.Τι θα προτιμούσατε και για ποιούς λόγους; Εννοείται ότι υπάρχουν και άλλοι τρόποι, τους οποίους θα ήθελα να ακούσω μαζί με επιχειρήματα για την χρήση τους βέβαια!Ξέρω ότι είναι αρκετά θεωρητικό το ερώτημα και απαιτεί γνώσεις για να απαντηθεί, για αυτό παρακαλώ να μην γίνει σούπα με άσχετα ποστ του στυλ "Βάλε έναν i7 που τα κάνει όλα"! Link to comment Share on other sites More sharing options...
DarkSaga Οκτώβριος 15, 2010 #2 Κοινοποίηση Οκτώβριος 15, 2010 ο τίτλος δεν σε βοηθάει για να το δουν οι "γνώστες". τον βρίσκω άστοχο δεν περιγράφει τις ανάγκες σου σε ένα κλασικό cpu είναι αδύνατο να τρέξουν οι εφαρμογές σου?αν δεν έχεις τους αλγόριθμους πως ξέρει τι αξίζει να αγοράσεις?εννοώ πολυπλοκότητα πάνω κάτω ξέρεις? ή αλλιώς τι επεξεργαστική ισχύ απαιτείται?αναφέρεις CUDA και συμβατότητα στην ίδια πρόταση.μήπως είναι λίγο νωρίς για κάτι τέτοιο? Link to comment Share on other sites More sharing options...
eloydark Οκτώβριος 15, 2010 Author #3 Κοινοποίηση Οκτώβριος 15, 2010 ο τίτλος δεν σε βοηθάει για να το δουν οι "γνώστες". τον βρίσκω άστοχο δεν περιγράφει τις ανάγκες σου σε ένα κλασικό cpu είναι αδύνατο να τρέξουν οι εφαρμογές σου?αν δεν έχεις τους αλγόριθμους πως ξέρει τι αξίζει να αγοράσεις?εννοώ πολυπλοκότητα πάνω κάτω ξέρεις? ή αλλιώς τι επεξεργαστική ισχύ απαιτείται?αναφέρεις CUDA και συμβατότητα στην ίδια πρόταση.μήπως είναι λίγο νωρίς για κάτι τέτοιο?Ωραία, άλλαξα τον τίτλο στον σωστό όρο που χρησιμοποιείται διεθνώς για να το δουν όλοι.Στον κλασσικό cpu θέλω να τρέχω άλλα πράγματα, θέλω να εκμεταλευτώ τις καλύτερες επιδόσεις που υπόσχεται η εξειδίκευση (π.χ. τα FPGAs τρέχουν pattern recognition 100 φορές πιο γρήγορα από generic επεξεργαστές με πολύ χαμηλότερη ενεργειακή κατανάλωση, και πολύ χαμηλότερο κόστος κλπ). Οι αλγόριθμοι υπάρχουν έτσι και αλλιώς, δεν φτιαχνουμε τον τροχό. Και το υπολογιστικό κόστος είναι και αυτό σε γενικές γραμμές γνωστό. Όχι σε flops, αλλά ξέρω ότι δεν γίνεται real time dextrous trajectory planning γιατί οι controllers δεν προλαβαίνουν να κάνουν ταυτόχρονα αντίστροφα κινηματικά, sensor fusion κλπΔεν βάζω απαιτήσεις σε πλευρά specifications για τον πολύ απλό λόγο ότι το τελικό implemantation θα είναι συνάρτηση της επεξεργαστικής ισχύς που βρίσκεται διαθέσιμη. Αν πχ, έχω πάνω αρκετή ισχύ θα κάνω και όραση, και fusion πολλών αισθητήρων, και πολλούς βαθμούς ελευθερίας, και μη ολονομικούς περιορισμούς κλπ. Αν δεν αντέχει θα ρίξω τις απαιτήσεις των αλγορίθμων βάζοντας λιγότερες παραμέτρους κλπ.Το τελικό σύστημα είναι ακόμα στην φάση του σχεδιασμού και έχει σκόπο να είναι αυτόνομο, δεν με ενδιαφέρει συνεπώς άμεσα η συμβατότητα αφού μπορεί να αποτελέσει απλά το κέντρο γύρω από το οποιο τα υπόλοιπα στοιχεία θα σχεδιαστούν.Η φάση τώρα είναι ακόμα σε στάδιο προκαταρκτικής αξιολόγησης. Προφανώς απάντηση του στυλ πάρε ένα super computer δεν αποτελεί λύση, ζητάμε κάτι ανθρώπινο, που να δικαιολογείται με κανονικά κριτήρια, όχι με κριτήρια της NASA... Link to comment Share on other sites More sharing options...
eloydark Οκτώβριος 18, 2010 Author #4 Κοινοποίηση Οκτώβριος 18, 2010 Κανένας δεν έχει ασχοληθεί με το ζήτημα; Μάλλον είναι υπερβολικά εξεζητημένο αυτό που ρωτάω Link to comment Share on other sites More sharing options...
eloydark Οκτώβριος 18, 2010 Author #5 Κοινοποίηση Οκτώβριος 18, 2010 Κανένας δεν έχει ασχοληθεί με το ζήτημα; Μάλλον είναι υπερβολικά εξεζητημένο αυτό που ρωτάω Ας βοηθήσω λίγο την ροή της συζήτησης μπας και αναπτυχθεί λίγο περισσότερο... Ένας τυπικός επεξεργαστής γενικής χρήσης, πχ ο i7 980XE είναι στα 107GFlops σε double precision μεταβλητές Η nVidia Tesla C1060 είναι πολύ πιο πάνω σε single precision στα 933GFlops αλλά σε double precision πέφτει στα 78GFlops Οι κάρτες της AMD 5970 (μέσω OpenCL) είναι στα 4,64TFlops σε SP και 928GFlops σε DP Η κάρτα PCIe βασισμένη στους Cell GigaAccel 180 είναι στα 180GFlops σε SP και 90GFlops σε DP γνωρίζετε παρόμοιες λύσεις που χρησιμοποιούνται για HPC ή διαφορετικές αρχιτεκτονικές (όχι RISC) όπως τα FPGAs, ASIC κλπ; Link to comment Share on other sites More sharing options...
z3et Οκτώβριος 18, 2010 #6 Κοινοποίηση Οκτώβριος 18, 2010 Αν ψαχνεις καθαρα κατι που να βγαζει πολλα FLOPs θα προτεινα Tesla C2XXX (Fermi) οι οποιες υποστηριζουν Parallel Kernel Support, ECC Support, Unified 64-bit Memory Addressing, New ISA Changes με C++ κλπ.Δεν θα προτεινα τις "mainstream" GTX470/480 μιας και στο DP FP 64bit τρεχει στο 1/8 του 32bit (αντι στο 1/2 στις Tesla). Οι Tesla "τρεχουν" με 512GFLOPs (DP) και ~1,2TFLOPs σε SP.Αν και οι HD 58/9ΧΧ βγαζουν περισσοτερα, τις θεωρω λιγοτερο.... ασφαλη? Link to comment Share on other sites More sharing options...
Recommended Posts
Archived
This topic is now archived and is closed to further replies.