Προς το περιεχόμενο

Πρόταση για αγορά workstation


DarkOrion

Προτεινόμενες αναρτήσεις

Ενδιαφέρομαι να αγοράσω καινούριο μηχανήμα, το οποίο θα χρησιμοποιώ αποκλειστικά και πολύ βαριές εφαρμογές (όχι εμπορικές). Θα τρέχουν κώδικες fortran σε open-mpi με πολλούς πυρήνες. Μάλιστα, υπάρχει σενάριο για ενσωμάτωση του καινούριου μηχανήματος σε cluster. Ενδιαφέρομαι να δώσω μέχρι £1800-2000 (λίρες αγγλίας μιας και θα αγοραστεί από έξω). Έχω την εξής πρόταση:

 

HP Z620 Workstation

HP Linux Installer Kit OS

Intel Xeon E5-2620 2.00Ghz 15MB 1333 6C 1st CPU

Intel Xeon E5-2620 2.00Ghz 15MB 1333 6C 2nd CPU

32GB DDR3-1600 (8x4GB) 2CPU Reg RAM

NVIDIA NVS 300 512MB Graphics

1TB 10K RPM SATA SFF 1st Hard Drive

3TB 7200 RPM SATA 2nd Hard Drive

LSI 9212-4i 4-Port SAS 6Gb/s RAID Card

HP USB Standard Keyboard

HP USB Optical Scroll Mouse

16X SuperMulti DVDRW SATA 1st ODD

HP 22-In-1 Media Card Reader

Broadcom 5761 Gigabit PCIe NIC

HP COMPAQ LE2202x 21.5-In LED Monitor

 

Το συνολικό κόστος είναι £2074. Το να πάω ένα βήμα πιο πάνω σε 2x επεξεργαστές, (δηλαδή Intel Xeon E5-2630 2.30Ghz 15MB 1333 6C 1st CPU) ανεβάζει το κόστος στις £2435 με όλα τα άλλα ίδια. Το ερώτημα είναι: μήπως να αφήσω τους 2 επεξεργαστές και να στραφώ σε μόνο έναν επεξεργαστή πολύ πιο ακριβό?

 

Πώς σας φαίνεται η παραπάνω σύνθεση? Τονίζω: Δεν ενδιαφέρομαι για παιχνίδια, δεν ενδιαφέρομαι για video rendering και παρόμοια, δεν ενδιαφέρομαι για τίποτα άλλο παρά μόνο cpu intensive tasks. Ενδεικτικά σας αναφέρω ότι τα προγράμματα που τρέχω απαιτούν περίπου 2-3 μήνες στο σχετικά παλιό 3-node cluster που έχω σπίτι μου και περίπου 1 βδομάδα σε ένα dedicated cluster από 72 cores. Το μόνο που ίσως θα ενδιέφερε είναι αν στο μέλλον υπάρξει δυνατότητα για αξιοποίηση των πυρήνων της κάρτας γραφικών μαζί με τα cpu's, πείτε μου αν αυτή είναι οκ και θα έχει κανα αποτέλεσμα ή είναι εντελώς μάπα οπότε αξίζει να δώσω κάτι παραπάνω.

 

Το μηχάνημα δεν το πληρώνω εγώ, το πληρώνει ερευνητικό κέντρο, γι αυτό και το όριο είναι τόσο ψηλά και επίσης για αυτό και τονίζω την χρήση του μηχανήματος.

 

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δεν έχω τεχνική άποψη αλλά αν όντως χρειάζεσαι πολλούς πυρήνες τότε με 2 cpu κάνεις καλύτερη δουλειά από ότι με έναν έστω και καλύτερο.

Σοφά πας σε έτοιμη λύση απο εταιρία και όχι σε κομμάτια για το χώρο που προορίζεται.

Από εκεί και πέρα δε μπορώ να κρίνω περαιτέρω :)

  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δεν υπάρχει αυτή η επιλογή για opteron. Υπάρχει εμπορική συμφωνία με την ΗΡ και αυτή προμηθεύει με μηχανήματα. Έχς κάποιες περιορισμένες επιλογές από αυτή την άποψη, αν και πιστεύω ότι αυτός είναι και ο λόγος που υπάρχει η σχετική μείωση στην τιμή, διότι διαφορετικά αυτό το μηχάνημα θα έκανε παραπάνω από 2100 λίρες.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Εδώ ξέρεις ποια είναι η απάντηση που θα σου δώσει κάποιος: "Εξαρτάτε την εφαρμογή!" Αλλά πρακτικά εξαρτάτε και από τον compiler που χρησιμοποιέις και γενικότερα το πως γίνετε η μεταφορά του κώδικά σου. Εγώ προσωπικά θα άφηνα τους 2 επεξεργαστές. Άμα το πρόβλημα σου είναι απόλυτα παραληλλοποιήσιμο και δεν έχεις dependencies μεταξύ των δεδομένων τότε καλό θα έιναι να το γυρίσεις σε OpenCL/CUDA και να δείς τι μπορείς να κάνεις με την κάρτα σου(αλλά και πάλι εξαρτάτε την εφαρμογή :-( ) . Από την άλλη τα 512ΜΒ memory είναι λίγα πλεον  και το bandwidth της συγκεκριμένης είναι "σχετικά" μικρό http://www.nvidia.com/object/IO_14605.html. και την βάζεις να συναγωνιστεί 2 Xeon όχι κάτι παρακατιανό....

 

 

 

ΥΓ. Πειράματα Φυσικής είναι; Μόνο αυτοί απαρνούνται να προχωρήσουν σε C/C++ !Κρίνοντας και απο την υπογραφή σου! :-D

Πάντως μόνο ένα εργαστήριο υψηλών ενεργειών ήξερα που ήθελε τόση δύναμη αλλά αυτόι είχαν δικό τους cluster και πρακτικά δίδασκαν το τμήμα C!

 

 

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δεν είναι ακριβώς φυσική, πάρε ένα λινκ για να δεις μια ιδέα του τι κάνουμε: 

Ας το ξεχάσουμε το gpu, ο κώδικας δουλεύεται από 50-60 άτομα και έχει ξεκινήσει να γράφεται εδώ και περίπου 3 δεκαετίες. Μερικά κομμάτια του είναι σε f77 για να σου δώσω να καταλάβεις. Δεν πρόκεται να μπουν στην λογική να το κάνουν να τρέχει σε κάρτα γραφικών για τον πολύ απλό λόγο ότι έχουν πρόσβαση σε δυνατά cluster οπότε έχουν πολύ υπολογιστική ισχύ εκεί χωρίς όμως κάρτες γραφικών.

 

Τα 72 cores που έτρεχα είναι αυτά που μου είχαν κάνει allocate. To supercomputer έχει τρελή υπολογιστική ισχύ. Το 'απλό' έχει 960 cores, τα πιο εξελιγμένα (που εγώ δεν έχω πρόσβαση) είναι αρκετά πιο πολύπλοκα. Συνολικά, όλα τα clusters μαζί έχουν 14,000 cores.

 

Αυτά ήταν για να λύσω τις απορίες. Το ερώτημα βασικά πλέον είναι: 1 επεξεργαστής καλύτερος ή 2 επεξεργαστές λίγο πιο αργοί? Γιατί 2GHz είναι σχετικά λίγα για σημερινά δεδομένα, αλλα μιλάμε για 12 πλέον πυρήνες....

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Γενικά εγώ θα προτιμούσα τα πιο πολλά cores/threads και σίγουρα όσο το δυνατόν περισσότερα GHz (με αυτή την σειρά όμως cores και μετά GHz).

 

Όταν λες σε πιο ακριβό μοντέλο ποιόν εννοείς;

 

Η συχνότητα τώρα στους Xeon μετράει αλλιώς με την άποψη ότι μπορεί να εκτελούν περισσότερες εντολές σε ένα κύκλο ρολογιού. Επίσης έχουν SSE τεχνολογίες που κάνουν παράλληλα τις πράξεις και εκεί κολλάει η C (γιατί κάνει τον κώδικα πολύ πιο εύκολα διαχειρίσιμο προς τον compiler) και προφανώς η ποιότητα του compiler που χρησιμοποιείς. Ναι με αυτή την λογική η κάρτα σου είναι αχρείαστη ίσως άμα μπορούσες να την μειώσεις και να βάλεις τους καλύτερους CPU και περισσότερη RAM (αυτό εξαρτάτε από τα δεδομένα που χειρίζεσαι).

 

Όπως καταλαβαίνεις δεν είναι εύκολη επιλογή η βέλτιστη επιλογή CPU σε τέτοιο επίπεδο. Η παραλληλία είναι πολύ καλή αλλά άμα τα δεδομένα σου είναι αλληλοεξαρτώμενα μεταξύ  τους (π.χ. matrix-matrix multiplication) πάει χαμένη και μετά θέλεις άλλα optimizations.

Ψάξε μήπως βρεις benchmarks μεταξύ των 2 μοντέλων αν και πάλι τα δεδομένα μπορεί να μην ισχύουν απόλυτα στην δικιά σου περίπτωση αν και πιστεύω ότι η διαφορά θα είναι μικρή.

 

btw nice job!

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

υπαρχει περιπτοση για λιγο κλοκαρισμα πχ. 2.30 GHz ?

 

Δεν είναι το pc του σπιτιου σου. Μιλαμε για workstation οπου δεν νοηται κλοκαρισμα για πολλούς και διάφορους λόγους! 

  • Like 3
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Κλοκάρισμα ούτε για αστείο.. Μιλάμε για μηχάνημα που θα τρέχει συνεχόμενα για μήνες, σε χώρο που δεν θα βρίσκομαι εγώ. Ούτε θέλω να κρασάρει συνέχεια, ούτε να υπερθερμάινεται. Είναι με εγγύηση και δεν έχω όρεξη να πληρώνω 2κ+ αν το χαλάσω.

 

Σχετικά με το λίγο πιο ακριβό μοντέλο που ρωτούσες, το είχα αναφέρει πιο πάνω:

Το συνολικό κόστος είναι £2074. Το να πάω ένα βήμα πιο πάνω σε 2x επεξεργαστές, (δηλαδή 

Intel Xeon E5-2630 2.30Ghz 15MB 1333 6C 1st CPU) ανεβάζει το κόστος στις £2435 με όλα τα άλλα ίδια.

 

Υπάρχει και η λύση του 8-πύρηνου (1 cpu βέβαια) Intel Xeon E5-2665 2.40Ghz 20MB 1600 8C 1st CPU.

 

Σχετικά με την παραλληλία, είναι σχεδόν (αν μπορεί να το πει κάποιος αυτό φυσικά) στον  μέγιστο βαθμό παραλληλοποίησης. Ουσιαστιά παίρνεις τον συνολικό χώρο που βλεπεις στην φλόγα και τον χωρίζεις σε κομμάτια, ίσα με τον αριθμό των cores. Σε κάθε ένα, λύνεις τις εξισώσεις. Δεν σε νοιάζει τι γίνεται στα διπλανά του, παρά μόνο τις οριακές συνθήκες εκεί που γίνονται οι ραφές που τα παίρνεις τα δεδομένα από το προηγούμενο χρονικό βήμα. Προφανώς, όπως καταλαβαίνεις, εκεί που είναι η φλόγα γίνεται κόλαση στις εξισώσεις ενώ στα πλάγια που δεν υπάρχει φλόγα είναι πιο χαλαρά τα πράγματα (για να σου δώσω να καταλάβεις αυτά γίνονται με επαναλήψεις σύγκλισης, οπότε εκεί που είναι η φλόγα μπορεί να θέλει 1000 φορές παραπάνω επαναλήξεις από εκεί που δεν είναι). Βέβαια, αυτή είναι η φύση του προβλήματος, δεν υπάρχει κάτι να κάνεις να το ξεπεράσεις. Και τα 14000 cores  να μου δώσουν, πάντα κάποια (τα ακριανά) θα τελειώνουν λίγο πιο γρήγορα από τα κεντρικά και θα τα περιμένουν.

 

Ενδεικτικά αναφέρω το πιο ακριβό μηχάνημα που είναι διαθέσιμο (το οποίο βέβαια είναι πολύ ακριβό [£15,800] για να μου το αγοράσουν):

 

Intel Xeon E5-2690 2.90Ghz 20MB 1600 8C 1st CPU (x2)

512GB DDR3-1333 (16x32GB) 2CPU LR RAM

NVIDIA Quadro 6000 6GB Graphics

256GB SATA 1st Solid State Drive

3TB 7200 RPM SATA 2nd Hard Drive (x2)

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Σχετικά με την παραλληλία, είναι σχεδόν (αν μπορεί να το πει κάποιος αυτό φυσικά) στον  μέγιστο βαθμό παραλληλοποίησης. Ουσιαστιά παίρνεις τον συνολικό χώρο που βλεπεις στην φλόγα και τον χωρίζεις σε κομμάτια, ίσα με τον αριθμό των cores. Σε κάθε ένα, λύνεις τις εξισώσεις. Δεν σε νοιάζει τι γίνεται στα διπλανά του, παρά μόνο τις οριακές συνθήκες εκεί που γίνονται οι ραφές που τα παίρνεις τα δεδομένα από το προηγούμενο χρονικό βήμα. 

 

Δεδομένου αυτού τότε εγώ άμα ήμουν στην θέση σου θα έπαιρνα τους δυο επεξεργαστές (12 cores 24 threads 30 MB cache στο περίπου... δεν μετράνε αθροιστικά και ελπίζοντας να μην υπάρχει bottleneck στα cache misses), θα προσπαθούσα βέβαια να πάω στους E5-2630 και περισσότερη μνήμη γιατί Max Memory Bandwidth 42.6 GB/s για το 2620 ενώ στους δίκσους είναι  6 GB/s.

 

Έχεις την δυνατότητα να βάλεις τώρα τον 8-πύρινο και αργότερα άλλον ένα;

 

Απορώ όμως πως και δεν χρησιμοποιεται κάρτες γραφικών μίας και θα έδιναν μέχρι ~40 % (βάση nvidia για cuda) boost στο πρόβλημα με μικρό ενεργειακό και χρηματικό κόστος.

 

Ρώτα και πουθενά αλλού γιατί η ερώτηση σου είναι κάπως εξειδηκευμένη. Κανέναν supervisor σου.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Ναι, τον supervisor θα τον ρωτήσω γιατί αυτός έχει την γενική εποτεία του κώδικα και ξέρει τι ακριβώς παίζει. Για ένα επεξεργαστή τώρα και έναν στο μέλλον δεν το πολυβλέπω, είναι λίγο διαδικαστικό και δεν θέλουν να μου δώσουν τέτοια λεφτά σε βάθος χρόνου, εξάλλου υπάρχει και το τέρας.

Τώρα για τις κάρτες γραφικών, αυτοί που κάνουν develop τον κώδικα το σκέφτονται και μάλλον κάτι έχουν στα σκαριά, ίσως είναι και σε φάση testing. Όπως καταλαβαίνεις, μιλάμε για πολύπλοκο κώδικα που πολύ λίγα άτομα πειράζουν και δεν είναι εμπορικός. Σκέψου ότι εγώ για ένα κομμάτι της έρευνας δουλεύω 6 μήνες κάνοντας πολύ μικρές τροποιποιήσεις, τις οποίες τρέχω στο μηχάνημα μου και βγάζω αποτελέσματα αλλά δεν έχει ενσωματωθεί ακόμα. Πρέπει να τεσταριστεί από αυτούς και αυτοί είναι που θα τον γράψουν ξανά από την αρχή και θα τον βάλουν ως module για να μπορεί να γενικευτεί σε όλες τις περιπτώσεις που τρέχει.

 

Μάλλον θα πάω στην λύση των 2 επεξεργαστών, σε ευχαριστώ πολύ για την βοήθειά σου και πολύ γαμάτη υπογραφή!!!

  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα
  • Δημιουργία νέου...