Προς το περιεχόμενο

Intel HEDT, LGA 2066,X299, Cascade lake-X


Coppermine

Προτεινόμενες αναρτήσεις

Δημοσ. (επεξεργασμένο)

Θα καεί το πελεκούδι που λέμε... 😂

Intel Readies Core i9-10990XE With 22 Cores & 44 Threads – 380W TDP Design & Up To 5 GHz All-Core Boost

But do keep this in mind that the 380W figure is just for the base frequency and this chip could actually consume over 1000 Watts of power from the socket considering the Core i9-9990XE consumed around 600-700 Watts of power when pushing all of its cores to 5.0 GHz and that was a 14 core part.

https://wccftech.com/intel-core-i9-10990xe-22-core-380w-5-ghz-all-core-cpu-rumor/

https://www.anandtech.com/show/14980/the-intel-core-i9-9990xe-review/8

 

Επεξ/σία από ROG-X
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

  • Απαντ. 88
  • Δημ.
  • Τελ. απάντηση

Συχνή συμμετοχή στο θέμα

Συχνή συμμετοχή στο θέμα

Δημοσιευμένες Εικόνες

1 ώρα πριν, ROG-X είπε

Θα καεί το πελεκούδι που λέμε... 😂

Intel Readies Core i9-10990XE With 22 Cores & 44 Threads – 380W TDP Design & Up To 5 GHz All-Core Boost

But do keep this in mind that the 380W figure is just for the base frequency and this chip could actually consume over 1000 Watts of power from the socket considering the Core i9-9990XE consumed around 600-700 Watts of power when pushing all of its cores to 5.0 GHz and that was a 14 core part.

https://wccftech.com/intel-core-i9-10990xe-22-core-380w-5-ghz-all-core-cpu-rumor/

https://www.anandtech.com/show/14980/the-intel-core-i9-9990xe-review/8

Πήρε το μάτι μου στο guru3d μια ωραία ανάλυση για το συγκεκριμένο (μαζί με screen που κυκλοφόρησε), πως είναι fake.

Από ότι κατάλαβα, απλά δεν γίνεται να μπουν 22 πυρήνες στη συγκεκριμένη αρχιτεκτονική (ανεξάρτητα από όλα τα άλλα).

Αναφορά σε κείμενο

Completely fake.

The structure of the chip that fits in LGA2066 is 24 blocks, in a 6x4 mesh, from which 6 are I/O nodes and the rest are cores.
It's impossible to have more than 18 cores on HCC structure.

The XCC has 6x6 mesh (36), which is why that one tops at 28 cores (+8 I/O nodes) and impossible to have more with their current designs.
The XCC silicon however is much bigger and requires LGA-3647, which is a 6-channel memory socket.

https://en.wikichip.org/wiki/intel/microarchitectures/skylake_(server)
Read here and stop believing in made up "leaks".

In order to have more cores on any of these sockets, Intel needs a complete redesign of the CPU, which at this point it doesn't yet exist (maybe only on their design papers or in the lab)

---
p.s. Extremely poor photoshop job, you can literally see the cut and edit areas if you zoom up the pictures.

 

  • Like 2
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

  • 1 μήνα μετά...
51 λεπτά πριν, holy grail είπε

intel technology... και οχι κουφιοι πυρηνες.  :lol:

https://wccftech.com/intel-ai-breakthrough-destroys-8-nvidia-v100-gpu/

Αυτό το paper είχε βγει πέρυσι, τώρα έκαναν ένα update. Μιλάμε για άλλο αλγόριθμο, δεν έχει να κάνει με CPU vs GPU. Μιλάμε για άλλη αντιμετώπιση στο τρόπο "εκπαίδευσης" ενός νευρωνικού δικτύου. Το αν είναι εφάμιλλος αυτός ο τρόπος θα φανεί από το κατά πόσο θα τον χρησιμοποιήσει η κοινότητα του deep learning. Το tensoflow παραμένει η επιλογή όλης της κοινότητας, μέχρι το SLIDE να αποδείξει ότι αυτό που λέει ισχύει γενικά σε όλες τις περιπτώσεις και ότι η εκπαίδευση είναι εφάμιλλη.

Επίσης η Quadro RTX 8000 είναι 30-40% πιο γρήγορη από V100 σε Tensoflow FP16 και 10-15% πιο γρήγορη σε FP32 από την V100.  Tesla RTX δεν υπάρχει ακόμα, οπότε στα datacenter χρησιμοποιούν V100 (υπάρχουν servers που παίρνουν μέχρι και 16 V100 SXM2 modules και μέσω nvlink λειτουργούν σαν μία GPU). Καταλαβαίνεις πως η Intel δε μπορεί να προσφέρει τίποτα παραπλήσιο, ακόμα κι αν ο SLIDE όντως κάνει αυτό που λέει. Επίσης, αν διαβάσεις το paper θα δεις ότι ο SLIDE είναι AVX2 optimized και όχι AVX512, άρα μια χαρά μπορεί να τρέξει και σε AMD EPYC όπου λογικά θα αποδίδει ακόμα καλύτερα per Watt.

 

  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημοσ. (επεξεργασμένο)
25 minutes ago, Coppermine said:

01.png

Πολύ προπαγάνδα το CPU Z... Το 9235 είναι πολύ μικρότερο το benchmark bar από το 9591. Και από το top bench 9748..  πολύ μικρότερη η διαφορά.. xD 😂😂😂😂

 

Επεξ/σία από renaxan
  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

22 ώρες πριν, malakudi είπε

Αυτό το paper είχε βγει πέρυσι, τώρα έκαναν ένα update. Μιλάμε για άλλο αλγόριθμο, δεν έχει να κάνει με CPU vs GPU. Μιλάμε για άλλη αντιμετώπιση στο τρόπο "εκπαίδευσης" ενός νευρωνικού δικτύου. Το αν είναι εφάμιλλος αυτός ο τρόπος θα φανεί από το κατά πόσο θα τον χρησιμοποιήσει η κοινότητα του deep learning. Το tensoflow παραμένει η επιλογή όλης της κοινότητας, μέχρι το SLIDE να αποδείξει ότι αυτό που λέει ισχύει γενικά σε όλες τις περιπτώσεις και ότι η εκπαίδευση είναι εφάμιλλη.

Επίσης η Quadro RTX 8000 είναι 30-40% πιο γρήγορη από V100 σε Tensoflow FP16 και 10-15% πιο γρήγορη σε FP32 από την V100.  Tesla RTX δεν υπάρχει ακόμα, οπότε στα datacenter χρησιμοποιούν V100 (υπάρχουν servers που παίρνουν μέχρι και 16 V100 SXM2 modules και μέσω nvlink λειτουργούν σαν μία GPU). Καταλαβαίνεις πως η Intel δε μπορεί να προσφέρει τίποτα παραπλήσιο, ακόμα κι αν ο SLIDE όντως κάνει αυτό που λέει. Επίσης, αν διαβάσεις το paper θα δεις ότι ο SLIDE είναι AVX2 optimized και όχι AVX512, άρα μια χαρά μπορεί να τρέξει και σε AMD EPYC όπου λογικά θα αποδίδει ακόμα καλύτερα per Watt.

ιδιαιτερα εντυπωσιακο αποτελεσμα αν αναλογιστουμε μαλιστα οτι το πετυχε ενας ταπεινοις broadwell xeon e5 στα 2,4, που δεν υποστηριζει avx512. :P  η τεσλα χανει σε ολα τα σημεια και μαλιστα αν που με οτι στηνουν 8 οπως λεει και η ερευνα - που ειναι πανεπιστημιακη και οχι απο γιωταδες που βιδωνουν/ξεβιδωνουν καρτες - το κοστος και η καταναλωση ειναι στα μειον με το καλημερα. σαφως και εχει να κανει με cpu vs gpu καθως η λογικη τους ειναι διαφορετικη.  αλλα αφου δε το εχεις διαβασει τι λεω.....:lol: οι ερευνες του μουσια ειναι πιο εντυπωσιακες......, σε μπαρες δημητριακων. :lol:

οι quadro πιθανον να ειναι και παντελως αχρηστες αφου χανουν με το καλημερα σε bandwidth οποτε τι να το κανεις το fp 32 που ετσι κι αλλιως δε χρησιμοποιουν αυτη την ακριβεια οι τενσορ αλλα δουλεουν σε πολυ xαμηλοτερη με integer 8/4.

τελος οι epyc δε θα μπορεσουν να πετυχουν καλυτερο αποτελεσμα αφου χανουν σε συνεκτικοτητα και πληρωνουν μεγαλη καθυστερηση λογω τον λεγκο οι κρυφες μνημες τους. :P

  • Confused 2
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

2 ώρες πριν, holy grail είπε

ιδιαιτερα εντυπωσιακο αποτελεσμα αν αναλογιστουμε μαλιστα οτι το πετυχε ενας ταπεινοις broadwell xeon e5 στα 2,4, που δεν υποστηριζει avx512. :P  η τεσλα χανει σε ολα τα σημεια και μαλιστα αν που με οτι στηνουν 8 οπως λεει και η ερευνα - που ειναι πανεπιστημιακη και οχι απο γιωταδες που βιδωνουν/ξεβιδωνουν καρτες - το κοστος και η καταναλωση ειναι στα μειον με το καλημερα. σαφως και εχει να κανει με cpu vs gpu καθως η λογικη τους ειναι διαφορετικη.  αλλα αφου δε το εχεις διαβασει τι λεω.....:lol: οι ερευνες του μουσια ειναι πιο εντυπωσιακες......, σε μπαρες δημητριακων. :lol:

οι quadro πιθανον να ειναι και παντελως αχρηστες αφου χανουν με το καλημερα σε bandwidth οποτε τι να το κανεις το fp 32 που ετσι κι αλλιως δε χρησιμοποιουν αυτη την ακριβεια οι τενσορ αλλα δουλεουν σε πολυ xαμηλοτερη με integer 8/4.

τελος οι epyc δε θα μπορεσουν να πετυχουν καλυτερο αποτελεσμα αφου χανουν σε συνεκτικοτητα και πληρωνουν μεγαλη καθυστερηση λογω τον λεγκο οι κρυφες μνημες τους. :P

Είσαι τελείως άσχετος, η ασχετοσύνη σου φαίνεται από το "integer 8/4" που γράφεις. Το tensoflow δουλεύει είτε FP32 είτε FP16. FP16 συνήθως είναι αρκετό, κάποια μοντέλα όμως θέλουν FP32. Σε int8 γίνεται μόνο post training quantization. Σε int4 δε γίνεται απολύτως τίποτα.

Πάρε μερικά benchmarks για tensoflow

https://blog.exxactcorp.com/nvidia-quadro-rtx-8000-deep-learning-performance-benchmarks-for-tensorflow-2019/

https://blog.exxactcorp.com/hgx2-benchmarks-for-deep-learning-in-tensorflow-16x-v100-exxact-tensorex-server/

Το latency των "lego" είναι σαφώς μικρότερο από το latency που έχουν 2 socket!!!

Ο SLIDE χρησιμοποιεί SSE και AVX1/2 όχι γιατί δεν είχε το πανεπιστήμιο να αγοράσει νέα Xeon αλλά γιατί δε θα κέρδιζε κάτι από AVX512. Πρέπει να καταλάβεις πως τα workflows που κερδίζουν από AVX512 θα κέρδιζαν ακόμα περισσότερο σε GPU. Και ο συγκεκριμένος αλγόριθμος δεν είναι σχεδιασμένος για GPU.

Κατάλαβε πως ο SLIDE είναι μία νέα ιδέα στην επιστημονική κοινότητα για το training των deep learning neural networks (DLNN). Υπάρχει από πέρυσι και όχι τώρα που το είδες εσύ στο wccftech. Πρέπει να αποδείξει την αξία της στην επιστημονική κοινότητα και να τύχει ευρείας χρήσης. Αυτό ως τώρα δεν συμβαίνει. Το defacto algo για training DLNN είναι το tensoflow και θα παραμείνει για καιρό.

Τέλος, αν διάβαζες το paper θα έβλεπες ότι η σύγκριση είναι με μία V100 και όχι με 8. Κάτι που το κατάλαβε εκ των υστέρων και το wccftech και έκανε update την ιστορία του. Αλλά εσύ πάλι γράφεις για 8. Όχι ότι έχει σημασία γιατί όπως προείπα εδώ δεν έχει να κάνει με CPU vs GPU - ο αλγόριθμος SLIDE πετυχαίνει 10Χ απόδοση από τον tensoflow και σε CPU. Έχει να κάνει με τον αλγόριθμο.

  • Like 5
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

5 hours ago, narta said:

@malakudi γιατί ασχολείσαι;

Έχεις ένα δίκιο αλλά αν μένουν αναπάντητα τέτοια post, κάποιοι θα τα διαβάσουν και θα τα πιστέψουν. Όπως είδες προσπαθώ να απαντώ τεχνικά και επιστημονικά στις τρολιές.

 

  • Like 6
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

3 λεπτά πριν, malakudi είπε

Έχεις ένα δίκιο αλλά αν μένουν αναπάντητα τέτοια post, κάποιοι θα τα διαβάσουν και θα τα πιστέψουν. Όπως είδες προσπαθώ να απαντώ τεχνικά και επιστημονικά στις τρολιές.

Αν καποιος πιστεψει οτι διαβασει, αξιζει οτι του επιφυλασει το μελλον του

  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

  • 4 μήνες μετά...
Δημοσ. (επεξεργασμένο)

Linus (αυτός του Linux, όχι ο άλλος) Torvalds, εναντίον του AVX512

"Εύχομαι το AVX512 να βρει έναν επώδυνο θάνατο (I Hope AVX512 Dies A Painful Death)"

Αναφορά σε κείμενο

I hope AVX512 dies a painful death, and that Intel starts fixing real problems instead of trying to create magic instructions to then create benchmarks that they can look good on.

I hope Intel gets back to basics: gets their process working again, and concentrate more on regular code that isn't HPC or some other pointless special case.

I've said this before, and I'll say it again: in the heyday of x86, when Intel was laughing all the way to the bank and killing all their competition, absolutely everybody else did better than Intel on FP loads. Intel's FP performance sucked (relatively speaking), and it matter not one iota.

Because absolutely nobody cares outside of benchmarks.

The same is largely true of AVX512 now - and in the future. Yes, you can find things that care. No, those things don't sell machines in the big picture.

And AVX512 has real downsides. I'd much rather see that transistor budget used on other things that are much more relevant. Even if it's still FP math (in the GPU, rather than AVX512). Or just give me more cores (with good single-thread performance, but without the garbage like AVX512) like AMD did.

I want my power limits to be reached with regular integer code, not with some AVX512 power virus that takes away top frequency (because people ended up using it for memcpy!) and takes away cores (because those useless garbage units take up space).

Yes, yes, I'm biased. I absolutely destest FP benchmarks, and I realize other people care deeply. I just think AVX512 is exactly the wrong thing to do. It's a pet peeve of mine. It's a prime example of something Intel has done wrong, partly by just increasing the fragmentation of the market.

Stop with the special-case garbage, and make all the core common stuff that everybody cares about run as well as you humanly can. Then do a FPU that is barely good enough on the side, and people will be happy. AVX2 is much more than enough.

Yeah, I'm grumpy.

Linus
 

Για όσους δε γνωρίζουν αγγλικά, ο Linus ζητά από την Intel να παρατήσει το AVX512 και "μαγικές" εντολές είτε για πολύ εξειδικευμένα HPC workloads είτε για να φαίνεται καλή σε benchmarks, και να χρησιμοποιήσει τον σχετικό χώρο στο chip για πιο χρήσιμα πράγματα, όπως είτε να βελτιώσει την ενσωματωμένη GPU είτε να αυξήσει το core count.

Επεξ/σία από malakudi
  • Like 2
  • Thanks 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα

  • Δημιουργία νέου...