Προς το περιεχόμενο

NVIDIA Pascal, GP100


Ailuros

Προτεινόμενες αναρτήσεις

  • Απαντ. 7,8k
  • Δημ.
  • Τελ. απάντηση

Συχνή συμμετοχή στο θέμα

Το πρόβλημα με το Kepler είναι ότι για να δώσει το 100% των δυνατοτήτων του,  πρέπει η ο Driver η το Game να βγάζουν μεγαλύτερο ILP ανά SMX. H NVIDIA από τότε που βγήκε ο Maxwell δεν ασχολιέται με το Kepler και αφήνει τους Game Developers να βγάλουν μεγαλύτερο ILP μέσα από το Optimization στο Game Engine.

 

Αυτό συμβαίνει γιατί κάθε SMX του Kepler έχει 192 Cores αλλά έχει μόνο 4x Schedulers ανά 32Cores per warp (σύνολο 128). Έτσι για να χρησιμοποιήσει και τους υπόλοιπους πυρήνες στον ίδιο κύκλο πρέπει να γίνει μέσο Driver η μέσα από το  Game.

 

Έτσι από την στιγμή που βγήκε ο Maxwell, η NVIDIA άρχισε να μην κάνει optimized τους Driver για τον Kepler στα καινούργια παιχνίδια οπότε δεν έχουμε το 100% που μπορεί να δώσει το Chip.

 

Το ότι έχουμε μια μικρή αύξηση από τον έναν driver στον άλλον δεν σημαίνει ότι και οι δυο Drivers βγάζουν το 100% των δυνατοτήτων του Kepler.  Επίσης σε πολλά GameWorks Games επειδή ούτε οι ίδιοι οι Developers δεν μπορούν να πειράξουν τον κώδικα, εκεί δεν έχουμε optimization ούτε από Drivers αλλά ούτε μέσα από το Game Engine και ο Kepler χαντακώνετε.

 

Σε παιχνίδια όμως  που είναι Kepler optimized όπως το BF1,  ο Kepler αποδίδει πολύ παραπάνω σε σχέση με το Maxwell από ότι σε άλλα παιχνίδια.  Αυτό συμβαίνει γιατί το GameEngine του BF1 μπορεί και εκμεταλλεύεται καλύτερα τα 192 Cores ανά SMX ακόμα και χωρίς την βοήθεια του Driver.

 

Το παρακάτω είναι από Game Developer.

 

 

Το οποίο απόσπασμα δεν μπορεί να έχει την τύχη μιας παραπομπής; Και οι δημιουργοί παιχνιδιών έχουν τις προτιμήσεις τους συνήθως δικαιολογημένα.

 

Εάν μπεις στον κόπο και ανοίξεις ένα προς ένα τις εφαρμογές που δοκίμασαν με διαφορετικούς οδηγούς στο άρθρο του computerbase που παρέθεσα θα δεις ότι η 780Τi βλέπει βελτιστοποιήσεις σε παρεμφερή αναλογίες με τις άλλες αρχιτεκτονικές. 

 

΄Οπου ο αρθρογράφος καταλήγει στο συμπέρασμά του: 

 

 

 

Darüber hinaus zeigen die Vergleiche mit älteren Grafikkarten der Maxwell- und der Kepler-Generation, dass die Treiber auch für älteren Produktgenerationen optimiert werden. Der Vorwurf, dass Treiber nur noch auf neue Grafikkarten optimiert werden, der in Foren immer wieder aufkommt, erweist sich somit als falsch.

 

Το ότι οτιδήποτε μετά το Maxwell είναι επαρκέστερες αρχιτεκτονικές ω τι έκπληξη το ξέραμε εδώ και χρόνια. 

 

Επίσης ένα κλικ πιο πάνω στην ίδια σελίδα:

 

 

 

Die Benchmarks zeigen primär eine Sache: Während es bei AMD traditionell mit der Zeit größere – aber keine riesigen – Performance-Sprünge durch neue Treiber gibt, hat Nvidia die eigene Hardware bereits beim Start gut im Griff und auf maximale Leistung optimiert. Das zeigt sich auch bei der aktuellen Generation. Während AMD die Radeon RX 480 seit dem Erscheinen um etwa fuenf Prozent beschleunigt hat, kann die GeForce GTX 1080 nur um ein Prozent zulegen – und hatte dazu noch einige Wochen mehr Zeit. Was im ersten Augenblick vielleicht negativ klingen mag, ist aber absolut positiv. In den meisten Fällen quetscht der GeForce-Treiber bereits am ersten Tag die volle Leistung aus der eigenen Hardware. Die Leistungsverbesserungen durch neue Treiber fallen dementsprechend geringer als bei der Konkurrenz aus.
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Απλά κάποιοι περιμένουν πυρήνες 2 αρχιτεκτονικές πίσω και μάλιστα με σημαντικές διαφορές από τον Kepler έως τον Pascal, όχι μόνο να έχουν ίδια ποσοστιαία βελτίωση, αλλά και σε απόλυτα νούμερα ένας high end πυρήνας του 2013 να είναι στο άνω άκρο του performance κομματιού το 2017, πράγμα γελοίο και αχρείαστο. Γιατί ποια η πρακτική χρησιμότητα μια εταιρεία να δαπανήσει πόρους για να κρατήσει στη ζωή ένα προϊόν 4 χρόνων, όταν με το 1/3 της τιμής του πλέον αγοράζει κάποιος ένα καλύτερο προϊόν;

  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Ο συνηθισμένος μύθος είναι ότι οτιδήποτε Kepler (είτε σε desktop είτε σε επαγγελματικές αγορές) δεν τυγχάνουν καμίας απολύτως προσοχής. Το άρθρο παρουσιάζει μια άλλη εικόνα και προφανώς στους προσομοιωτές της NV δεν τρέχουν μόνο βελτιστοποιήσεις για Maxwell/Pascal όπως το φαντάζεστε μερικοί. ΄Οποιος δηλαδή πλήρωσε πριν 3 χρόνια μια πιπεράτη τιμή για μια 780Ti ή οποιαδήποτε Quadro ή και Tesla ακόμα και σήμερα βασισμένα σε Kepler θα πρέπει να αφεθεί στο έλεος του τίποτα; Mια καλή Κ1200 με γελοία 512SPs στοιχίζει ακόμα και σήμερα 500+ ευρώ. Και πριν το πει κανείς ένα driver team έχει η εταιρεία όχι 500.

  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Ο συνηθισμένος μύθος είναι ότι οτιδήποτε Kepler (είτε σε desktop είτε σε επαγγελματικές αγορές) δεν τυγχάνουν καμίας απολύτως προσοχής. Το άρθρο παρουσιάζει μια άλλη εικόνα και προφανώς στους προσομοιωτές της NV δεν τρέχουν μόνο βελτιστοποιήσεις για Maxwell/Pascal όπως το φαντάζεστε μερικοί. ΄Οποιος δηλαδή πλήρωσε πριν 3 χρόνια μια πιπεράτη τιμή για μια 780Ti ή οποιαδήποτε Quadro ή και Tesla ακόμα και σήμερα βασισμένα σε Kepler θα πρέπει να αφεθεί στο έλεος του τίποτα; Mια καλή Κ1200 με γελοία 512SPs στοιχίζει ακόμα και σήμερα 500+ ευρώ. Και πριν το πει κανείς ένα driver team έχει η εταιρεία όχι 500.

 

Φυσικά και υπάρχει βελτίωση συνολικά και οι κάρτες συνεχίζουν να υποστηρίζονται κανονικά. Απλά οι περισσότεροι, που μόνο ως πελάτες μπορούν να εκφέρουν γνώμη και το βλέπουν απολειστικά και μόνο από τη μεριά του καταναλωτή, περιμένουν να σπαταληθούν πόροι τόσο από τους IHVs όσο και από τους ISVs, ώστε τα παιχνίδια που κυκλοφόρησαν 3-4 χρόνια μετά την κυκλοφορία μιας αρχιτεκτονικής να τρέχουν το ίδιο καλά σε αυτή με τις μεταγενέστερες. Κοινώς στην πράξη να ασχοληθεί μια εταιρεία περισσότερο με τις προηγούμενες αρχιτεκτονικές παρά με τη σημερινή.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Ο συνηθισμένος μύθος είναι ότι οτιδήποτε Kepler (είτε σε desktop είτε σε επαγγελματικές αγορές) δεν τυγχάνουν καμίας απολύτως προσοχής.

 

Κοίταξε, όταν κάποιος βλέπει  το παρακάτω και γνωρίζει ότι η GTX 780Ti έχει 7δις τρανζίστορ ενώ η GTX 970 (το πλήρες GM104) είναι στα 5.2Δις τρανζίστορ και παρόλα αυτά  η 970 είναι  κοντά στο 15% ταχύτερη,  εε δεν χρειάζεται και πολλά για να καταλάβεις ότι αυτό που είπα πριν ισχύει.

 

http://gamegpu.com/test-video-cards/opredelenie-naibolee-bystrykh-i-optimalnykh-reshenij-2016-goda

 

games_2016_1920.png

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Η 970 έχει λιγότερα CUDA cores αλλά πολύ καλύτερο OC headroom. Για τον ίδιο λόγο το Pascal είχε ελάχιστη αύξηση του density σε σχέση με το Maxwell.

 

Που το είδες αυτό ??

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Η 970 έχει λιγότερα CUDA cores αλλά πολύ καλύτερο OC headroom. Για τον ίδιο λόγο το Pascal είχε ελάχιστη αύξηση του density σε σχέση με το Maxwell.

βεβαια ο αριθμος των cuda cores δεν παιζει και πολυ μεγαλο ρολο οταν μιλαμε για διαφορετικες αρχιτεκτονικες , η gtx 970 εχει περισσοτερο αριθμο rops 64 εναντι 48 της gtx780ti και πολυ μεγαλυτερο l2 cache +μεγαλυτερη συχνοτητα πυρηνα
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Υπάρχει καμία περίπτωση να δούμε φέτος Volta ή θα δούμε κάτι σε Pascal σε αναβολικά; 

 

Στα χαρτιά θα δεις πολλά.

Κοίταξε, όταν κάποιος βλέπει  το παρακάτω και γνωρίζει ότι η GTX 780Ti έχει 7δις τρανζίστορ ενώ η GTX 970 (το πλήρες GM104) είναι στα 5.2Δις τρανζίστορ και παρόλα αυτά  η 970 είναι  κοντά στο 15% ταχύτερη,  εε δεν χρειάζεται και πολλά για να καταλάβεις ότι αυτό που είπα πριν ισχύει.

 

http://gamegpu.com/test-video-cards/opredelenie-naibolee-bystrykh-i-optimalnykh-reshenij-2016-goda

 

 

 

To θέμα εδώ ήταν/είναι αν ο χρήστης βλέπει βελτιστοποιήσεις ακόμα και σήμερα με Κepler και δεν έχει μπει σε κανενός είδους low level support όπως μερικοί κοντεύουν να ισχυριστούν. Από που έρχονται οι βελτιστοποιήσεις λίγο αφορά όταν πάει να καταρριφθεί ένας αβάσιμος μύθος. 

 

Το computerbase σπατάλησε χρόνο και έκανε συγκρίσεις με διαφορετικούς οδηγούς σε τρεις διαφορετικές αρχιτεκτονικές και ούτε σε Maxwell ούτε σε Pascal βρέθηκαν θεαματικότερες αυξήσεις με τους διαφορετικούς οδηγούς για λόγους που επίσης εξηγεί ο αρθρογράφος. 500 πολύχρωμα διαγράμματα να μου βάλεις δεν αλλάζει κάτι ιδιαίτερο σε αυτό εκτός αν κάποιος καθίσει και επαναλάβει το εν λόγω πείραμα και βγάλει αξιόπιστα αντίθετα αποτελέσματα.

Φυσικά και υπάρχει βελτίωση συνολικά και οι κάρτες συνεχίζουν να υποστηρίζονται κανονικά. Απλά οι περισσότεροι, που μόνο ως πελάτες μπορούν να εκφέρουν γνώμη και το βλέπουν απολειστικά και μόνο από τη μεριά του καταναλωτή, περιμένουν να σπαταληθούν πόροι τόσο από τους IHVs όσο και από τους ISVs, ώστε τα παιχνίδια που κυκλοφόρησαν 3-4 χρόνια μετά την κυκλοφορία μιας αρχιτεκτονικής να τρέχουν το ίδιο καλά σε αυτή με τις μεταγενέστερες. Κοινώς στην πράξη να ασχοληθεί μια εταιρεία περισσότερο με τις προηγούμενες αρχιτεκτονικές παρά με τη σημερινή.

 

Πάντα επικεντρώνονται όλες οι εταιρείες στο νεότερο προιόν, εδώ όμως το θέμα ήταν/είναι αν και κατά πόσο παραμελούνται έξω από το αναμενόμενο παλιότερες λύσεις. https://www.computerbase.de/2017-01/geforce-treiber-test/2/#abschnitt_ein_neuer_treiber_lohnt_sich_immer

 

(Τελευταίο γραφικό κάτω)..... Εάν εξαιρέσεις το DX12 σε DX11 οι 3 λύσεις δείχνουν να έχουν την αναμενόμενη απόσταση μεταξύ τους. Τώρα αν φταίει ο IHV, οι ISV ή και οι δύο για το DX12 είναι άλλο κεφάλαιο. Maxwell & Kepler κερδίζουν χοντρικά <5% μεταξύ 353 & 376 και οι 3 αρχιτεκτονικές <2% μεταξύ 368 & 376. 

  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Στα χαρτιά θα δεις πολλά.

 

To θέμα εδώ ήταν/είναι αν ο χρήστης βλέπει βελτιστοποιήσεις ακόμα και σήμερα με Κepler και δεν έχει μπει σε κανενός είδους low level support όπως μερικοί κοντεύουν να ισχυριστούν. Από που έρχονται οι βελτιστοποιήσεις λίγο αφορά όταν πάει να καταρριφθεί ένας αβάσιμος μύθος. 

 

Το computerbase σπατάλησε χρόνο και έκανε συγκρίσεις με διαφορετικούς οδηγούς σε τρεις διαφορετικές αρχιτεκτονικές και ούτε σε Maxwell ούτε σε Pascal βρέθηκαν θεαματικότερες αυξήσεις με τους διαφορετικούς οδηγούς για λόγους που επίσης εξηγεί ο αρθρογράφος. 500 πολύχρωμα διαγράμματα να μου βάλεις δεν αλλάζει κάτι ιδιαίτερο σε αυτό εκτός αν κάποιος καθίσει και επαναλάβει το εν λόγω πείραμα και βγάλει αξιόπιστα αντίθετα αποτελέσματα.

 

Πάντα επικεντρώνονται όλες οι εταιρείες στο νεότερο προιόν, εδώ όμως το θέμα ήταν/είναι αν και κατά πόσο παραμελούνται έξω από το αναμενόμενο παλιότερες λύσεις. https://www.computerbase.de/2017-01/geforce-treiber-test/2/#abschnitt_ein_neuer_treiber_lohnt_sich_immer

 

(Τελευταίο γραφικό κάτω)..... Εάν εξαιρέσεις το DX12 σε DX11 οι 3 λύσεις δείχνουν να έχουν την αναμενόμενη απόσταση μεταξύ τους. Τώρα αν φταίει ο IHV, οι ISV ή και οι δύο για το DX12 είναι άλλο κεφάλαιο. Maxwell & Kepler κερδίζουν χοντρικά <5% μεταξύ 353 & 376 και οι 3 αρχιτεκτονικές <2% μεταξύ 368 & 376. 

 

Μάλλον πρέπει να ξαναδιαβάσεις τι έγραψα, δεν είπα ότι δεν υπάρχει αύξηση από οδηγό σε οδηγό αλλά ότι δεν υπάρχει βελτιστοποίηση μετά την έλευση του Maxwell για την αρχιτεκτονική Kepler στους οδηγούς μετά το 2014.

 

Η GTX780Ti με βελτιστοποιημένους οδηγούς για την αρχιτεκτονική Kepler ώστε να μπορούν να βγάζουν μεγαλύτερο ILP ανά SMX και να δουλεύουν και τα 192 CUDA Cores έπρεπε να είναι συνέχεια κοντά στην GTX 980 και πιο γρήγορη από την GTX 970. Αντί αυτού βλέπουμε εδώ και 2 χρόνια την GTX 970 που είναι κομμένο GM104 (λιγότερα από 5.2δις τρανζίστορ) να είναι πιο γρήγορη από ένα Chip που έχει κοντά 50% παραπάνω τρανζίστορ και να είναι και οι δυο στα 28nm.

 

Εδώ βλέπεις την GTX 1060 που έχει 4.4δις Τρανζίστορ και με έχτρα αβάντα μικρότερα νανόμετρα (υψηλότερα ρολόγια σε base και Turbo) + καινούργια αρχιτεκτονική να μην μπορεί να ξεπεράσει  καλά καλά την GTX 980 με 5.2δις τρανζίστορ (μόλις 18% παραπάνω τρανζίστορ για την GTX 980).  Και η GTX 970 που είναι κομμένο GM104  (δεν πρέπει να χρησιμοποίει πάνω από 4.5δις τρανζίστορ από το σύνολο των 5.2δις) να είναι 15% πιο γρήγορη από την GTX 780Ti που έχει κοντά στα 7δις τρανζίστορ (50-55% παραπάνω από τα 4.5 της GTX 970) και είναι και οι δυο στα 28nm.

  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Η 970 έχει λιγότερα CUDA cores αλλά πολύ καλύτερο OC headroom. Για τον ίδιο λόγο το Pascal είχε ελάχιστη αύξηση του density σε σχέση με το Maxwell.

 

 

 

 

Τι σχέση έχουν τα CUDA cores; Αυτά αφορούν τους προγραμματιστές και όχι τους gamers.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Τι σχέση έχουν τα CUDA cores; Αυτά αφορούν τους προγραμματιστές και όχι τους gamers.

 

Οι CUDA cores δεν παύουν να είναι Shaders με compute λειτουργίες (Unified Shaders). Αν αφορούσαν μόνο τους προγραμματιστές θα υπήρχαν μόνο στις Quadro.

  • Like 3
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα
  • Δημιουργία νέου...