Προς το περιεχόμενο

Nvidia RTX2000/GTX16XX Series (Turing)


Psycho_Warhead

Προτεινόμενες αναρτήσεις

26 λεπτά πριν, Aten-Ra είπε

Καλά, όταν θα έχεις την πλειοψηφία των Games σε DirectML , το DLSS  θα είναι απλά ένα ακόμα proprietary feature της NVIDIA σαν το Gsync, PhysX κλπ κλπ.

Επίσης, μια χαρά θα τρέχει το DirectML στις κονσόλες, δεν χρειάζεται Brute Force  όπως στο DLSS.

https://on-demand.gputechconf.com/siggraph/2018/video/sig1814-2-adrian-tsai-gpu-inferencing-directml-and-directx-12.html
 

Direct-ML-2.png

Direct-ML-1.png

Το 'χαμε ξανασυζητήσει. Το 7.3Χ boost που βλέπεις είναι με tensor cores.

Στις κονσόλες θα έχουν κάποιο image reconstruction της πλάκας(οι κονσολάδες ποτέ δεν νοιάζονταν για IQ) ή κάτι καλoύτσικο αλλά με δυσανάλογα υψηλό κόστος και ίσως με δέσμευση παραδοσιακών shaders. Εκεί που ήταν η nvidia 2 χρόνια τώρα δεν την φτάνουν με την καμία.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

  • Απαντ. 5,4k
  • Δημ.
  • Τελ. απάντηση

Συχνή συμμετοχή στο θέμα

8 ώρες πριν, pirmen56 είπε

Το 'χαμε ξανασυζητήσει. Το 7.3Χ boost που βλέπεις είναι με tensor cores.

Στις κονσόλες θα έχουν κάποιο image reconstruction της πλάκας(οι κονσολάδες ποτέ δεν νοιάζονταν για IQ) ή κάτι καλoύτσικο αλλά με δυσανάλογα υψηλό κόστος και ίσως με δέσμευση παραδοσιακών shaders. Εκεί που ήταν η nvidia 2 χρόνια τώρα δεν την φτάνουν με την καμία.

To 7.3X που βλέπεις είναι η αύξηση που θα πάρεις χρησιμοποιώντας  Metacommands μέσα στο DirectML, δεν έχει σχέση με TensorCores η χωρίς TensorCores  αφού και στο cuDNN χρησιμοποίει TensorCores.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

1 ώρα πριν, Aten-Ra είπε

To 7.3X που βλέπεις είναι η αύξηση που θα πάρεις χρησιμοποιώντας  Metacommands μέσα στο DirectML, δεν έχει σχέση με TensorCores η χωρίς TensorCores  αφού και στο cuDNN χρησιμοποίει TensorCores.

Πήγαινε στο 24:20 για να ακούσεις για τα tensor cores. Πιο πριν λέει ότι το directML χρησιμοποιεί metacommands "to take advantage of hw specific optimizations". Αυτά είναι η αρχιτεκτονική των tensor cores που λέει παρακάτω. "allowing to use metacommands and take advantage of these tensor cores".

Το cuDNN είναι library για deep learning με αξιοποίηση ΓΕΝΙΚΩΣ των cuda cores. Δηλαδή των πυρήνων μιας GPU. Δεν υπήρχαν tensor cores όταν εμφανίστηκε το cuDNN. Άσχετα αν πρόσφατα αναβαθμίστηκε για να τα αξιοποιεί. Λες η nvidia να περίμενε το directML για να αξιοποιήσει στο έπακρο το δικό της πατενταρισμένο και παγκόσμια πρώτο σε επιδόσεις hw;

https://www.quora.com/What-is-CUDA-and-cuDNN

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημοσ. (επεξεργασμένο)
1 ώρα πριν, pirmen56 είπε

Πήγαινε στο 24:20 για να ακούσεις για τα tensor cores. Πιο πριν λέει ότι το directML χρησιμοποιεί metacommands "to take advantage of hw specific optimizations". Αυτά είναι η αρχιτεκτονική των tensor cores που λέει παρακάτω. "allowing to use metacommands and take advantage of these tensor cores".

Το cuDNN είναι library για deep learning με αξιοποίηση ΓΕΝΙΚΩΣ των cuda cores. Δηλαδή των πυρήνων μιας GPU. Δεν υπήρχαν tensor cores όταν εμφανίστηκε το cuDNN. Άσχετα αν πρόσφατα αναβαθμίστηκε για να τα αξιοποιεί. Λες η nvidia να περίμενε το directML για να αξιοποιήσει στο έπακρο το δικό της πατενταρισμένο και παγκόσμια πρώτο σε επιδόσεις hw;

https://www.quora.com/What-is-CUDA-and-cuDNN

 

To cuDNN χρησιμοποίει Tensor Cores από το 2017 σε V100 Volta και μετά στις Turing. Όταν έγινε το video(Siggraph 2018)  ήδη το cuDNN χρησιμοποιούσε TensorCores.

 

https://developer.nvidia.com/blog/programming-tensor-cores-cuda-9/

 

Programming Tensor Cores in CUDA 9

By Jeremy Appleyard and Scott Yokim | October 17, 2017 

 

Tensor Cores in CUDA Libraries

Two CUDA libraries that use Tensor Cores are cuBLAS and cuDNN.  cuBLAS uses Tensor Cores to speed up GEMM computations (GEMM is the BLAS term for a matrix-matrix multiplication); cuDNN uses Tensor Cores to speed up both convolutions and recurrent neural networks (RNNs).

How to Use Tensor Cores in cuBLAS

You can take advantage of Tensor Cores by making a few changes to your existing cuBLAS code. The changes are small changes in your use of the cuBLAS API.

The following sample code applies a few simple rules to indicate to cuBLAS that Tensor Cores should be used; these rules are enumerated explicitly after the code.

How to use Tensor Cores in cuDNN

Using Tensor Cores in cuDNN is also easy, and again involves only slight changes to existing code.

 
Επεξ/σία από Aten-Ra
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

47 λεπτά πριν, Aten-Ra είπε

To cuDNN χρησιμοποίει Tensor Cores από το 2017 σε V100 Volta και μετά στις Turing. Όταν έγινε το video(Siggraph 2018)  ήδη το cuDNN χρησιμοποιούσε TensorCores.

https://developer.nvidia.com/blog/programming-tensor-cores-cuda-9/

Programming Tensor Cores in CUDA 9

By Jeremy Appleyard and Scott Yokim | October 17, 2017 

Tensor Cores in CUDA Libraries

Two CUDA libraries that use Tensor Cores are cuBLAS and cuDNN.  cuBLAS uses Tensor Cores to speed up GEMM computations (GEMM is the BLAS term for a matrix-matrix multiplication); cuDNN uses Tensor Cores to speed up both convolutions and recurrent neural networks (RNNs).

How to Use Tensor Cores in cuBLAS

You can take advantage of Tensor Cores by making a few changes to your existing cuBLAS code. The changes are small changes in your use of the cuBLAS API.

The following sample code applies a few simple rules to indicate to cuBLAS that Tensor Cores should be used; these rules are enumerated explicitly after the code.

How to use Tensor Cores in cuDNN

Using Tensor Cores in cuDNN is also easy, and again involves only slight changes to existing code.

 

Η  cuDNN library που χρησιμοποιούν δεν πρέπει να αξιοποιεί καθόλου tensor cores. Εξ ου και η τεράστια διαφορά. Το λέει ξεκάθαρα ότι το DirectML επιτρέπει χρήση των tensor cores και γι αυτό βλέπουμε αυτή την αύξηση. Το DirectML είναι της MS. Πιστεύεις ότι η MS ξέρει καλύτερα τα tensor cores από την nvidia;

Σε slides που είχες δείξει ο ίδιος για τις κονσόλες φαινόταν να έχουν περίπου 3 φορές χειρότερες επιδόσεις πινακοπράξεων από μια 2080. Εκτός αν θεωρείς ότι και εν έτει 2020 τα libraries της nvidia για τα tensor cores εξακολουθούν να υπολείπονται του directML(υποθέτωντας ότι ήταν πίσω). DLSS 2.0 επιπέδου image reconstruction δύσκολο να δεις. Παρά μόνο αν βάλουν στόχο τα 30 καρέ π.χ..

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

2 ώρες πριν, pirmen56 είπε

Η  cuDNN library που χρησιμοποιούν δεν πρέπει να αξιοποιεί καθόλου tensor cores. Εξ ου και η τεράστια διαφορά. Το λέει ξεκάθαρα ότι το DirectML επιτρέπει χρήση των tensor cores και γι αυτό βλέπουμε αυτή την αύξηση. Το DirectML είναι της MS. Πιστεύεις ότι η MS ξέρει καλύτερα τα tensor cores από την nvidia;

Σε slides που είχες δείξει ο ίδιος για τις κονσόλες φαινόταν να έχουν περίπου 3 φορές χειρότερες επιδόσεις πινακοπράξεων από μια 2080. Εκτός αν θεωρείς ότι και εν έτει 2020 τα libraries της nvidia για τα tensor cores εξακολουθούν να υπολείπονται του directML(υποθέτωντας ότι ήταν πίσω). DLSS 2.0 επιπέδου image reconstruction δύσκολο να δεις. Παρά μόνο αν βάλουν στόχο τα 30 καρέ π.χ..

Καλά δεν ζητάμε το dlss είναι ανώτερο ,οι κονσόλες θα χρησιμοποιήσουν το rapid packed math aka fp16x2  για το machine learning

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

5 ώρες πριν, pirmen56 είπε

Η  cuDNN library που χρησιμοποιούν δεν πρέπει να αξιοποιεί καθόλου tensor cores. Εξ ου και η τεράστια διαφορά. 

 

H διαφορά στις επιδόσεις είναι από τα metacommands που αξιοποιούν όλη την αρχιτεκτονική της κάρτας όχι μόνο τα Tensor Cores.

Direct-ML-3.png

 

5 ώρες πριν, pirmen56 είπε

 Το DirectML είναι της MS. Πιστεύεις ότι η MS ξέρει καλύτερα τα tensor cores από την nvidia;

 

Τα Tensor Processing Units τα δημιούργησε η Google, όσο τα ξέρει η NVIDIA άλλο τόσο τα ξέρει και η MS και η AMD και άλλοι.

 

5 ώρες πριν, pirmen56 είπε

 

Σε slides που είχες δείξει ο ίδιος για τις κονσόλες φαινόταν να έχουν περίπου 3 φορές χειρότερες επιδόσεις πινακοπράξεων από μια 2080. Εκτός αν θεωρείς ότι και εν έτει 2020 τα libraries της nvidia για τα tensor cores εξακολουθούν να υπολείπονται του directML(υποθέτωντας ότι ήταν πίσω). DLSS 2.0 επιπέδου image reconstruction δύσκολο να δεις. Παρά μόνο αν βάλουν στόχο τα 30 καρέ π.χ..

Αυτό που λες είναι μόνο για τα TFlops σε 4bit INT. Επίσης να προσθέσω ότι δεν χρειάζεται εξωφρενικές επιδόσεις από ML για να κάνεις upscale και ML antialising. Δες την RTX2060 που βγάζει 60fps σε 4Κ με το DLSS 2.0 και έχει σχεδόν τα μισά TFlops σε ML από ότι το XΒΟΧ SX.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

  • 2 εβδομάδες αργότερα...
Επισκέπτης

Αυτό μου έκανε και εμένα εντύπωση. Η απλή 2060 έχει τη διπλή απόδοση σε machine learning από το Series X; Τι φάση; Γενικά το αντίστοιχο DLSS στο XBOX πως θα γίνεται;

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Τελικά μάθαμε και γιατί το DLSS 2.0 αφήνει κάποια άσχημα ίχνη και σε ορισμένα μάλιστα αντικείμενα. Δεν υπάρχουν motion vectors για τα πάντα. Ιδανικά χρειάζεται χτίσιμο του game engine γύρω από το DLSS.

20 λεπτά πριν, yiannis1991 είπε

Αυτό μου έκανε και εμένα εντύπωση. Η απλή 2060 έχει τη διπλή απόδοση σε machine learning από το Series X; Τι φάση; Γενικά το αντίστοιχο DLSS στο XBOX πως θα γίνεται;

Θα είναι μια αργή παραλλαγή με στόχο τα 30 έως 60 καρέ στο πιο ιδανικό σενάριο.

  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Επισκέπτης
1 ώρα πριν, pirmen56 είπε

Τελικά μάθαμε και γιατί το DLSS 2.0 αφήνει κάποια άσχημα ίχνη και σε ορισμένα μάλιστα αντικείμενα. Δεν υπάρχουν motion vectors για τα πάντα. Ιδανικά χρειάζεται χτίσιμο του game engine γύρω από το DLSS.

Θα είναι μια αργή παραλλαγή με στόχο τα 30 έως 60 καρέ στο πιο ιδανικό σενάριο.

Μόνο; Δηλαδή χωρίς DirectML πόσα θα πιάνει σε 4Κ με gpu σαν την 2080 (super?); Κάτω από 30?

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

3 λεπτά πριν, yiannis1991 είπε

Μόνο; Δηλαδή χωρίς DirectML πόσα θα πιάνει σε 4Κ με gpu σαν την 2080 (super?); Κάτω από 30?

Υπερβολικος ο pirmen οπως παντα. Τα περισσοτερα games στο xbox Sex θα ειναι 4κ 60, με καποια που πουσαρουν πολυ τα visuals 4k30 και καποια ελαφρια οπως το ori and the will of wisps 120. 

Kαποια competitive σαν το cod warzone πιστευω θα εχουν unlocked framerate και θα παιζουν μεταξυ 60-120(?) 

  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Στις 18/7/2020 στις 3:18 ΜΜ, ilos είπε

Καλά ας κάνει την πλάκα να δώσει ψόφιο rasterization ο πέτσινος και ας έχω όσο performance με DLSS όσο με native στους άλλους και θα δούμε αν αλλάζεις ή όχι.😁

Εγώ προσωπικά δεν πιστεύω ότι η AMD μπορεί να κάνει τέτοιο μεγάλο άλμα μέσα σε μια γενιά και να φτάσει σε επιδόσεις το αντίστοιχο κορυφαίο μοντέλο της Nvidia.

  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Στις 6/4/2019 στις 4:40 ΜΜ, Psycho_Warhead είπε

JvQgdRxrhtqiAttx.jpg

ThhJBqu.png

GPU-GTX1650-Chart-1-640x561.png

Ας γίνει άλλη μια απόπειρα.

22 Απριλίου έρχεται η GTX1650. Μέσα στον μήνα θα κυκλοφήσουν και οι drivers για DXR υποστήριξη σε Pascal και GTX Turing.

Θυμίζει λίγο τον Rudolph, τότε που πήρε το αεροπλάνο μόνος του και πήγε γεμάτος όνειρα υποσχέσεις κι ελπίδες στη Γηραιά Αλβιόνα, ο Alan Turing η μου φαίνεται; 

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

22 ώρες πριν, yiannis1991 είπε

Μόνο; Δηλαδή χωρίς DirectML πόσα θα πιάνει σε 4Κ με gpu σαν την 2080 (super?); Κάτω από 30?

Στις κονσόλες πάντα μαξάρουν την ποιότητα των γραφικών με στόχο ένα ικανοποιητικό IQ και 30 καρέ. Τα 60 καρέ είναι πολυτέλεια. Μόνο για κάτι multiplayer που λέει και ο NoFear.

Κατά φωνή: Possible PlayStation 5 DLSS-Like Image Reconstruction Tech Revealed By New Patent

  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα

  • Δημιουργία νέου...