Προς το περιεχόμενο

AMD Navi benchmarks 5500/5600/5700(XT)


Luciddream

Προτεινόμενες αναρτήσεις

Δημοσ. (επεξεργασμένο)

Φτιάχνω αυτό το τοπικ μόνο για benchmarks των Navi καρτών, για να μην υπάρχει spam στα άλλα τοπικ.

Ξεκινάω με ένα για Linux - Hashcat 6.0.0.RC1 και 20.20 drivers. Οποιοδήποτε request για δοκιμές ευπρόσδεκτο.

 

Spoiler

luciddream@home ~/b/hashcat-6.0.0> ./hashcat.bin -b  
hashcat (v6.0.0) starting in benchmark mode...
 
Benchmarking uses hand-optimized kernel code by default.
You can use it in your cracking session by setting the -O option.
Note: Using optimized kernel code limits the maximum supported password length.
To disable the optimized kernel code in benchmark mode, use the -w option.
 
OpenCL API (OpenCL 2.1 AMD-APP (3110.6)) - Platform #1 [Advanced Micro Devices, Inc.]
=====================================================================================
* Device #1: gfx1010, 8064/8176 MB (6732 MB allocatable), 20MCU
 
Benchmark relevant options:
===========================
* --optimized-kernel-enable
 
Hashmode: 0 - MD5
 
Speed.#1.........: 25505.7 MH/s (52.25ms) @ Accel:1024 Loops:1024 Thr:64 Vec:1
 
Hashmode: 100 - SHA1
 
Speed.#1.........: 10098.8 MH/s (66.06ms) @ Accel:512 Loops:1024 Thr:64 Vec:1
 
Hashmode: 1400 - SHA2-256
 
Speed.#1.........:  4214.1 MH/s (79.18ms) @ Accel:512 Loops:512 Thr:64 Vec:1
 
Hashmode: 1700 - SHA2-512
 
Speed.#1.........:  1220.1 MH/s (68.25ms) @ Accel:512 Loops:128 Thr:64 Vec:1
 
Hashmode: 22000 - WPA-PBKDF2-PMKID+EAPOL (Iterations: 4095)
 
Speed.#1.........:   517.4 kH/s (78.67ms) @ Accel:256 Loops:512 Thr:64 Vec:1
 
Hashmode: 1000 - NTLM
 
Speed.#1.........: 41274.5 MH/s (32.17ms) @ Accel:1024 Loops:1024 Thr:64 Vec:1
 
Hashmode: 3000 - LM
 
Speed.#1.........: 25069.4 MH/s (53.07ms) @ Accel:1024 Loops:1024 Thr:64 Vec:1
 
Hashmode: 5500 - NetNTLMv1 / NetNTLMv1+ESS
 
Speed.#1.........: 27618.0 MH/s (48.22ms) @ Accel:1024 Loops:1024 Thr:64 Vec:1
 
Hashmode: 5600 - NetNTLMv2
 
Speed.#1.........:  1526.4 MH/s (54.63ms) @ Accel:64 Loops:1024 Thr:64 Vec:1
 
Hashmode: 1500 - descrypt, DES (Unix), Traditional DES
 
Speed.#1.........:   916.5 MH/s (91.00ms) @ Accel:64 Loops:1024 Thr:64 Vec:1
 
Hashmode: 500 - md5crypt, MD5 (Unix), Cisco-IOS $1$ (MD5) (Iterations: 1000)
 
Speed.#1.........: 10368.8 kH/s (60.95ms) @ Accel:1024 Loops:500 Thr:64 Vec:1
 
Hashmode: 3200 - bcrypt $2*$, Blowfish (Unix) (Iterations: 32)
 
Speed.#1.........:    24280 H/s (51.28ms) @ Accel:32 Loops:4 Thr:16 Vec:1
 
Hashmode: 1800 - sha512crypt $6$, SHA512 (Unix) (Iterations: 5000)
 
Speed.#1.........:   190.7 kH/s (84.95ms) @ Accel:128 Loops:512 Thr:64 Vec:1
 
Hashmode: 7500 - Kerberos 5, etype 23, AS-REQ Pre-Auth
 
Speed.#1.........:   385.8 MH/s (54.02ms) @ Accel:256 Loops:64 Thr:64 Vec:1
 
Hashmode: 13100 - Kerberos 5, etype 23, TGS-REP
 
Speed.#1.........:   376.0 MH/s (55.30ms) @ Accel:256 Loops:64 Thr:64 Vec:1
 
Hashmode: 15300 - DPAPI masterkey file v1 (Iterations: 23999)
 
Speed.#1.........:    88161 H/s (78.57ms) @ Accel:256 Loops:512 Thr:64 Vec:1
 
Hashmode: 15900 - DPAPI masterkey file v2 (Iterations: 12899)
 
Speed.#1.........:    41654 H/s (77.52ms) @ Accel:256 Loops:128 Thr:64 Vec:1
 
Hashmode: 7100 - macOS v10.8+ (PBKDF2-SHA512) (Iterations: 1023)
 
Speed.#1.........:   521.1 kH/s (68.71ms) @ Accel:256 Loops:127 Thr:64 Vec:1
 
Hashmode: 11600 - 7-Zip (Iterations: 16384)
 
Speed.#1.........:   525.0 kH/s (74.25ms) @ Accel:128 Loops:4096 Thr:64 Vec:1
 
Hashmode: 12500 - RAR3-hp (Iterations: 262144)
 
Speed.#1.........:    49043 H/s (51.95ms) @ Accel:32 Loops:16384 Thr:64 Vec:1
 
Hashmode: 13000 - RAR5 (Iterations: 32799)
 
Speed.#1.........:    53727 H/s (94.81ms) @ Accel:512 Loops:256 Thr:64 Vec:1
 
Hashmode: 6211 - TrueCrypt RIPEMD160 + XTS 512 bit (Iterations: 1999)
 
Speed.#1.........:   321.7 kH/s (62.79ms) @ Accel:128 Loops:256 Thr:64 Vec:1
 
Hashmode: 13400 - KeePass 1 (AES/Twofish) and KeePass 2 (AES) (Iterations: 24569)
 
Speed.#1.........:    43121 H/s (316.14ms) @ Accel:512 Loops:512 Thr:64 Vec:1
 
Hashmode: 6800 - LastPass + LastPass sniffed (Iterations: 499)
 
Speed.#1.........:  3368.2 kH/s (62.23ms) @ Accel:512 Loops:249 Thr:64 Vec:1
 
Hashmode: 11300 - Bitcoin/Litecoin wallet.dat (Iterations: 200459)
 
Speed.#1.........:     5614 H/s (74.24ms) @ Accel:128 Loops:512 Thr:64 Vec:1
 
Started: Sun Jun 14 06:47:01 2020
Stopped: Sun Jun 14 06:52:10 2020

 

Και ένα Blender benchmark 2.83 με bmw scene (1min 27sec)

Spoiler

Screenshot from 2020-06-14 05-19-33.png

Επεξ/σία από Luciddream
  • Like 2
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

  • Απαντ. 44
  • Δημ.
  • Τελ. απάντηση

Συχνή συμμετοχή στο θέμα

Δημοσ. (επεξεργασμένο)
1 hour ago, LIGHT1NG said:

@Luciddream καλό είναι να γράφουμε και υλοποίηση όμως. 

Εννοείς Sapphire Nitro+ ? Γενικά δεν έγραψα κάτι παραπάνω γιατί τα έχω όλα Auto προς το παρόν, no overclock. Αλλά μπορώ να το γράφω αν βοηθάει. Βέβαια είναι και συνδιασμός motherboard / cpu / ram κτλπ.

Πάμε και ένα SisoftSandra OpenCL module. Sapphire 5700XT Nitro+ (stock) - 2700x CPU (stock), RAM @ 3466

Spoiler

sisoft5.PNG.845733265cdaa256f50e3a6d7f9109e6.PNG

Spoiler

SiSoftware Sandra

Benchmark Results
Aggregate Shader Performance : 2GPix/s
Half-Float Shaders Native : 2.12GPix/s
Single-Float Shaders Native : 16.1MPix/s
Double-Float Shaders Native : 1GPix/s
Quad-Float Shaders Native : 39.23MPix/s
Interface : OpenCL
Results Interpretation : Higher Scores mean Better Performance.
Decimal Numeral System (base 10) : 1Gpix(/s) = 1000MPix(/s), 1Mpix(/s) = 1000kPix(/s), 1kPix(/s) = 1000 pixel(/s), etc.

Performance per Thread
Aggregate Shader Performance : 158.59MPix/s
Half-Float Shaders Native : 482.5MPix/s
Single-Float Shaders Native : 322.52MPix/s
Double-Float Shaders Native : 25.63MPix/s
Quad-Float Shaders Native : 980kPix/s
No. Threads : 40
Results Interpretation : Higher Scores mean Better Performance.
Decimal Numeral System (base 10) : 1Gpix(/s) = 1000MPix(/s), 1Mpix(/s) = 1000kPix(/s), 1kPix(/s) = 1000 pixel(/s), etc.

Performance vs. Speed
Aggregate Shader Performance : 3330.04kPix/s/MHz
Half-Float Shaders Native : 10131.26kPix/s/MHz
Single-Float Shaders Native : 6772.18kPix/s/MHz
Double-Float Shaders Native : 538.21kPix/s/MHz
Quad-Float Shaders Native : 20.60kPix/s/MHz
Results Interpretation : Higher Scores mean Better Performance.

Benchmark Status
Result ID : AMD Radeon RX 5700 XT (2560SP 40C 1.9GHz, 8GB  256-bit) (OpenCL)
BIOS : 017.001.000.049
Computer : ASUS ROG CROSSHAIR VI HERO (WI-FI AC)
Platform Compliance : x64
No. Threads : 1
System Timer : 10MHz

Half-Float FP16
Rendered Image Size : 43520x24480
Threads per Work-group : 16x16

Single-Float FP32
Rendered Image Size : 38400x21600
Threads per Work-group : 16x16

Double-Float FP64
Rendered Image Size : 16640x9360
Threads per Work-group : 16x16

Quad-Float FP128
Rendered Image Size : 5120x2880
Threads per Work-group : 16x16

Graphics Processor
Model : AMD Radeon RX 5700 XT
Interface Version : 2.0.10.10
Driver Version : 3075.12
Video BIOS : 017.001.000.049
Shader Speed : 1.9GHz
Peak Processing Performance (PPP) : 4.88TFLOPS
Adjusted Peak Performance (APP) : 4.39WT
Total Memory : 8GB

 

Η 2070 Super με το ζόρι φτάνει τα 5000 περίπου στο processing αν και σε κάποια τα πάει καλύτερα.

Επεξ/σία από Luciddream
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημοσ. (επεξεργασμένο)
Στις 14/6/2020 στις 10:50 ΜΜ, Luciddream είπε

Superposition Benchmark - Linux

  Απόκρυψη περιεχομένων

fOfpk4Q.png

Τρελε μου 5000 στο superposition εννοουσες? 2070 super εδω 😁... Asus strix

1080 max (1).png

Επεξ/σία από niko13
  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημοσ. (επεξεργασμένο)
36 minutes ago, niko13 said:

Τρελε μου 5000 στο superposition εννοουσες? 2070 super εδω 😁... Asus strix

Hello, όχι για το SisoftSandra OpenCL Processing λέω... αν έχεις όρεξη τρέξε ένα να δούμε πως τα πάει γιατί στο site μπορεί να έχει αρκετά false results. Αν και είναι λίγο off topic αλλά εμένα δεν με πειράζει αρκεί να μην το παρακάνουμε 😛

Το κατεβάζεις απο εδώ: https://www.guru3d.com/files-details/sandra-sisoft-download.html

Και μετά Benchmarks -> GPUGPU Processing - Προσοχή ΜΗΝ πατήσεις το Overall GPGPU γιατί θα τα τρέξει όλα και κάνει πολή ώρα. Εγώ τα είχα τρέξει όλα αλλά δεν μου κράτησε τα σκορ και τώρα δεν το ξανατρέχω χωρις λόγο.

Επεξ/σία από Luciddream
  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημοσ. (επεξεργασμένο)
3 ώρες πριν, Luciddream είπε

Hello, όχι για το SisoftSandra OpenCL Processing λέω... αν έχεις όρεξη τρέξε ένα να δούμε πως τα πάει γιατί στο site μπορεί να έχει αρκετά false results. Αν και είναι λίγο off topic αλλά εμένα δεν με πειράζει αρκεί να μην το παρακάνουμε 😛

Το κατεβάζεις απο εδώ: https://www.guru3d.com/files-details/sandra-sisoft-download.html

Και μετά Benchmarks -> GPUGPU Processing - Προσοχή ΜΗΝ πατήσεις το Overall GPGPU γιατί θα τα τρέξει όλα και κάνει πολή ώρα. Εγώ τα είχα τρέξει όλα αλλά δεν μου κράτησε τα σκορ και τώρα δεν το ξανατρέχω χωρις λόγο.

αδερφε μου χιλια συγνωμη οτι να ναι καταλαβα,καλα να παθω που διαβαζω post με το ενα ματι ανοικτο..ενοχος για thread polution..το ετρεξα το bench αλλα δεν καταφερα με τιποτα να βγαλω τα results με μορφη text οπως εσυ ..αν θες τιποτα πιο λεπτομερη ενημερωσε,εβγαλα ενα screen.απο 5800-6200 αναλογα το σκαλισμα της καρτας σε 12-13 run..

Screenshot_4.png

Επεξ/σία από niko13
  • Like 3
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημοσ. (επεξεργασμένο)
7 hours ago, niko13 said:

αδερφε μου χιλια συγνωμη οτι να ναι καταλαβα,καλα να παθω που διαβαζω post με το ενα ματι ανοικτο..ενοχος για thread polution..το ετρεξα το bench αλλα δεν καταφερα με τιποτα να βγαλω τα results με μορφη text οπως εσυ ..αν θες τιποτα πιο λεπτομερη ενημερωσε,εβγαλα ενα screen.απο 5800-6200 αναλογα το σκαλισμα της καρτας σε 12-13 run..

Μια χαρά, thanks! Σιγά δεν υπάρχει θέμα :) Απλά το Sisoft Sandra μου χει δώσει την εντύπωση ότι βρίσκει όντως τα όρια της κάρτας σε σχέση με άλλα γιαυτό το χρησιμοποιώ. Νομίζω το Text το κάνεις copy με το κουμπάκι που έχει κάτω αριστερά στα results δίπλα απο το γρανάζι, είναι λίγο χάος μέχρι να τα βρεις και εγώ έψαχνα καμια βδομάδα 😛 Πάντως σου δίνει πολύ καλά αποτελέσματα σε σχέση με άλλους, μόνο στα Double-float + Quad-Float το βλέπω κάτω απτην 5700 XT.

Επεξ/σία από Luciddream
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Πείραξα λίγο RAM + CPU σήμερα οπότε έτρεξα άλλο ένα.. μου δίνει λίγο χειρότερα νούμερα βέβαια αλλά βλέπω κάτι είχε πάει στραβά στο προηγούμενο με τα half / single float shaders. Βάζω μόνο τα νούμερα που έχουν νόημα. (Sapphire Nitro+ Auto clocks / +50% Power Limit / PBO Auto / RAM 3200C14)

Benchmark Results
Aggregate Shader Performance : 2GPix/s
Half-Float Shaders Native : 2.07GPix/s
Single-Float Shaders Native : 4.27GPix/s
Double-Float Shaders Native : 1GPix/s
Quad-Float Shaders Native : 38.23MPix/s
Interface : OpenCL
Results Interpretation : Higher Scores mean Better Performance.
Decimal Numeral System (base 10) : 1Gpix(/s) = 1000MPix(/s), 1Mpix(/s) = 1000kPix(/s), 1kPix(/s) = 1000 pixel(/s), etc.

Performance per Thread
Aggregate Shader Performance : 157.55MPix/s
Half-Float Shaders Native : 481.27MPix/s
Single-Float Shaders Native : 321.38MPix/s
Double-Float Shaders Native : 25.29MPix/s
Quad-Float Shaders Native : 955kPix/s
No. Threads : 40
Results Interpretation : Higher Scores mean Better Performance.
Decimal Numeral System (base 10) : 1Gpix(/s) = 1000MPix(/s), 1Mpix(/s) = 1000kPix(/s), 1kPix(/s) = 1000 pixel(/s), etc.

Performance vs. Speed
Aggregate Shader Performance : 3308.20kPix/s/MHz
Half-Float Shaders Native : 10105.33kPix/s/MHz
Single-Float Shaders Native : 6748.22kPix/s/MHz
Double-Float Shaders Native : 530.93kPix/s/MHz
Quad-Float Shaders Native : 20.07kPix/s/MHz
Results Interpretation : Higher Scores mean Better Performance.

 

  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

  • 2 εβδομάδες αργότερα...
Δημοσ. (επεξεργασμένο)

Ένα τυχαίο FFXV benchmark έτσι για να τεστάρω τους drivers με Hardware Scheduling - δυστυχώς δεν το είχα τρέξει πιο πριν να δω αν έχει διαφορά 😛

(Sapphire Nitro+ Auto clocks / 0% Power Limit / PBO Auto / RAM 3200C14)

SQRd4RE.png

Επεξ/σία από Luciddream
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημοσ. (επεξεργασμένο)

Και ένα GoogleNet ML inference με WinML. Δεν έχω ιδέα από ML οπότε υποθέτω το benchmarking πρέπει να γίνει στο training και όχι στο runtime. Μια παρατήρηση είναι ότι το evaluation της GPU κάνει 12ms ενώ του 2700x κάνει 34ms. Αργεί πολύ βέβαια το session creation.

Spoiler

Created LearningModelDevice with GPU: AMD Radeon RX 5700 XT
Loading model (path = C:\dev-tools\DirectML\googlenet-8.onnx)...
=================================================================
Generating input feature(s) with image: c:\users\luciddream\pictures\llama.jpg
Binding (device = GPU_High_Performance, iteration = 1, inputBinding = CPU, inputDataType = RGB_Image, deviceCreationLocation = WinML)...[SUCCESS]
Evaluating (device = GPU_High_Performance, iteration = 1, inputBinding = CPU, inputDataType = RGB_Image, deviceCreationLocation = WinML)...[SUCCESS]
Outputting top 1 values
Feature Name: prob_1
 index: 355, value: 0.99773

Results (device = GPU_High_Performance, numIterations = 1, inputBinding = CPU, inputDataType = RGB_Image, deviceCreationLocation = WinML):

First Iteration Performance (load, bind, session creation, and evaluate):
  Load: 26.2767 ms
  Bind: 7.2267 ms
  Session Creation: 394.05 ms
  Evaluate: 12.4505 ms

  Working Set Memory usage (evaluate): 1.17188 MB
  Working Set Memory usage (load, bind, session creation, and evaluate): 69.6836 MB
  Peak Working Set Memory Difference (load, bind, session creation, and evaluate): 112.527 MB

  Dedicated Memory usage (evaluate): 16.4531 MB
  Dedicated Memory usage (load, bind, session creation, and evaluate): 45.4219 MB

  Shared Memory usage (evaluate): 3.125 MB
  Shared Memory usage (load, bind, session creation, and evaluate): 6.88672 MB

 

Επεξ/σία από Luciddream
  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημοσ. (επεξεργασμένο)

Άλλο ένα ML Benchmark - Link

(Sapphire Nitro+ Auto clocks / 50% Power Limit / PBO Auto / RAM 3200C14)

    python tf_cnn_benchmarks.py --num_gpus=1 --batch_size=16 --model=resnet50

    Step    Img/sec total_loss
    1       images/sec: 36.3 +/- 0.0 (jitter = 0.0) 7.993
    10      images/sec: 37.6 +/- 0.4 (jitter = 1.4) 7.854
    20      images/sec: 38.2 +/- 0.3 (jitter = 2.0) 7.726
    30      images/sec: 38.5 +/- 0.2 (jitter = 2.0) 7.360
    40      images/sec: 38.4 +/- 0.2 (jitter = 2.0) 7.526
    50      images/sec: 38.3 +/- 0.2 (jitter = 2.0) 8.171
    60      images/sec: 38.1 +/- 0.2 (jitter = 2.0) 7.999
    70      images/sec: 38.0 +/- 0.2 (jitter = 2.0) 7.978
    80      images/sec: 37.9 +/- 0.1 (jitter = 2.0) 7.884
    90      images/sec: 38.0 +/- 0.1 (jitter = 2.0) 7.924
    100     images/sec: 37.9 +/- 0.1 (jitter = 2.0) 7.848
    ----------------------------------------------------------------
    total images/sec: 37.94
    ----------------------------------------------------------------

 

Επεξ/σία από Luciddream
  • Like 1
  • Sad 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Ένα 3dmark Time Spy. Δεν ξέρω γιατί τα περισσότερα PC βγάζουν τόσο χαμηλό. Ίσως λόγω CPU?

(Sapphire Nitro+ Auto clocks / 50% Power Limit / PBO Auto / RAM 3200C14)

Bw5qBxa.png

SBdfa9L.png

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημοσ. (επεξεργασμένο)

100 πόντους πάνω Time Spy με drivers 20.7.1 - Link

(Sapphire Nitro+ Auto clocks / 50% Power Limit / PBO Auto / RAM 3200C14)

BhCcUIC.png

Επεξ/σία από Luciddream
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

  • 2 εβδομάδες αργότερα...

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα
  • Δημιουργία νέου...