Προς το περιεχόμενο

AMD Zen 3 ( Milan / Vermeer ) - Epyc 3 & Ryzen 5000


ultraex2003

Προτεινόμενες αναρτήσεις

Δημοσ. (επεξεργασμένο)
5 λεπτά πριν, yiannis1991 είπε

Αν είναι στο QVL πρέπει να δουλεύουν no matter what αλλιώς κάνεις RMA την mobo. Η AMD πάντως λέει up to 3200MHz οπότε δεν βλέπω λόγο για RMA του cpu..

Είχε αγοράσει πρώτα τις σωστές G.Skill και είχε το ίδιο πρόβλημα. Μετά έδωσε άλλα 1000 ευρώ για να πάρει τις Kingston που ήταν στο QVL της Dark Hero (οι G.SKill δεν ήταν) και πάλι τα ίδια.

Το θέμα είναι ότι αν διαβάσεις το link που έβαλα (όπως και άλλα στο Internet) ένα μέρος αυτών που είχαν το ίδιο πρόβλημα (random reset/crash και WHEA) το έλυσαν με RMA τον 5950Χ.

Επεξ/σία από elpenor
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

  • Απαντ. 10,4k
  • Δημ.
  • Τελ. απάντηση

Συχνή συμμετοχή στο θέμα

Δημοσ. (επεξεργασμένο)

Η ποιο πιθανή απάντηση της AMD είναι η εξήςC0CPdtF.png

5 minutes ago, elpenor said:

Είχε αγοράσει πρώτα τις σωστές G.Skill και είχε το ίδιο πρόβλημα. Μετά έδωσε άλλα 1000 ευρώ για να πάρει τις Kingston που ήταν στο QVL της Dark Hero (οι G.SKill δεν ήταν) και πάλι τα ίδια.

Το θέμα είναι ότι αν διαβάσεις το link που έβαλα (όπως και άλλα στο Internet) ένα μέρος αυτών που είχαν το ίδιο πρόβλημα (random reset/crash και WHEA) το έλυσαν με RMA τον 5950Χ.

Η αλήθεια να λέγεται ένα μεγάλο ποσοστό των 5900X/5950X είχανε WHEA 18 με 2X8 να τρέχουν ακόμα και στα 3200 και λύθηκε με RMA/BIOS Update (Αλλά από ότι βλέπω πάει αρκετός καιρός και οι τύποι που έκαναν RMA περίμεναν αρκετό καιρό γιατί δεν είχε stock η AMD) 

Εδώ όμως μιλάμε για 4 dual rank τα οποία γωνατίζουν το CPU 

Δεν είναι και Rev E που είναι και ανάλαφρα στον IMC

Επεξ/σία από Devastor
  • Like 2
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

7 ώρες πριν, elpenor είπε

@petasis Σίγουρα μπορείς να βγάλεις καλύτερη φωτογραφία, εγώ έκανα μία δοκιμή με ένα κινέζικο κινητό που δεν είχε ούτε 200 ευρώ πριν από 2 χρόνια και βγαίνουν τα πάντα καμπάνα.

Το πρόβλημα με την περίπτωση σου είναι ότι η AMD στη σελίδα όλων των επεξεργαστών γράφει "System Memory Specification: Up to 3200MHz" άρα θα είναι εύκολο για αυτούς να σου αρνηθούν το RMA.

Επίσης δεν μπορείς να είσαι σίγουρος για το τι φταίει, είναι αρκετά πιθανό να φταίει ο επεξεργαστής όμως μπορεί να φταίει και η μητρική ή η RAM.

Στα σχόλια εδώ το τελευταίο σχόλιο αναφέρει ότι το πρόβλημα του λύθηκε όταν απενεργοποίησε το Fmax enhancer, το έχεις δοκιμάσει; Επίσης εγώ θα δοκίμαζα να ανεβάσω το vdimm από 1.35v σε 1.45v.

Τέλος δεν ξέρω αν έχεις προσέξει ότι οι μνήμες σου έχουν 2 XMP profile, ένα 18-22-22 και ένα 16-18-18. Η μητρική σου στο QVL αναφέρει ότι υποστηρίζει μόνο το αργό από τα δύο.

Έπρεπε να έβλεπες τι πέρασα για να τρέξουν κάτι b-die σε μία Asus X470 pro + 2400g, όχι μόνο δεν δούλευε το XMP αλλά αν πείραζα πάνω από τα μισά subtimings (άσχετα το ποια και το τι θα έβαζα, ακόμα και αν έγραφα manual τις default τιμες χωρίς XMP) ήθελε clear cmos. Τα κατάφερα όμως στο τέλος μετά από ούτε 150 clear cmos και τα ανίψια μου κέρδισαν 20fps+ στο fortnite ;). Σίγουρα αν παρατήσεις τη δουλειά σου και κάτσεις μερικές μέρες με Ryzen Dram calculator και τα excel του Devastor θα βρεις τη max stable speed.

 

53 λεπτά πριν, yiannis1991 είπε

Εγώ πάντως ακόμη δεν έχω καταλάβει το λόγο του RMA..

Ο λόγος του RMA είναι αυτός που καταγράφουν τα logs εδώ:

https://www.dropbox.com/sh/wbhadgrtlsqmv83/AADDrAntGjCK5NelrRCXBFWHa?dl=0

Το σύστημα κολλάει. Δεν υπάρχει ένδειξη ότι φταίει η μνήμη. Αυτά τα κολλήματα είναι με τις μνήμες στο XMP 18-22-22 (το 1ο προφίλ) και την συχνότητα κατεβασμένη στα 3200. Τις έχω κατεβάσει καιρό. Όλα τα άλλα στο default.

Επίσης, το ρεζιλίκι συνεχίζεται:

Αναφορά σε κείμενο

I would really appreciate if you could provide picture of CPU with motherboard and without motherboard both clearly visible serial number.

Please Note: Serial number should be clearly visible, without proper verification I can not proceed further and release RMA.

Τώρα ζητάνε και φωτογραφία του επεξεργαστή εκτός μητρικής.

  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημοσ. (επεξεργασμένο)

@petasis@yiannis1991 Εγώ πάντως διαβάζοντας τα logs δεν μπορώ να καταλάβω τι φταίει και γίνεται lock το core και το μόνο σίγουρο είναι ότι οι ινδοί που θα τους έχει κάνει outsource το support/RMA δεν θα έχουν την παραμικρή ιδέα.

Σιγά μην έχει βάλει η AMD σοβαρό τεχνικό να εξυπηρετεί όλους όσους θέλουν να κάνουν RMA.

25 λεπτά πριν, petasis είπε

Το σύστημα κολλάει. Δεν υπάρχει ένδειξη ότι φταίει η μνήμη. Αυτά τα κολλήματα είναι με τις μνήμες στο XMP 18-22-22 (το 1ο προφίλ) και την συχνότητα κατεβασμένη στα 3200. Τις έχω κατεβάσει καιρό. Όλα τα άλλα στο default.

Έχεις δοκιμάσει να κάνεις disable C-states / DF C-States / Fmax enhancer;

25 λεπτά πριν, petasis είπε

Τώρα ζητάνε και φωτογραφία του επεξεργαστή εκτός μητρικής.

Τραγικοί τύποι πραγματικά...

25 λεπτά πριν, petasis είπε

Το σύστημα κολλάει. Δεν υπάρχει ένδειξη ότι φταίει η μνήμη.

Διαβάζοντας για το "soft lockup - CPU#16 stuck for .." βρήκα 4-5 post που λένε ότι είναι RAM και κάποια που λένε ότι φταίει το ryzen c6 state bug. Άρα ίσως πραγματικά αξίζει να δοκιμάσεις αυτό που σου έγραψα πιο πάνω. (Άλλοι λόγοι είναι πρόβλημα με τα PCI ή να μην υπάρχει αρκετός χώρος για το swap).

Επίσης κάποιος λέει το έλυσε με "after while with random AMD Ryzen reboots, final solution was add Kernel parameter: acpi_osi=Linux"

Το C-state bug είναι δηλωμένο εδώ και παρόλο που το έκλεισαν πριν από λίγες μέρες γράφουν ότι δεν έχει λυθεί.

Επεξ/σία από elpenor
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημοσ. (επεξεργασμένο)

@petasis μακάρι να μπορούσα να σε βοηθήσω αλλά οι γνώσεις μου σε  Linux και hardware troubleshooting σε Linux είναι απειροελάχιστες

Πάντως σε Windows όταν crasharoun τα cores κατα 99.9% είναι μνήμη

Επεξ/σία από Devastor
  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

13 ώρες πριν, Πέτρος είπε

Είμαι σχεδόν σίγουρος ότι το 18 το έχω δοκιμάσει και δεν του άρεσε. Το ξαναβλέπω, όμως.

Αυτό το 60 κι εμένα δεν μου καθόταν καλά, θα το τσεκάρω πρώτο.

Το 60ρι πέταξε αρκετά λάθη στο ΤΜ5, διαφόρων ειδών.

Ίσως να σώζεται με λίγο ψάξιμο, αλλά δεν το βλέπω.

Το 18ρι παίρνει σειρά το απόγευμα.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

2 ώρες πριν, petasis είπε

 

Ο λόγος του RMA είναι αυτός που καταγράφουν τα logs εδώ:

https://www.dropbox.com/sh/wbhadgrtlsqmv83/AADDrAntGjCK5NelrRCXBFWHa?dl=0

Το σύστημα κολλάει. Δεν υπάρχει ένδειξη ότι φταίει η μνήμη. Αυτά τα κολλήματα είναι με τις μνήμες στο XMP 18-22-22 (το 1ο προφίλ) και την συχνότητα κατεβασμένη στα 3200. Τις έχω κατεβάσει καιρό. Όλα τα άλλα στο default.

Επίσης, το ρεζιλίκι συνεχίζεται:

Τώρα ζητάνε και φωτογραφία του επεξεργαστή εκτός μητρικής.

Μάλλον το έχουν κάνει πιο απαιτητικό το RMA, εμένα τους έκανε και η photo του serial στο κουτί (είδα τα email που είχαμε ανταλλάξει).

Στο θέμα τώρα των crashes, βλέπω όλα ξεκινάνε από κάποιο πρόβλημα στο bfq. Δε δοκιμάζεις να χρησιμοποιήσεις mq-deadline; Ο bfq δεν είναι default σε debian/ubuntu. Βλέπω είναι default σε fedora από R31 και μετά

  • Like 1
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

@petasis μιάς και εισαι σε Linux είναι πιθανό να τρέξεις ένα GSAT για κανα 2ωράκι να δούμε τι παίζει ? Το συγκεκριμένο είναι για να τεστάρει 126 απο τα 128GB μνήμης και κρατάει 2 ώρες και κάτι ψηλά

sudo apt install stressapptest

 

stressapptest -W -M 126000 -s 7200 --pause_delay 14400
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

1 ώρα πριν, malakudi είπε

Μάλλον το έχουν κάνει πιο απαιτητικό το RMA, εμένα τους έκανε και η photo του serial στο κουτί (είδα τα email που είχαμε ανταλλάξει).

Στο θέμα τώρα των crashes, βλέπω όλα ξεκινάνε από κάποιο πρόβλημα στο bfq. Δε δοκιμάζεις να χρησιμοποιήσεις mq-deadline; Ο bfq δεν είναι default σε debian/ubuntu. Βλέπω είναι default σε fedora από R31 και μετά

Κοίταξα όλα τα block devices (εκτός τα loop), και έχω:

1) Σε όλα τα raid, o scheduler είναι none.

2) Σε όλους τους sata δίσκους ο scheduler είναι: "mq-deadline kyber [bfq] none"

3) Στους 2 nvme είναι: "[none] mq-deadline kyber bfq"

Δεν βρήκα που γίνεται η επιλογή (στο /etc/udev/rules.d δεν βρήκα κάποια αναφορά).

Εντάξει αξίζει μια δοκιμή (άντε πάλι 🤣 έχω βαρεθεί τις δοκιμές 9 μήνες τώρα...)

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημοσ. (επεξεργασμένο)
7 λεπτά πριν, petasis είπε

Κοίταξα όλα τα block devices (εκτός τα loop), και έχω:

1) Σε όλα τα raid, o scheduler είναι none.

2) Σε όλους τους sata δίσκους ο scheduler είναι: "mq-deadline kyber [bfq] none"

3) Στους 2 nvme είναι: "[none] mq-deadline kyber bfq"

Δεν βρήκα που γίνεται η επιλογή (στο /etc/udev/rules.d δεν βρήκα κάποια αναφορά).

Εντάξει αξίζει μια δοκιμή (άντε πάλι 🤣 έχω βαρεθεί τις δοκιμές 9 μήνες τώρα...)

echo mq-deadline > /sys/block/sdX/queue/scheduler για προσωρινή αλλαγή

elevator=mq-deadline σαν command line parameter στον kernel (από το grub) για μόνιμα

Δοκίμασέ το μπας και ... Το workload που χρησιμοποιείς κάνει heavy disk i/o στους sata;

 

Επεξ/σία από malakudi
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

18 λεπτά πριν, malakudi είπε

echo mq-deadline > /sys/block/sdX/queue/scheduler για προσωρινή αλλαγή

elevator=mq-deadline σαν command line parameter στον kernel (από το grub) για μόνιμα

Δοκίμασέ το μπας και ... Το workload που χρησιμοποιείς κάνει heavy disk i/o στους sata;

 

Όχι, δεν νομίζω. Γενικά, ο υπολογιστής ψιλοκάθεται, το cpu load είναι χαμηλό, το I/O load επίσης (1-2 ΜΒ/sec). Η πιο "βαριά" βάση είναι ένα elasticsearch.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

6 ώρες πριν, Devastor είπε

@petasis μιάς και εισαι σε Linux είναι πιθανό να τρέξεις ένα GSAT για κανα 2ωράκι να δούμε τι παίζει ? Το συγκεκριμένο είναι για να τεστάρει 126 απο τα 128GB μνήμης και κρατάει 2 ώρες και κάτι ψηλά


sudo apt install stressapptest

 


stressapptest -W -M 126000 -s 7200 --pause_delay 14400

Δεν βρήκε κάποιο πρόβλημα.

2021/10/05-19:34:29(EEST) Stats: Found 0 hardware incidents
2021/10/05-19:34:29(EEST) Stats: Completed: 220581776.00M in 7200.94s 30632.37MB/s, with 0 hardware incidents, 0 errors
2021/10/05-19:34:29(EEST) Stats: Memory Copy: 220581776.00M at 30634.83MB/s
2021/10/05-19:34:29(EEST) Stats: File Copy: 0.00M at 0.00MB/s
2021/10/05-19:34:29(EEST) Stats: Net Copy: 0.00M at 0.00MB/s
2021/10/05-19:34:29(EEST) Stats: Data Check: 0.00M at 0.00MB/s
2021/10/05-19:34:29(EEST) Stats: Invert Data: 0.00M at 0.00MB/s
2021/10/05-19:34:29(EEST) Stats: Disk: 0.00M at 0.00MB/s
2021/10/05-19:34:29(EEST) 
2021/10/05-19:34:29(EEST) Status: PASS - please verify no corrected errors
2021/10/05-19:34:29(EEST)

Μείωσα λίγο την μνήμη, γιατί έμπαινε στο swap.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

38 λεπτά πριν, petasis είπε

Δεν βρήκε κάποιο πρόβλημα.

Το πρόβλημα σου δεν εμφανίζεται υπό πίεση.

Μάλλον για driver/scheduler πρόβλημα μοιάζει ή κάτι με τα C-states της CPU παίζει.

Θα δοκίμαζα απενεργοποίηση low-power c-states από το bios για αρχή.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα

  • Δημιουργία νέου...