[PC]crashs intempestifs

Salut à tous,
Je viens vers vous avec une question concernant la santé de mon PC. Il lui arrive très régulièrement (environ une fois toutes les semaines) de planter sans préavis, sans même qu’il soit forcément en train d’être utilisé (ça arrive souvent en pleine nuit, je le retrouve rebooté le matin).
Je vous mets la page de l’observateur d’évènements système Windows :

Elle ne raconte pas grand-chose à part la sempiternelle erreur 41 que je suis incapable d’expliquer ou de diagnostiquer.
J’avoue à la fois ne pas trop savoir vers quelle solution me tourner et me sentir découragé d’avance sur les recherches à entreprendre, tellement ça me semble potentiellement complexe. En ça, je vois bien que je n’ai plus le même âge et que j’aspire à avoir une machine qui fonctionne sans avoir à mettre les mains dans le cambouis (enfin la poussière et les câbles).

Bref, petit récapitulatif de la configuration :

  • CPU Ryzen 5 3600
  • CM Asus Prime B450M-K (BIOS à jour)
  • 2 barrettes de DDR4 Kingstom 8Go
  • 1 SSD + 1 HDD
  • CG GTX1660 PNY
  • le tout sous Windows 11 à jour

J’ai récemment eu l’insigne honneur d’assister à un plantage pendant que je faisais de la peinture de figurines en écoutant de la musique depuis le PC, le son s’est mis à boucler, tout s’est figé, ça a duré quelques secondes et ça a rebooté.

L’erreur 41 signifie qu’au reboot windows s’aperçoit que le système n’a pas été éteint proprement. C’est un message généré au boot et non pas au crash, comme expliqué ici :

Il faudrait avoir le log antérieur et voir si une des autres erreurs en rouge ne serait pas significative. Pour ce que ça vaut, Microsoft a une page de troubleshooting pour ladite erreur 41:

En particulier :
If your computer shuts down unexpectedly, Windows logs Event ID 41 the next time that the computer starts. The event text resembles the following information:

Event ID: 41  
Description: The system has rebooted without cleanly shutting down first.

This event indicates that some unexpected activity prevented Windows from shutting down correctly. Such a shutdown might be caused by an interruption in the power supply or by a Stop error. If feasible, Windows records any error codes as it shuts down. During the kernel phase of the next Windows startup, Windows checks for these codes and includes any existing codes in the event data of Event ID 41.

EventData  
BugcheckCode 159  
BugcheckParameter1 0x3  
BugcheckParameter2 0xfffffa80029c5060  
BugcheckParameter3 0xfffff8000403d518  
BugcheckParameter4 0xfffffa800208c010  
SleepInProgress false  
PowerButtonTimestamp 0Converts to 0x9f (0x3, 0xfffffa80029c5060, 0xfffff8000403d518, 0xfffffa800208c010)  

En gros il nous faudrait le détail de l’event 41 :wink:

Ce genre de symptômes ( tout qui freeze avec son qui boucle et passe dans les aigus avant reboot) me fait penser à un problème matériel sur mémoire vive (autant système que CG, mais plutôt système) ou SSD. A voir si ça peut coller avec un des messages d’erreur de l’event log, possibilité aussi de tester lesdites mémoires avec un utilitaire genre memtest (c’est long et un peu chiant, mais ça se fait très bien la nuit :wink: )

Bon courage, ce genre de problème sans vraiment de symptôme spécifique c’est la galère à investiguer …

1 « J'aime »

Le PC a quel age?
Question qui va lead sur « as tu changé la pile du bios? »

Et tu vois, c’est con, mais ce matin, je relançais mon pc de test et il m’a sorti une infamante erreur « CPU Fan Error », j’ai tout éteint, vérifié le ventilo cpu, tout va bien, je relance, même erreur alors que le ventilo tourne correctement (je le vois tourner), je vais dans le BIOS et là, je vois que la date est en 2012…

(oui ca parait pas logique, mais en fait si, le bios a une limite basse par défaut du cpu fan a 600 rpm et mon ventilo tourne, de base, a 580rpm… Il suffit de passer a 500rpm en limite basse pour que ca fonctionne, et c’est a la pile de garder le réglage…)

1 « J'aime »

Un jour tu verras la lumière et t’achèteras un Mac :slightly_smiling_face:
Désolé, j’ai eu exactement le même symptôme de « ça marche pas, ça me gave » il y a quelques années, et rien que de lire ton message, je suis fatigué !
Bon courage en tout cas, et pour ne pas poster inutile, il y a bien longtemps ça m’était arrivé, et c’était l’alimentation

3 « J'aime »

Il date de janvier 2021, c’est pas si vieux. Je vais creuser vos réponses, mais je rejoins @fabiouchka je pense vraiment que la prochaine bécane ne sera pas un PC.

2 « J'aime »

Tente de désactiver le c-state de ton processeur et regarde si ca s’améliore

In the bios, Advanced menu, CPU configuration, scroll to bottom, CPU Power Management, CPU C-States, Disable.

J’ai eu du mal à le trouver dans le BIOS, ce n’était pas exactement à cet endroit, mais j’ai modifié ce paramètre. À suivre d’ici 10-15 jours, si je n’ai pas eu de crash.

Au cas ou : si tu as un eco mode actif : vire le

Dans le BIOS aussi je suppose ?

Désactiver les c-state c’est exactement ça. Le proc est équipé d’états C0, C1, C2, etc… qui désactivent au fur et à mesure des fonctions pour utiliser moins d’energie.
(plus d’infos ici: http://hardwaresecrets.com/everything-you-need-to-know-about-the-cpu-c-states-power-saving-modes/)

J’ai l’impression qu’au début ça marche bien et au fur et à mesure ça se met à déconner et j’en viens à soupçonner que les Ryzen ne vieillissent pas très bien (silicon lottery ?)

Edit: Ajout d’une vidéo d’Anthony (de LTT) qui règle un souci similaire

1 « J'aime »

si tu poses la question c’est certainement que tu ne l’as pas modifié : moi je l’avais fait via le logiciel « amd ryzen master »

Bon, mauvaise piste : le PC a crashé tout seul à 18h30 aujourd’hui. :confused:

Exporte le log d’event correctement et paste le ici.

1 « J'aime »

Lequel ? Celui de l’erreur 41 ou je vais chercher le plus tôt possible dans l’ordre des erreurs ?

L’erreur 41 ci-après :

Nom du journal :System
Source : Microsoft-Windows-Kernel-Power
Date : 02/01/2025 18:24:37
ID de l’événement :41
Catégorie de la tâche :(63)
Niveau : Critique
Mots clés : (70368744177664),(2)
Utilisateur : Système
Ordinateur : DESKTOP-JSIRJ27
Description :
Le système a redémarré sans s’arrêter correctement au préalable. Cette erreur peut survenir si le système ne répond plus, s’est bloqué ou n’est plus alimenté de façon inattendue.
XML de l’événement :

<Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
<System>
 <Provider Name="Microsoft-Windows-Kernel-Power" Guid="{331c3b3a-2005-44c2-ac5e-77220c37d6b4}" />
    <EventID>41</EventID>
    <Version>10</Version>
    <Level>1</Level>
    <Task>63</Task>
    <Opcode>0</Opcode>
    <Keywords>0x8000400000000002</Keywords>
    <TimeCreated SystemTime="2025-01-02T17:24:37.2118245Z" />
    <EventRecordID>2902</EventRecordID>
    <Correlation />
    <Execution ProcessID="4" ThreadID="8" />
    <Channel>System</Channel>
    <Computer>DESKTOP-JSIRJ27</Computer>
    <Security UserID="S-1-5-18" />
  </System>
  <EventData>
    <Data Name="BugcheckCode">307</Data>
    <Data Name="BugcheckParameter1">0x0</Data>
    <Data Name="BugcheckParameter2">0x500</Data>
    <Data Name="BugcheckParameter3">0x500</Data>
    <Data Name="BugcheckParameter4">0xfffff805dbdc33a0</Data>
    <Data Name="SleepInProgress">0</Data>
    <Data Name="PowerButtonTimestamp">0</Data>
    <Data Name="BootAppStatus">0</Data>
    <Data Name="Checkpoint">0</Data>
    <Data Name="ConnectedStandbyInProgress">true</Data>
    <Data Name="SystemSleepTransitionsToOn">0</Data>
    <Data Name="CsEntryScenarioInstanceId">46</Data>
    <Data Name="BugcheckInfoFromEFI">false</Data>
    <Data Name="CheckpointStatus">0</Data>
    <Data Name="CsEntryScenarioInstanceIdV2">46</Data>
    <Data Name="LongPowerButtonPressDetected">false</Data>
    <Data Name="LidReliability">false</Data>
    <Data Name="InputSuppressionState">0</Data>
    <Data Name="PowerButtonSuppressionState">0</Data>
    <Data Name="LidState">3</Data>
    <Data Name="WHEABootErrorCount">0</Data>
  </EventData>
</Event>


Je copie/colle une image en plus parce que j’ai l’impression que le forum interprète une partie du code du message d’erreur.

J’ai édité ton message, il faut mettre le code entre </>

1 « J'aime »

Un event surtout quand c’est celui du reboot, donc bien trop tard, ca va pas suffire.
Il faut TOUT le log, pas juste un event.


Et tu file le evtx (en private si tu as peur qu’il y ait des infos confidentielles dedans)

Si tu as un dump généré dans C:\Windows\Minidump, tu peux essayé de le lire avec WinDbg.

C’est comme ça que j’avais réussi à mettre le doigt sur l’app de merde qui faisait planter mon PC une fois sur deux en retour de veille.

Comme dans le lien que j’ai mis plus haut, on voit que dans ton event log 41, on a un event data avec le bugcheckcode 307, ce qui en hexadécimal donne 133. En consultant la table de référence des bugcheckcodes, on tombe sur DPC_WATCHDOG_VIOLATION.

Le paramètre 0 est à 0, donc on dans la première ligne du tableau, donc

A single DPC or ISR exceeded its time allotment. The offending component can usually be identified with a stack trace.

En gros y a un composant qui a pas répondu pendant 500 ticks et le PC a planté. Je mis toujours sur un problème SSD ou RAM, et potentiellement si c’est SSD ça peut juste être un driver ou firmware pas à jour.

Pour creuser plus loin, faut consulter la rubrique Cause de l’article que je viens de linker et analyser le dump du crash ou du noyau avec WinDbg comme indiqué par @Pollux , ou avec !analyze (extension de WinDbg).

1 « J'aime »

Voici le log complet :
ça c’est le dossier application :
bug.zip (337,5 Ko)

ça c’est le dossier système :
bug2.zip (247,0 Ko)

Par contre, j’ai installé WinDbg, ouvert le dernier fichier MiniDump qui correspond à la date du dernier évènement, mais j’avoue être un peu perplexe devant la vue et ne pas savoir quoi y faire :

edit : j’ai installé l’utilitaire pour mon SSD Kingston, pas de mise à jour de firmware à faire. Ça m’a l’air plus compliqué pour le HDD Seagate, je cherche encore.
edit2 : pas de maj disponible pour le HDD non plus finalement.

1 « J'aime »

Donc, merci pour les events, ya pas de coupable tout designé, mais, il y a quand meme pas mal de trucs a creuser.

  1. il semble y avoir pas mal d’erreur d’io sur
    An error was detected on device \Device\Harddisk2\DR2 during a paging operation.
    Ca peut ne pas etre grave (dans le cadre d’u CD ou d’une clé usb en read only, mais ca peut aussi etre un symptome d’un souci plus profond sur le dit disque).

  2. il semble y avoir pas mal de service en galere au demarrage, en vrac:

  • GameInput Service service
  • Radarr
  • Sonarr
  • Service Google Update (gupdate) service
  • Razer Synapse Service.exe
  1. Parmis ces services, beaucoup (genre beaucoup) essayent d’ouvrir des ports freestyle sur la machine, c’est ptet pas necessaire.
  • Razer Chroma SDK\bin\RzSDKServer.exe plus tout les trucs mentionnés ci dessus.
  1. ya aussi un event louche: Event ID 162 at DuckDuckGo

Perso, avant de commencer a fouiller dans les dump (surtout si tu y connais rien, ca va etre rude) je ferais:

  1. du menage sur les soft et/ou services susmentionnés, en les desactivant ou les desinstallant.
  2. un check/update des drivers de la CM/Network/etc et du bios.
  3. debrancher un disque ou l’autre, pour voir si ca change quelque chose.
  4. Passer un coup de driver verifier (attention, c’est velu aussi) et commencer a lire la doc de windbg :grimacing:
1 « J'aime »