[FreeBSD][resolu] Freezes et reboot aléatoires

On va commencer par la config hard et soft :

asrock ks41gx
thunderbird 1400
256 mo DDR (mushkin si je me souviens bien)

FreeBSD 6.2-RELEASE (kernel par defaut)
samba3, pueftpd, apache 2, php5, ror, postfix 2.3

Le gros point noir c’est que ce serveur est chez mes parents en France, pendant que je fais mes études au Canada. Donc l’accès physique au serveur, on va considerer que je l’ai pas.

Apperement de temps en temps le serveur freeze et quelqu’un le redemarre avec le bouton reset et certaines fois le serveur a l’air de redemarrer tout seul (a priori personne n’a touché au bouton reset)

Au niveau des logs, j’ai redirigé tout ce qui n’etait pas logué par defaut vers un ficheir de log global mais aucune information interessante ne semble apparaitre (j’ai des messages de samba qui trouve pas l’imprimante mais normalement c’est pas lethal ce genre de messages et le seul message que j’ai au moment du reboot, c’est la sequence de boot : detection du materiel, …)

J’ai pensé à un probleme materiel sinon, le processeur est du genre très calorifique mais en verifiant les temperatures, je monte jamais au dessus de 60° (même avec une très forte charge avec un mprime torture test par exemple) Donc a priori, on peut éliminer la surchauffe processeur.

Je cherche donc des pistes, sur ce qui pourrait provoquer ces bugs et comment faire pour identifier la source de ces bugs.

En général des crashs sans “kernel panic” signalent un soucis hardware. Une vérification RAM s’impose dans un premier temps…

Tu as un economiseur d’écran qui tourne dessus ?

Ah moi je pense que c’est plutot lié au theme “luna” essaie de passer en windows classic B)

J’ai pas compris la blague, c’est un serveur de fichier à la base donc j’ai pas de session X qui tourne (meme pas sur que X11 soit installé dessus) donc l’économiseur d’écran y’en a pas.

Bon ben alors un probleme hardware probablement.

RAM
Gestion foireuse de l’ACPI
Un element de ta carte mere (chipset ou autre) qui supporte moins bien la chaleur que ton CPU.
Un chat farceur qui appuie sur le bouton reboot (non, ce n’est pas une vanne ça m’est arrivé…)

Bon courage, surtout à distance B)

Sur le matériel foireux, et notamment les Asrock, les éco d’écran X11 ont des effets ravageurs. Un problème matériel, encore une fois, et typiquement Asrockesque. Le SAV t’explique gentiment que DTC, de plus: trop merci. Généralement, il s’agit d’une dégradation irréversible de la carte…

Sinon, aussi, il est possible qu’un chipset chauffe trop. Dans ce cas, à part mettre les doigts dessus, je sais pas comment faire. Récemment, j’ai eu le cas où le chip qui chauffait trop n’avait pas de sonde (et où sa réfrigération a tout réglé).

T’as essayé de faire une compilation assez longue pour voir si la machine tenait le coup ?

Bon j’ai fais modifié les reglages BIOS à distance. Maintenant le processeur est passé en fsb66 et la ram en fsb133. Le memtest passe sans problèmes. Là j’ai lancé une grosse compilation pour voir.

A priori, en reglage “normal” pour la ram, la ram était desynchronisée et fonctionnait en DDR400, donc le chipset devait chauffer comme en fsb200. Il est refroidi passivement si je me souviens bien en plus.

Edit : Apres plus de 12h de compilation et mprime -t en concurrence, aucun bug à signaler. Je pense que le problème est reglé.