View previous topic :: View next topic |
Author |
Message |
BuBuaBu l33t
Joined: 09 Jul 2005 Posts: 914 Location: France
|
Posted: Sat Sep 29, 2007 11:23 pm Post subject: [lockups] l'ordi freeze en smp |
|
|
Bonjour,
J'ai un ordi, Bi-pentium III avec 4 NIC en pci.
Il me sert de serveur.
Pourtant je doit faire face a un serieux problème, il freez un peu nimporte quand, sans erreur.
J'ai déjà essayer :
-avec et sans acpi (deactiver dans le kernel et le bios)
-controlé la temperature des processeurs
-Effectué un Memtest pendant plusieur heures sans erreur
-remplacer les deux processeur la carte mère et l'alim
-forcer les test interne du disque dur (smart) pas d'erreur.
Bref je vois pas du tout d'où ça peu venir,lors de mes tests j'ai quand même pu voir que lorsque que je met seulement 1 processeur, ça ne plante plus.
J'ai testé pas mal d'autres choses, mais là je suis a cour d'idées. |
|
Back to top |
|
|
kwenspc Advocate
Joined: 21 Sep 2003 Posts: 4954
|
Posted: Sun Sep 30, 2007 11:13 am Post subject: |
|
|
Et qui des cartes réseaux? Essais avec 2 (en les faisant tourner), puis 3 puis 4. _________________ membre officieux du SAV Ati GEntoo |
|
Back to top |
|
|
BuBuaBu l33t
Joined: 09 Jul 2005 Posts: 914 Location: France
|
Posted: Sun Sep 30, 2007 8:37 pm Post subject: |
|
|
kwenspc wrote: | Et qui des cartes réseaux? Essais avec 2 (en les faisant tourner), puis 3 puis 4. |
Les cartes réseaux fonctionnent parfaitement, puisqu'il n'y a pas de problème avec un seul processeur.
Si ce test est pour vérifier les irq par exemple, chaque carte a un irq propre, et non partagé avec une autre ressource. |
|
Back to top |
|
|
kwenspc Advocate
Joined: 21 Sep 2003 Posts: 4954
|
Posted: Mon Oct 01, 2007 5:47 am Post subject: |
|
|
Il est pas complètement certain que les cartes réseaux fonctionnent bien juste parce qu'elle tournent sans problème en mono-cpu. Le SMP n'implique pas seulement les CPU mais aussi le partage des ressources etc... Ce qui fait que les drivers de tes cartes réseaux doivent aussi mettre en place certains mécanismes pour fonctionner en configuration SMP.
Ceci dit oui ce serait vraiment bizarre qu'elles ne déconnent qu'en config SMP.
Sinon est ce que ces erreurs sont apparus après un changement de noyau ou bien juste comme ça pouf?
Parce que la dernière option que je vois c'est le chipset... _________________ membre officieux du SAV Ati GEntoo |
|
Back to top |
|
|
BuBuaBu l33t
Joined: 09 Jul 2005 Posts: 914 Location: France
|
Posted: Mon Oct 01, 2007 6:47 am Post subject: |
|
|
Je viens d'asselmbler cette machie, donc le plantage a toujours été là.
Pour m'assurer que çe ne vienne pas d'un default sur le matos j'ai changer, la carte mère et les processeurs
(les deuc config étaient équivalente, chipset 440BX, et pentium III 550Mhz) |
|
Back to top |
|
|
kwenspc Advocate
Joined: 21 Sep 2003 Posts: 4954
|
Posted: Mon Oct 01, 2007 6:53 am Post subject: |
|
|
Alors peut-être un défaut de config kernel. Genre essais avec/sans APIC (faut que ce soit présent dans le BIOS aussi), avec/sans HPET etc...
Bon courage! _________________ membre officieux du SAV Ati GEntoo |
|
Back to top |
|
|
BuBuaBu l33t
Joined: 09 Jul 2005 Posts: 914 Location: France
|
Posted: Mon Oct 01, 2007 5:59 pm Post subject: |
|
|
Alors, sans l'APIC, les interuptions ont lieu sur un seul processeurs, pas top
Sans l'HPET, au bout de deux heures, il y a un gros déséquilibre sur les interuption :
Code: | # cat /proc/interrupts
CPU0 CPU1
0: 58 0 IO-APIC-edge timer
1: 2 0 IO-APIC-edge i8042
8: 2 0 IO-APIC-edge rtc
9: 0 0 IO-APIC-fasteoi acpi
12: 4 1 IO-APIC-edge i8042
14: 1907 87473 IO-APIC-edge ide0
16: 275589 156718 IO-APIC-fasteoi eth0
17: 250557 44347 IO-APIC-fasteoi fbx1
18: 57572 133908 IO-APIC-fasteoi fbx0
19: 1 0 IO-APIC-fasteoi lan0
20: 2549230 2286411 IO-APIC-fasteoi wifi0
NMI: 0 0
LOC: 708118 708117
ERR: 0
MIS: 0
|
Avant tout été bien équilibré.
2h d'uptime ne me suffit pas a dire que le server ne plante plus, mais ce deséquilibre ne m'enchante guère, ça doit pas être top au niveau perfs. |
|
Back to top |
|
|
kwenspc Advocate
Joined: 21 Sep 2003 Posts: 4954
|
Posted: Mon Oct 01, 2007 6:09 pm Post subject: |
|
|
Code: |
# cat /proc/interrupts
CPU0 CPU1
0: 8273033 0 IO-APIC-edge timer
1: 6967 0 IO-APIC-edge i8042
8: 1 0 IO-APIC-edge rtc
9: 0 0 IO-APIC-fasteoi acpi
12: 4 0 IO-APIC-edge i8042
16: 1 0 IO-APIC-fasteoi uhci_hcd:usb3, fglrx
17: 0 0 IO-APIC-fasteoi uhci_hcd:usb4
18: 0 0 IO-APIC-fasteoi ehci_hcd:usb1, uhci_hcd:usb7
19: 109489 0 IO-APIC-fasteoi libata, libata, uhci_hcd:usb6, eth0
21: 3 0 IO-APIC-fasteoi ohci1394
22: 184650 0 IO-APIC-fasteoi EMU10K1
23: 12572 0 IO-APIC-fasteoi ehci_hcd:usb2, uhci_hcd:usb5
NMI: 727 484
LOC: 8114994 8114949
ERR: 0 |
Je dirais plutôt que je suis dans le cas d'un "déséquilibre" des interruptions. (SMP sur un Core 2 Duo, et pourtant y a l'APIC).
Je trouve au contraire que ça ce balance convenablement chez toi. (ce qui me rapelle mon ancien Bi-P3 et ça fonctionnait bien comme ça.)
Alors en aucun cas - du moins que je sache - ça n'a de répercution sur les performances. Donc ne t'inquiète pas à ce sujet. Le balancement est en principe bien géré, c-a-d qu'au moment où tel CPU à une interruption c'est qu'il a ce qu'il faut en cache pour la géré. Je ne crois pas que ce soit un soucis. Et je pense même que sans l'APIC, même si un seul CPU gère tout, ça doit pas poser problème. De toute manière on a tellement de perte de perfs à cause de l'attente des données sur ces CPU (becoze la plupart du temps il attendent les données venant de la ram, et y a pas 1 Bus et une MMU pour 2...On est loin de l'HyperTransport sur les Optéron, du bus et de la ram dédiée pour chaque CPU snifff) que les interruptions sur un seul CPU ça doit pas franchement changer la donne (ni dans le pire ni dans le meilleur). _________________ membre officieux du SAV Ati GEntoo |
|
Back to top |
|
|
dapsaille Advocate
Joined: 02 Aug 2004 Posts: 2366 Location: Paris
|
Posted: Tue Oct 02, 2007 9:03 am Post subject: |
|
|
+1
Code: |
florent@FLO ~ $ cat /proc/interrupts
CPU0 CPU1
0: 351 0 IO-APIC-edge timer
1: 2 0 IO-APIC-edge i8042
2: 0 0 XT-PIC-XT cascade
6: 5 0 IO-APIC-edge floppy
12: 4 0 IO-APIC-edge i8042
16: 6411198 0 IO-APIC-fasteoi ahci, uhci_hcd:usb3, nvidia
17: 437425 0 IO-APIC-fasteoi libata, uhci_hcd:usb4
18: 0 0 IO-APIC-fasteoi ehci_hcd:usb1, uhci_hcd:usb7
19: 0 0 IO-APIC-fasteoi sk98lin, uhci_hcd:usb6
21: 623 0 IO-APIC-fasteoi firewire_ohci
22: 143817 0 IO-APIC-fasteoi HDA Intel
23: 158443 0 IO-APIC-fasteoi ehci_hcd:usb2, uhci_hcd:usb5
218: 222311 0 PCI-MSI-edge ahci
219: 338145 0 PCI-MSI-edge eth0
NMI: 0 0
LOC: 39800739 39800732
ERR: 0
MIS: 0
florent@FLO ~ $
|
|
|
Back to top |
|
|
kwenspc Advocate
Joined: 21 Sep 2003 Posts: 4954
|
Posted: Tue Oct 02, 2007 9:09 am Post subject: |
|
|
Après je me disais qu'il y a aussi (sans doute même) le chipset qui joue sur la gestion SMP. Donc le fait que sur nos C2D on ait la plupart des interruptions sur un CPU vient peut-être uniquement du chipset lui même.
Sinon BuBuaBu, si mes souvenirs sont bons je croit bien que jamais je ne mettais le support HPET sur mon Bi-P3. Au fait, est ce que ça tourne toujours ou bien as tu eu droit à un freeze? _________________ membre officieux du SAV Ati GEntoo |
|
Back to top |
|
|
|