| View previous topic :: View next topic |
| Author |
Message |
mdk Apprentice


Joined: 30 Sep 2004 Posts: 243 Location: Warsaw / Poland
|
Posted: Sat Mar 19, 2005 1:38 pm Post subject: [X] Deadlock |
|
|
Nie wiem czy śledzicie inne fora, ale być może zauważyliście posty o b. podejrzanym problemie związanym z X'ami. System "zamraża się" (najczęściej - podczas korzystania z mozillowatych aplikacji, choć nie tylko), widać kursor myszy (można nim ruszać) ale klawiatura jest niefunkcjonalna i nic nie da się zrobić/kliknąć. System (zazwyczaj) jednak "działa", i można się do niego zalogować np. przez SSH.
Problem jest b. podejrzany bo:
1. Występuje zarówno na Xorg jak i Xfree
2. Nie jest zależny od sterowników karty graficznej (ATI, NVIDIA)
3. Nie jest zależny od jądra (2.4, 2.6)
4. W innych dystrybucjach nie występuje, lub występuje b. rzadko.
5. U jednych występuje 5 razy dziennie, u innych raz na miesiąc.
Główne posty o problemie:
http://forums.gentoo.org/viewtopic-t-198023.html
http://forums.gentoo.org/viewtopic.php?t=215629
(i mnóstwo innych. Keywords: xorg freeze lockup)
Nie udało się znaleźć żadnej jednoznacznej przyczyny/rozwiązania tego problemu. Różnym ludziom pomagały (lub zmniejszały częstotliwość występowania) róźne rzeczy, np:
1. Zmiana metalog na syslog
2. Zmiana syslog na metalog
3. Zmiana reiserfs na ext3
4. Wyłączenie ACPI
6. Zmiana sterownika NVIDI, downgrade, upgrade, wyłączenie Sideband addressing.
7. Sztywne IRQ dla karty graficznej w biosie
8. Przejście z Gnome na KDE
9. Przejście z KDE na XFCE
Spotkaliście się z tym? U mnie pojawiło się magicznie parę dni temu przy okazji upgrade'u do xorg-x11 6.8.2-r1. W ciągu dwóch godzin "trafiły" mi się trzy "zmrożenia". Od razu zrobiłem downgrade z powrotem do xorg-x11 6.8.0... i od tego czasu (trzy dni?) trafiło mi się jedno "zmrożenie" (wcześniej nigdy się z tym nie spotkałem!)
??? _________________ Michael Dominic K.
www.mdk.org.pl |
|
| Back to top |
|
 |
bacouch Apprentice

Joined: 08 Jun 2002 Posts: 168 Location: Szczecin/Poland
|
Posted: Sat Mar 19, 2005 1:50 pm Post subject: |
|
|
| Mi sie pojawialy ostatnio bardzo czesto szczegolnie jak probowalem odpalic cos z kde 3.4, ale kiedy zdowngradeowalem sterowniki nvidii do 6629-r4 z 7167 wszystko wrocilo do normy i poki co dziala bezproblemowo(jakies 3 dni). |
|
| Back to top |
|
 |
m@niac! Tux's lil' helper

Joined: 29 Jan 2005 Posts: 77
|
Posted: Sat Mar 19, 2005 4:15 pm Post subject: |
|
|
ja staram sie miec system jak najbardziej aktualny, zawsze najnowsze drivery, xorg6.8.2, kde3.4, nigdy nie mialem zadnych freezow.
jedyne co mi sie zdarzylo to sie komp sam zresetowal ale dlatego ze byl pod wplywem 18godzinnej kompilacji i nagle wydarzyl sie skok napiecia. a tak to zadnych problemow. _________________ linux is like a wigwam - no windows, no gates, with an apache inside |
|
| Back to top |
|
 |
fallow Bodhisattva


Joined: 08 Jan 2004 Posts: 2206 Location: Poland
|
Posted: Sat Mar 19, 2005 5:10 pm Post subject: |
|
|
[wersja_szybka]
musze teraz wyjsc i nie studiuje wszystkich materialow ktore swietnie tutaj opisales ( zrobie to pozniej ) - tak czy siak wlasnie taki problem mam ze sterownikami nvidi 7167 . pomogl mi downgrade do 6629. u mnie "dzialo " sie to przy wlaczonym composite i probie przeciagniecia okna mozilli . dokladnie - wtedy kiedy w driverze nvidii wlaczony byl renderaccel , jesli byl wylaczony wszystko bylo ok. zglosilem ten blad na bugsy xfce gdzie powiedzieli ze to blad nvidii i zebym sprobowal zmniejszyc agprate i wylaczyc sba - nie pomoglo , od nvidii nie dostalem zadnych odpowiedzi , a spotkalem sie z opiniami ze starsze modele geforcow wywaluja takie objawy ( albo raczej odwrotnie ) z nowymi driverami .
moja karta to geforce 2 GTS.
[/wersja_szybka]
cheers. _________________ "Time is a companion that goes with us on a journey. It reminds us to cherish each moment, because it will never come again. What we leave behind is not as important as how we have lived" J-L. Picard |
|
| Back to top |
|
 |
mirekm Apprentice


Joined: 12 Feb 2004 Posts: 152 Location: Gliwice
|
Posted: Sat Mar 19, 2005 5:51 pm Post subject: |
|
|
Mam ten sam problem.
U mnie pomogło nie ładowanie drivera ac z ACPI.
Obserwowałem dość długo ten problem i szczerze nie wiem co jest przyczyną,
ale zauważyłem, że przerwanie timera (irq0) przestaje działać, pomimo że przerwanie LOC na procesorze hula.
W momenice kiedy irq0 stanie to w zasadzie jest już koniec pod x-ami. |
|
| Back to top |
|
 |
mdk Apprentice


Joined: 30 Sep 2004 Posts: 243 Location: Warsaw / Poland
|
Posted: Mon Mar 21, 2005 7:30 pm Post subject: |
|
|
| Quote: |
pomogl mi downgrade do 6629
|
No... jednak u mnie okazało się, że problemem też są sterowniki 7167. Nowy xorg tylko bardziej to "obnażył". Downgrade do 6629 pomógł. Podobno pomaga też mącenie z ustawieniami AGP, ale to tylko jedno z rozwiązań.
Problem tkwi gdzieś głębiej... w jednym z tych postów o identycznym efekcie/problemie pisze człowiek z iBookiem + ATI!
| Quote: |
jedyne co mi sie zdarzylo to sie komp sam zresetowal ale dlatego ze byl pod wplywem 18godzinnej kompilacji i nagle wydarzyl sie skok napiecia. a tak to zadnych problemow
|
Nie zdziw się, jak pewnego dnia się pojawi To wyskakuje jak diabełek z pudełka, ja też nie miałem problemów przez osatnie pół roku z nvidią.
| Quote: |
...zauważyłem, że przerwanie timera (irq0) przestaje działać, pomimo że przerwanie LOC na procesorze hula.
|
Po freezie u mnie zużycie procesora przez X'y szło do 100% (permanentnie). _________________ Michael Dominic K.
www.mdk.org.pl |
|
| Back to top |
|
 |
arsen Bodhisattva


Joined: 10 Apr 2004 Posts: 1803 Location: Tychy, Poland
|
Posted: Mon Mar 21, 2005 7:34 pm Post subject: |
|
|
Dodam że miałem podobne objawy na sterach 7167
Z tym że od razu po odpaleniu x-ów to mi się działo, po chwilowych męczarniach poszedł downgrade  |
|
| Back to top |
|
 |
Zwierzak Veteran


Joined: 19 Sep 2003 Posts: 1012 Location: /dev/null
|
Posted: Mon Mar 21, 2005 8:19 pm Post subject: |
|
|
| Musze sie przyznać że mi to właśnie występuje, i nawet nie wiedziałem ze może być to winą przegladraki. Jednak ja bez przegladarki żyć nie moge, było by tro jak odciecie polowy reki. Jedno jest pewne problemem jest Gecko, bo raczej nie sama mozilla skoro wystepuje to w kilku mozillach. |
|
| Back to top |
|
 |
keman Guru


Joined: 20 Mar 2005 Posts: 402 Location: Poland/Poznan
|
Posted: Mon Mar 21, 2005 8:32 pm Post subject: |
|
|
Ten sam problem, downgrade sterów nvidii pomogł. Teraz te najnowsze (7167-r1) mam zamaskowane.
Ludzie coś glendzili o spatchowaniu stera, ale nasze Gentoo samo patchuje podczas emergowania
Miałem jeszcze jeden ciekawy objaw na nowych sterach, i włączonym renderaccel, podczas uruchamiania nowego KDE3.4 system sie tak samo zamrażał na tym splash screenie. _________________ Collecting data is a step to wisdom, but sharing data is a step to community.
|
|
| Back to top |
|
 |
wojtek n00b


Joined: 19 Mar 2005 Posts: 65 Location: Krakow/Pszczyna, Poland
|
Posted: Mon Mar 21, 2005 8:49 pm Post subject: |
|
|
| mirekm wrote: | ale zauważyłem, że przerwanie timera (irq0) przestaje działać, pomimo że przerwanie LOC na procesorze hula.
W momenice kiedy irq0 stanie to w zasadzie jest już koniec pod x-ami. |
Mozna wiedziec jak to sprawidziles? Bo IMHO jak stanie IRQ0 to w ogole nici z przelaczania procesow i dalszej dzialalnosci sytemu... W kazdym razie do niedawana tak bylo. Teraz, w dobie APIC, ACPI i HPET to moze wygladac nieco inaczej. |
|
| Back to top |
|
 |
mirekm Apprentice


Joined: 12 Feb 2004 Posts: 152 Location: Gliwice
|
Posted: Tue Mar 22, 2005 5:08 pm Post subject: |
|
|
Sprawdziłem to podglądając /proc/interrupts
Ale doszedłem do tego przypadkiem, bo takie rzeczy jak kompilacja puszczam z konsoli
a w kosoli takie sprawy jak klawiatura chodzą nawet w przypadku zawieszenia timera 0.
Nie wiem dlaczego tak jest.
W każdym bądź razie nie zauważyłem, żeby był problem z innymi przerwaniami (tzn dyski, sieciówka, klwaiatura i myszka chodzą).
Natomiast wszystkie zadania wykorzystujące timery i opóźnienia śpią i czekają na swój czas, który nigdy nie nadchodzi. |
|
| Back to top |
|
 |
wojtek n00b


Joined: 19 Mar 2005 Posts: 65 Location: Krakow/Pszczyna, Poland
|
Posted: Tue Mar 22, 2005 6:18 pm Post subject: |
|
|
| mirekm wrote: | Sprawdziłem to podglądając /proc/interrupts
Ale doszedłem do tego przypadkiem, bo takie rzeczy jak kompilacja puszczam z konsoli
a w kosoli takie sprawy jak klawiatura chodzą nawet w przypadku zawieszenia timera 0.
Nie wiem dlaczego tak jest.
W każdym bądź razie nie zauważyłem, żeby był problem z innymi przerwaniami (tzn dyski, sieciówka, klwaiatura i myszka chodzą).
Natomiast wszystkie zadania wykorzystujące timery i opóźnienia śpią i czekają na swój czas, który nigdy nie nadchodzi. |
Hmm, na ile znam budowe kernela (a raczej nie jest mi aż tak obca) to brak przerwania IRQ0 skutkowal by brakiem mozliwosci wywlaszcznia procesow. Najprawdopodobniej cos w kernelu sie sypnelo z jego obsluga, ale samo przerwanie (dostarczne przez niezalezny sprzetowy uklad) nadal funkcjonowalo skoro mogles normalnie uzywac konsoli. Druga hipoteza (tez mozliwa), ze uzywasz ukladu HPET/APIC zamiast starego 8254 jako glownego przerwania timera (z tymi timerami to jest troche zakrecona sprawa, bo moze byc kilka zrodel czasowych w systemie, ale tylko jedno jest uzywane przez program szeregujacy jako sygnal odniesienia) co od pewnego czasu mozna wykorzystac w Linuksie i rzeczywiscie 8254 stoi, ale HPET/APIC dalej napedza system.
Szczegoly tutaj: http://www.cs.ucl.ac.uk/staff/a.greenhalgh/teaching/2b10/lecture_scheduling.pdf |
|
| Back to top |
|
 |
mdk Apprentice


Joined: 30 Sep 2004 Posts: 243 Location: Warsaw / Poland
|
Posted: Mon Mar 28, 2005 2:45 pm Post subject: |
|
|
[quote]
Musze sie przyznać że mi to właśnie występuje, i nawet nie wiedziałem ze może być to winą przegladraki. Jednak ja bez przegladarki żyć nie moge, było by tro jak odciecie polowy reki. Jedno jest pewne problemem jest Gecko, bo raczej nie sama mozilla skoro wystepuje to w kilku mozillach.
[quote]
To nie jest wina przeglądarki! Po prostu przeglądarka w jakiś sposób "wywołuje" ten błąd. Podobnie np. Gaim i operacja przełączania wirtualnych pulpitów.
Żadna aplikacja w Linuksie nie ma prawa zawieśić jądra/systemu. Jeżeli coś takiego się dzieje, to znaczy, że problem leży po stronie kernela/sterowników lub hardware'u. Hardware możemy od razu wykluczyć, skoro problem występuje u tylu ludzi na tak różnym sprzęcie.
Pozostaje kernel lub sterowniki. W wątku, który na górze podałem pojawiają się coraz to nowe informacje i rozwiązania (typu: wyłączanie mmx, przełączanie NVAGP na 2, etc.) Dla mnie najbardziej przekonująco brzmi hipoteza:
| Quote: |
From discussion with the XOrg developers, the problem diagnosis is that it's a driver problem that causes such lockups. XOrg makes a function call to the driver (usually to paint something) and the driver errors and does not return, causing XOrg to loop continuously and consume CPU.
|
Gdyby sterowniki NVIDI/ATI miały otwarty kod, to pewnie już dawno mielibyśmy ten problem rozwiązany. _________________ Michael Dominic K.
www.mdk.org.pl |
|
| Back to top |
|
 |
mdk Apprentice


Joined: 30 Sep 2004 Posts: 243 Location: Warsaw / Poland
|
Posted: Mon Mar 28, 2005 2:45 pm Post subject: |
|
|
| Quote: |
Musze sie przyznać że mi to właśnie występuje, i nawet nie wiedziałem ze może być to winą przegladraki. Jednak ja bez przegladarki żyć nie moge, było by tro jak odciecie polowy reki. Jedno jest pewne problemem jest Gecko, bo raczej nie sama mozilla skoro wystepuje to w kilku mozillach.
|
To nie jest wina przeglądarki! Po prostu przeglądarka w jakiś sposób "wywołuje" ten błąd. Podobnie np. Gaim i operacja przełączania wirtualnych pulpitów.
Żadna aplikacja w Linuksie nie ma prawa zawieśić jądra/systemu. Jeżeli coś takiego się dzieje, to znaczy, że problem leży po stronie kernela/sterowników lub hardware'u. Hardware możemy od razu wykluczyć, skoro problem występuje u tylu ludzi na tak różnym sprzęcie.
Pozostaje kernel lub sterowniki. W wątku, który na górze podałem pojawiają się coraz to nowe informacje i rozwiązania (typu: wyłączanie mmx, przełączanie NVAGP na 2, etc.) Dla mnie najbardziej przekonująco brzmi hipoteza:
| Quote: |
From discussion with the XOrg developers, the problem diagnosis is that it's a driver problem that causes such lockups. XOrg makes a function call to the driver (usually to paint something) and the driver errors and does not return, causing XOrg to loop continuously and consume CPU.
|
Gdyby sterowniki NVIDI/ATI miały otwarty kod, to pewnie już dawno mielibyśmy ten problem rozwiązany. _________________ Michael Dominic K.
www.mdk.org.pl |
|
| Back to top |
|
 |
Zwierzak Veteran


Joined: 19 Sep 2003 Posts: 1012 Location: /dev/null
|
Posted: Mon Mar 28, 2005 9:10 pm Post subject: |
|
|
| Pewnie na 90% winą można obarczyć stery binarne od ATi/NVIDI, tak do tąd robiłem i pewnie miałem racje. Pewnie twórcy coś tam skonocili a innym developerą trudno jest to naprawić. Ale z tego co przeczytałem to wynika że błąd występuje w przypadku aplikacji GTK. Nie wiem czy to ma coś związek czy to tylko moje błędne spostrzerzenie |
|
| Back to top |
|
 |
mdk Apprentice


Joined: 30 Sep 2004 Posts: 243 Location: Warsaw / Poland
|
Posted: Tue Mar 29, 2005 4:48 pm Post subject: |
|
|
| Quote: |
Mi sie pojawialy ostatnio bardzo czesto szczegolnie jak probowalem odpalic cos z kde 3.4
|
Nie tylko przy aplikacjach GTK, chociaż zdaje się, że częściej. GTK korzysta agresywniej z RenderAccel. Ja z kolei zauważyłem, że po zwisie kursor myszy działa tylko w przypadku HW_CURSOR = true (sprzętowy kursor). Przy SW_CURSOR = true zwis jest "kompletny". _________________ Michael Dominic K.
www.mdk.org.pl |
|
| Back to top |
|
 |
kuku Tux's lil' helper


Joined: 23 Dec 2004 Posts: 137
|
Posted: Wed Mar 30, 2005 8:23 pm Post subject: |
|
|
ja miałem takie cos jak używałem sterownika nv !!!! występowało w knoppixie i potem w gentoo - dopiero po zainstalowaniu sterów od nvidii przestało (6629 chyba) teraz mam 7167 i też sie zdarzyło
może nakierujecie mnie na jakieś howto jak to diagnozować bo ze zdalnym logowaniem niema problemu
i wiem że zalogowanie sie z innego komputera i ubicie X-ów pomogło, jeśli ktoś niema możliwości zdalnego logowania to może możnaby jakoś podłączyć skrypt ubijający X-y do guzika power na obudowie (w acpi chyba tak można) |
|
| Back to top |
|
 |
tdi Apprentice


Joined: 25 Aug 2004 Posts: 170 Location: Poznan [PL]
|
Posted: Wed Mar 30, 2005 8:33 pm Post subject: |
|
|
nigdy nie mialem takiego cusia
uzywam grafiki intela, i testowalem na all xorgach i xfree jakie byly, kde, e17 xfce _________________ *Dariusz 'tdi' Dwornikowski
*[JID] : tdi@gentoo.pl
*[MAIL] : tdi@gentoo.pl
*[WWW] : www.tdi.kill-9.pl |
|
| Back to top |
|
 |
mdk Apprentice


Joined: 30 Sep 2004 Posts: 243 Location: Warsaw / Poland
|
Posted: Wed Mar 30, 2005 9:45 pm Post subject: |
|
|
| Quote: |
i wiem że zalogowanie sie z innego komputera i ubicie X-ów pomogło, jeśli ktoś niema możliwości zdalnego logowania to może możnaby jakoś podłączyć skrypt ubijający X-y do guzika power na obudowie (w acpi chyba tak można)
|
Ciekawy pomysł. Ale lepiej - włączyć w kernelu opcję Kernel Hacking -> Kernel Debugging ->Magic SysReq Key. Potem, przy użyciu klawisza SysReq + kombinacja mamy dostęp do różnych ciekawych funkcji (to "pomija" driver klawiatury, X'y, etc. i powinno działać w każdej sytuacji, w której działa jeszcze kernel). Dostępne kombinacje:
| Code: |
(magic sysreq keys)
shift-scroll lock memory information
ctrl-scroll lock process listing
alt-sysreq-
0-9 set console log level
b emergency reboot
e kill all except init
i kill all, incl. init
k kill all programs on current console
l kill all, hardlock
m same as shift-scroll lock (memory info)
o apm poweroff
p show registers
r set keyboard to XLATE
s sync disks
t same as ctrl-scroll lock (process list)
u unmount all filesystems and change to readonly
|
_________________ Michael Dominic K.
www.mdk.org.pl |
|
| Back to top |
|
 |
tdi Apprentice


Joined: 25 Aug 2004 Posts: 170 Location: Poznan [PL]
|
Posted: Thu Mar 31, 2005 5:48 am Post subject: |
|
|
madre nie wiedzialem o tym, dzieki przyda sie na bank ! _________________ *Dariusz 'tdi' Dwornikowski
*[JID] : tdi@gentoo.pl
*[MAIL] : tdi@gentoo.pl
*[WWW] : www.tdi.kill-9.pl |
|
| Back to top |
|
 |
joi_ Apprentice

Joined: 28 Mar 2005 Posts: 164
|
Posted: Thu Mar 31, 2005 3:04 pm Post subject: |
|
|
kiedy miałem kernel 2.6.9 i sterowniki 6629 + włączone Composite, Render i RenderAccel działy się niesamowite cyrki: od wywracającego się na starcie konquerora czy kadu, po wywracający się w losowych momentach gcc (!) i make (!!), pamięć sprawdzałem memtestem (nic), procesor na pewno się nie przegrzewał (sprawdzałem później w biosie i temperatura była w normie)
co ciekawe, to te wywrotki szczególnie nasilały się po lub w trakcie używania mplayera / tvtime
obecnie mam kernel 2.6.11, sterowniki 7167 i takich cudów nie ma (choć Composite i sp. jeszcze nie włączałem), ale ze 2 czy 3 razy miałem takiego freeze'a jak opisujecie (firefoksa mam odpalonego prawie przez cały czas)
xorg 6.8.2, Athlon64 3200, GeForce FX 5200 |
|
| Back to top |
|
 |
kuku Tux's lil' helper


Joined: 23 Dec 2004 Posts: 137
|
Posted: Fri Apr 01, 2005 11:12 am Post subject: |
|
|
a nie jest to może jakis problem z framebufferem ?
tak mnie zastanowiło jak skonczyłem konfigurować kernela - a na 99% mialem vesafb-tng
nowego kernela jeszce nie skompilowalem ale wyłaczyłem RenderAccel i jest spokojnie a wczoraj miałem ze 4 zwisy Xów |
|
| Back to top |
|
 |
Zwierzak Veteran


Joined: 19 Sep 2003 Posts: 1012 Location: /dev/null
|
Posted: Fri Apr 01, 2005 5:42 pm Post subject: |
|
|
| fb nie ma nic z tym wspólnego, wcześniej miałem starego fb (vega) i wieszało się mi wtedy, po zmianie na tng nadal jest to samo |
|
| Back to top |
|
 |
grzewho l33t


Joined: 31 Dec 2002 Posts: 626 Location: /home/g
|
Posted: Sat Apr 02, 2005 9:40 am Post subject: |
|
|
u mnie na 100% problem powodowany jest przez firefoxa, chociaż po skasowaniu .mozilla jakby wszystko nagle zaczęło działać _________________
| Code: | | USE="freedom -software_patents" emerge --deep --update world |
|
|
| Back to top |
|
 |
mdk Apprentice


Joined: 30 Sep 2004 Posts: 243 Location: Warsaw / Poland
|
Posted: Sun Apr 10, 2005 6:24 pm Post subject: |
|
|
Chwilowo korzystam z ArchLinux, gdzie w tej samej konfiguracji sprzętowej + tych samych ustawieniach jądra problem nie występuje (jedyna róźnica - gentoo-dev-sources vs. vanilla-sources na archu).
Przy ostatnim zwisie jaki miałem na Gentoo zauważyłem, że w Xorg.log pojawiają się jakieś podejrzane wpisy w momencie zwisu. Nie potrafię przywołać w tej chwili, ale można by napisać skrypt, który monitoruje Xorg.log np. raz na minutę, i jak pojawi się odpowiedni komunikat to zabija X'y. _________________ Michael Dominic K.
www.mdk.org.pl |
|
| Back to top |
|
 |
|