ESXi blir otillgänglig efter ca 24h

Permalänk
Medlem

ESXi blir otillgänglig efter ca 24h

Hej!

Har en ESXi 5.5 burk snurrandes som helt plötsligt har börjar tappa nätveksanslutningen ca 24h efter den kommer upp.

Har kollat i loggen men vet förmodligen inte vad jag letar efter så hittar heller inget av värde. Jag har som sagt inte vad jag vet själv gjort någonting som skulle ha orsakat detta.

vmkernel.logen finns här: http://dump.victorhaggqvist.com/vmkernel.log (pastebin tyckte den var för stor)

Vore trevligt om några erfarna ögon kunde ta en titt och kanske se vad som händer.

EDIT: Kom på att det inte nödvändigt vis behöver vara nätverksfel. Då burken bara blir "otillgänglig" över nätverket, har inte haft tid att koppla in någon skärm och se om det syns nåt kul där än.

EDIT2: Ny intel, nu nere efter bara 2h.

//atriix

Visa signatur

FreeNAS 3U | 8GB | 2x2x3TB ProxMox i7-8700K | 32GB Desktop Dell 22" | Benq 22" | i5-smth | 16GB | Intel 520 120GB | 500GB | Arch

Permalänk
Medlem

Låter som hårdvarufel.
Vad för server kör du på?
Hårdvara som inte är certifierad kan ge massa konstiga fel.

Permalänk
Medlem
Skrivet av Danne:

Låter som hårdvarufel.
Vad för server kör du på?
Hårdvara som inte är certifierad kan ge massa konstiga fel.

Känns konstigt att det fått utslag plötsligt nu, men inget är väll omöjligt. Satte förvisso i nya diskar för typ 3 veckor sedan (DS2 och DS3 i loggen).

I övrigt kör den på: GA-P67A-D3-B3 | i5 2310 | HyperX 32GB 1600MHz

Visa signatur

FreeNAS 3U | 8GB | 2x2x3TB ProxMox i7-8700K | 32GB Desktop Dell 22" | Benq 22" | i5-smth | 16GB | Intel 520 120GB | 500GB | Arch

Permalänk
Medlem

Långskott:

1. Lägger den av även utan VMar igång?

2. Vad bootar du den på? USB/SD?

Visa signatur

i7-8700k | ASUS ROG Strix Z370-F Gaming | 2x8+2x16GB Corsair Vengeance LPX 3200 | ASUS TUF RTX 3080 OC | Samsung 860 EVO 1TB | WD Black SN850 1TB | Intel 660p 2TB | Crucial MX500 4TB | Noctua NH-U14S | Fractal Design North | Seasonic Focus Plus Gold 650FX | ASUS Xonar Essence STX

Permalänk
Medlem
Skrivet av Micke O:

Långskott:

1. Lägger den av även utan VMar igång?

2. Vad bootar du den på? USB/SD?

1. Återkommer
2. USB

Skickades från m.sweclockers.com

Visa signatur

FreeNAS 3U | 8GB | 2x2x3TB ProxMox i7-8700K | 32GB Desktop Dell 22" | Benq 22" | i5-smth | 16GB | Intel 520 120GB | 500GB | Arch

Permalänk
Medlem
Skrivet av atriix:

1. Återkommer
2. USB

Skickades från m.sweclockers.com

2a. Provat med annat USB?
2b. Jag förutsätter att du inte skriver loggen till USB-pinnen?

Visa signatur

i7-8700k | ASUS ROG Strix Z370-F Gaming | 2x8+2x16GB Corsair Vengeance LPX 3200 | ASUS TUF RTX 3080 OC | Samsung 860 EVO 1TB | WD Black SN850 1TB | Intel 660p 2TB | Crucial MX500 4TB | Noctua NH-U14S | Fractal Design North | Seasonic Focus Plus Gold 650FX | ASUS Xonar Essence STX

Permalänk
Medlem
Skrivet av Micke O:

2a. Provat med annat USB?
2b. Jag förutsätter att du inte skriver loggen till USB-pinnen?

Ska ta o testa annat USB.
Funderar även på om jag ska ta o nedgradera till 5.1, då mina realtek drivare inte finns i ESXi imagen längre utan behövde fixa det själv, http://www.bussink.ch/?p=1228. (Och pga nedanstående varning)

Kikade in i event-loggen i vshpere-klienten på burken nu igen också och hittade detta, vilket jag inte verkar vara ensam om heller. Se VMW forum.

No scratch partition has been configured. Recommended scratch partition size is {} MiB. warning 2014-03-08 14:25:22 esxi.hggqvst.local

Dold text

Vad gäller loggen har jag inte gjort något aktivt val kring den, så skulle inte förvåna mig om det ligger på USBn.

Visa signatur

FreeNAS 3U | 8GB | 2x2x3TB ProxMox i7-8700K | 32GB Desktop Dell 22" | Benq 22" | i5-smth | 16GB | Intel 520 120GB | 500GB | Arch

Permalänk
Medlem
Skrivet av atriix:

Ska ta o testa annat USB.
Funderar även på om jag ska ta o nedgradera till 5.1, då mina realtek drivare inte finns i ESXi imagen längre utan behövde fixa det själv, http://www.bussink.ch/?p=1228. (Och pga nedanstående varning)

Kikade in i event-loggen i vshpere-klienten på burken nu igen också och hittade detta, vilket jag inte verkar vara ensam om heller. Se VMW forum.

No scratch partition has been configured. Recommended scratch partition size is {} MiB. warning 2014-03-08 14:25:22 esxi.hggqvst.local

Dold text

Vad gäller loggen har jag inte gjort något aktivt val kring den, så skulle inte förvåna mig om det ligger på USBn.

Ok, flytta isf loggen till något datastore så att du inte skriver sönder USB-pinnen: http://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=2003322

Om det fanns drivisar för NICen i 5.1, prova att först installera 5.1 och sedan uppgradera till 5.5 - drivisen ska ligga kvar, funkade för mig iaf.

Visa signatur

i7-8700k | ASUS ROG Strix Z370-F Gaming | 2x8+2x16GB Corsair Vengeance LPX 3200 | ASUS TUF RTX 3080 OC | Samsung 860 EVO 1TB | WD Black SN850 1TB | Intel 660p 2TB | Crucial MX500 4TB | Noctua NH-U14S | Fractal Design North | Seasonic Focus Plus Gold 650FX | ASUS Xonar Essence STX

Permalänk
Medlem

Förmodligen indentifierat till nätverksfel. Kopplade in en skärm o kollade loggen när den "dog" och fick:

WARNING: LinNet: netdev_watchdog:3478: NETDEV WATCHDOG: vmnic0: transmit timed out

Nedgraderar/installerar om till 5.1u1 som funkade innan och förhoppnings vis blir den gladare.

Visa signatur

FreeNAS 3U | 8GB | 2x2x3TB ProxMox i7-8700K | 32GB Desktop Dell 22" | Benq 22" | i5-smth | 16GB | Intel 520 120GB | 500GB | Arch

Permalänk
Medlem

Aha, med "dog", menar du då att det blir en PSOD (Purple Screen Of Death)?

Har du någon VM som har e1000 (kan ha varit e1000e) som vNIC? Finns en bugg i 5.5 tror jag det är som får host:en att PSOD:a om man har VMar med den vNIC:en. Byt isf till VMXNET3. Googla på: esxi e1000 psod

Visa signatur

i7-8700k | ASUS ROG Strix Z370-F Gaming | 2x8+2x16GB Corsair Vengeance LPX 3200 | ASUS TUF RTX 3080 OC | Samsung 860 EVO 1TB | WD Black SN850 1TB | Intel 660p 2TB | Crucial MX500 4TB | Noctua NH-U14S | Fractal Design North | Seasonic Focus Plus Gold 650FX | ASUS Xonar Essence STX

Permalänk
Medlem
Skrivet av Micke O:

Aha, med "dog", menar du då att det blir en PSOD (Purple Screen Of Death)?

Har du någon VM som har e1000 (kan ha varit e1000e) som vNIC? Finns en bugg i 5.5 tror jag det är som får host:en att PSOD:a om man har VMar med den vNIC:en. Byt isf till VMXNET3. Googla på: esxi e1000 psod

Med "dog" menade jag bara att den blev otillgänglig. Detta i sin tur så vitt jag kunde se innebar att nätverksdrivaren dog, vilket ju resulterade i att den inte gick att nå utifrån, så kollade loggen genom konsolen på burken.

I vilket fall kör den nu sedan ett par timmar tillbaka 5.1u1 och det verkar funka fint än så länge. (Läste ditt inlägg efter att jag installerade om.) Det är förövrigt mycket möjligt att det delvis kan ha berott på NICsen som du nämnde. Kollade igenom mina maskiner nu också och där fanns en salig blandning av e1000, e1000e, VMXNET3 samt Fexlible då jag alltid bara lämnat default NIC för valt OS när jag skapat nya VMar. Nu är i vilket fall alla uppgraderade till VMXNET3.

Slutligen med detta i åtanke kan det hela ha hängt på en Windows 7 maskin med ett e1000 NIC.

Visa signatur

FreeNAS 3U | 8GB | 2x2x3TB ProxMox i7-8700K | 32GB Desktop Dell 22" | Benq 22" | i5-smth | 16GB | Intel 520 120GB | 500GB | Arch

Permalänk
Medlem

Hade problem med PSOD på 5.1, men det var på grund av att mina win2012 r2 burkar använde e1000 drivern, var tvungen att köra dom med vmxnet för att det inte ska purple screena.

Dom kraschade enbart under belastning, så lät jag dom idlea så var det inga problem.

Visa signatur

Viva las vegas....

Permalänk
Medlem

Update1 till 5.5 har kommit nu. Fixar bland annat psod med e1000 och e1000e. https://www.vmware.com/support/vsphere5/doc/vsphere-esxi-55u1...