Помогите определить проблему

mrsaygo

Опубликовано 2 июля, 2011 · Жалоба

Пинг до шлюза неровный, от 1 до 40. Процессор не грузиться.

На тазике - НАТ, бгп, статическая маршрутизация. 2.6.32-5-amd64 debian

Вчера вечером картина была жестче - пинг до 400-700 , ksoftirqd ложил ядра в 100.

Раньше такого не наблюдалось при том же ППС и том же трафике, посему подозреваю какую то заразу в сети.

Прошу помощи в локализации данной проблемы. Есть подозрение на что-то с UDP (визуально при прыжке пинга растет к-ство UDP в tcpdump).

Ip:
   1579964473 total packets received
   3716 with invalid headers
   5222 with invalid addresses
   1497266707 forwarded
   1 with unknown protocol
   0 incoming packets discarded
   17817834 incoming packets delivered
   1514774186 requests sent out
   111480 outgoing packets dropped
   44017 fragments dropped after timeout
   116761986 reassemblies required
   58089840 packets reassembled ok
   583423 packet reassembles failed
   2251 fragments received ok
   22 fragments failed
   5093 fragments created
Icmp:
   172011 ICMP messages received
   51993 input ICMP message failed.
   ICMP input histogram:
       destination unreachable: 40594
       timeout in transit: 2042
       source quenches: 369
       redirects: 1952
       echo requests: 93439
       echo replies: 23898
   14301021 ICMP messages sent
   0 ICMP messages failed
   ICMP output histogram:
       destination unreachable: 14050985
       time exceeded: 254
       redirect: 131947
       echo request: 24463
       echo replies: 93372
IcmpMsg:
       InType0: 23898
       InType3: 40594
       InType4: 369
       InType5: 1952
       InType8: 93439
       InType11: 2042
       OutType0: 93372
       OutType3: 14050985
       OutType5: 131947
       OutType8: 24463
       OutType11: 254
Tcp:
   220 active connections openings
   16198 passive connection openings
   1 failed connection attempts
   819 connection resets received
   10 connections established
   3450479 segments received
   3310862 segments send out
   1204 segments retransmited
   6963 bad segments received.
   3107235 resets sent
Udp:
   10303 packets received
   13865006 packets to unknown port received.
   1077 packet receive errors
   5873 packets sent
UdpLite:
TcpExt:
   131 invalid SYN cookies received
   1 resets received for embryonic SYN_RECV sockets
   22 ICMP packets dropped because they were out-of-window
   10535 TCP sockets finished time wait in fast timer
   2174 delayed acks sent
   51 delayed acks further delayed because of locked socket
   Quick ack mode was activated 26 times
   26594 packets directly queued to recvmsg prequeue.
   63 bytes directly in process context from backlog
   208094 bytes directly received in process context from prequeue
   10862 packet headers predicted
   8015 packets header predicted and directly queued to user
   93078 acknowledgments not containing data payload received
   31393 predicted acknowledgments
   37 times recovered from packet loss due to fast retransmit
   2 times recovered from packet loss by selective acknowledgements
   Detected reordering 3 times using time stamp
   1 congestion windows fully recovered without slow start
   40 congestion windows partially recovered using Hoe heuristic
   5 congestion windows recovered without slow start by DSACK
   12 timeouts after reno fast retransmit
   11 timeouts in loss state
   42 fast retransmits
   34 retransmits in slow start
   352 other TCP timeouts
   8 classic Reno fast retransmits failed
   20 DSACKs sent for old packets
   16 DSACKs received
   24 connections reset due to unexpected data
   74 connections aborted due to timeout
   TCPDSACKIgnoredOld: 10
   TCPSpuriousRTOs: 1
   TCPSackShifted: 2
   TCPSackMerged: 2
   TCPSackShiftFallback: 9
IpExt:
   InTruncatedPkts: 162
   InMcastPkts: 908
   InBcastPkts: 325275
   InOctets: -912123899
   OutOctets: 637937344
   InMcastOctets: 25424
   InBcastOctets: 33884690

top - 10:56:32 up 16:01,  2 users,  load average: 0.06, 0.07, 0.02
Tasks: 146 total,   1 running, 145 sleeping,   0 stopped,   0 zombie
Cpu(s):  0.1%us,  0.4%sy,  0.0%ni, 94.6%id,  0.0%wa,  0.1%hi,  4.8%si,  0.0%st
Mem:   4055248k total,   377384k used,  3677864k free,    52640k buffers
Swap:  3905528k total,        0k used,  3905528k free,    96980k cached

 PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
15892 root      20   0 10592 1364 1168 S    2  0.0   0:02.46 pps
16195 root      20   0 19060 1280  900 R    2  0.0   0:00.01 top
   1 root      20   0  8352  804  668 S    0  0.0   0:01.61 init
   2 root      20   0     0    0    0 S    0  0.0   0:00.00 kthreadd
   3 root      RT   0     0    0    0 S    0  0.0   0:00.06 migration/0
   4 root      20   0     0    0    0 S    0  0.0   2:51.38 ksoftirqd/0
   5 root      RT   0     0    0    0 S    0  0.0   0:00.00 watchdog/0
   6 root      RT   0     0    0    0 S    0  0.0   0:00.00 migration/1
   7 root      20   0     0    0    0 S    0  0.0   2:42.95 ksoftirqd/1
   8 root      RT   0     0    0    0 S    0  0.0   0:00.00 watchdog/1
   9 root      RT   0     0    0    0 S    0  0.0   0:00.00 migration/2
  10 root      20   0     0    0    0 S    0  0.0   2:30.94 ksoftirqd/2
  11 root      RT   0     0    0    0 S    0  0.0   0:00.00 watchdog/2
  12 root      RT   0     0    0    0 S    0  0.0   0:00.00 migration/3
  13 root      20   0     0    0    0 S    0  0.0   2:23.73 ksoftirqd/3
  14 root      RT   0     0    0    0 S    0  0.0   0:00.00 watchdog/3

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

mrsaygo

Опубликовано 4 июля, 2011 (изменено) · Жалоба

В общем ситуация не улучшилась(((( Периодически возникают скачки пинга(от нормальных 1 до 200-400). При чем пробовал ложить на 3828 (к которому подключен тазик) некоторые порты дабы определить источник.

Результат - нормализация работы то при тушении порта №4 то при тушении порта №7 итд итп. Игрался с ethtool эффекта нет.

Вот дополнительные сведения на всякий случай:

root@gw:~# ethtool eth2
Settings for eth2:
       Supported ports: [ TP ]
       Supported link modes:   10baseT/Half 10baseT/Full
                               100baseT/Half 100baseT/Full
                               1000baseT/Full
       Supports auto-negotiation: Yes
       Advertised link modes:  10baseT/Half 10baseT/Full
                               100baseT/Half 100baseT/Full
                               1000baseT/Full
       Advertised pause frame use: No
       Advertised auto-negotiation: Yes
       Speed: 1000Mb/s
       Duplex: Full
       Port: Twisted Pair
       PHYAD: 1
       Transceiver: internal
       Auto-negotiation: on
       MDI-X: on
       Supports Wake-on: pumbag
       Wake-on: g
       Current message level: 0x00000001 (1)
       Link detected: yes

root@gw:~# ethtool -g eth2
Ring parameters for eth2:
Pre-set maximums:
RX:             4096
RX Mini:        0
RX Jumbo:       0
TX:             4096
Current hardware settings:
RX:             1024
RX Mini:        0
RX Jumbo:       0
TX:             1024

Вот еще такого хватает

Jul  3 08:27:10 gw kernel: [135117.309739] UDP: short packet: From 183.76.125.75:11975 0/28 to 91.193.168.166:12334
Jul  3 08:28:53 gw kernel: [135220.344230] UDP: bad checksum. From 178.216.191.5:59513 to 91.193.160.228:2881 ulen 28
Jul  3 08:28:56 gw kernel: [135223.348787] UDP: bad checksum. From 178.216.191.5:59513 to 91.193.160.228:2881 ulen 28
Jul  3 08:33:17 gw kernel: [135484.293850] UDP: bad checksum. From 178.216.191.5:59513 to 91.193.160.228:2881 ulen 28
Jul  3 08:49:46 gw kernel: [136473.240932] UDP: bad checksum. From 178.216.191.5:59513 to 91.193.160.228:2881 ulen 28
Jul  3 08:49:49 gw kernel: [136476.232174] UDP: bad checksum. From 178.216.191.5:59513 to 91.193.160.228:2881 ulen 28
Jul  3 08:51:14 gw kernel: [136561.246299] UDP: bad checksum. From 178.216.191.5:59513 to 91.193.160.228:2881 ulen 28
Jul  3 08:51:17 gw kernel: [136564.244619] UDP: bad checksum. From 178.216.191.5:59513 to 91.193.160.228:2881 ulen 28
Jul  3 08:53:01 gw kernel: [136667.983848] UDP: bad checksum. From 58.252.125.107:5273 to 91.193.168.166:5223 ulen 109
Jul  3 08:55:54 gw kernel: [136841.200762] UDP: bad checksum. From 178.216.191.5:59513 to 91.193.160.228:2881 ulen 28
Jul  3 08:55:57 gw kernel: [136844.195939] UDP: bad checksum. From 178.216.191.5:59513 to 91.193.160.228:2881 ulen 28
Jul  3 09:03:17 gw kernel: [137284.536871] UDP: bad checksum. From 81.30.188.72:55324 to 91.193.168.166:6001 ulen 1446
Jul  3 09:03:29 gw kernel: [137295.840622] UDP: bad checksum. From 81.30.188.72:55324 to 91.193.168.166:6001 ulen 1446
Jul  3 09:04:13 gw kernel: [137339.694785] UDP: bad checksum. From 81.30.188.72:55324 to 91.193.168.166:6001 ulen 1446
Jul  3 09:04:38 gw kernel: [137364.622629] UDP: bad checksum. From 81.30.188.72:55324 to 91.193.168.166:6001 ulen 1446
Jul  3 09:04:59 gw kernel: [137385.608127] UDP: bad checksum. From 81.30.188.72:55324 to 91.193.168.166:6001 ulen 1446
Jul  3 09:05:17 gw kernel: [137403.887081] UDP: bad checksum. From 81.30.188.72:55324 to 91.193.168.166:6001 ulen 1446
Jul  3 09:05:32 gw kernel: [137419.337552] UDP: bad checksum. From 81.30.188.72:55324 to 91.193.168.166:6001 ulen 1446
Jul  3 09:05:47 gw kernel: [137433.648951] UDP: bad checksum. From 81.30.184.131:16460 to 91.193.168.166:6001 ulen 1446
Jul  3 09:11:55 gw kernel: [137802.069051] UDP: short packet: From 83.204.110.171:256 65535/183 to 91.193.168.166:0
Jul  3 09:14:20 gw kernel: [137947.132392] UDP: bad checksum. From 178.216.191.5:59513 to 91.193.160.228:2881 ulen 28
Jul  3 09:14:23 gw kernel: [137950.137776] UDP: bad checksum. From 178.216.191.5:59513 to 91.193.160.228:2881 ulen 28

У кого какие идеи по этому поводу? В какую сторону еще посмотреть?

Очень нужна помощь.

Изменено 4 июля, 2011 пользователем mrsaygo

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

GFORGX

Войти

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Join the conversation