Jump to content

Recommended Posts

Posted

Здравствуйте, уважаемые.

У меня следующая проблема - Каждый вечер, примерно с 19:00 до 22:00 (плюс минус час), наблюдаются непонятные мне проблемы на сервере (стоит IPFW и NAT):

Наблюдается следующее (errs доходит до ~4000, от трафика не зависит, т.е. может забарахлить и при 70Mbit и при 250Mbit)

 

#netstat -w1 -Ibce1
           input         (bce1)           output
  packets  errs idrops      bytes    packets  errs      bytes colls
    25938  1011     0   30064135      19783     0    5004140     0
    26340   379     0   30681837      19571     0    4877502     0
    26661   272     0   30914678      19537     0    5014774     0
    26508   484     0   30778055      19490     0    4773846     0
    26366   491     0   30656848      19823     0    4910134     0
    25020   822     0   28713001      18898     0    4914730     0
    25467   401     0   29245025      18948     0    4843918     0
    26633   250     0   30583988      20073     0    5702013     0
    26994   399     0   31188130      19531     0    4807081     0
    26285   553     0   30150479      19674     0    5325751     0
    26166   681     0   30248997      19082     0    5137898     0
    25376   341     0   28955230      18909     0    5047044     0
    24837   827     0   28453703      19012     0    5665288     0
    25105   386     0   29033980      18478     0    4918886     0

# top -SH
last pid: 99229;  load averages:  0.45,  0.52,  0.54 
118 processes: 6 running, 88 sleeping, 24 waiting
CPU:  0.5% user,  0.0% nice, 18.4% system, 26.6% interrupt, 54.6% idle
Mem: 29M Active, 21M Inact, 217M Wired, 72K Cache, 112M Buf, 3226M Free
Swap: 8192M Total, 8192M Free

 PID USERNAME  PRI NICE   SIZE    RES STATE   C   TIME   WCPU COMMAND
  11 root      171 ki31     0K    32K RUN     0 581:24 96.24% {idle: cpu0}
  12 root      -68    -     0K   200K CPU1    1 163:46 84.72% {irq258: bce1}
  11 root      171 ki31     0K    32K CPU3    3 734:41 81.40% {idle: cpu3}
   0 root      -68    0     0K    56K -       2 171:30 75.68% {dummynet}
  11 root      171 ki31     0K    32K CPU2    2 500:14 31.20% {idle: cpu2}
  12 root      -68    -     0K   200K WAIT    3  75:09 20.56% {irq260: bce3}
  11 root      171 ki31     0K    32K RUN     1 638:17 15.23% {idle: cpu1}
1454 root       44    0 20460K 13760K ucond   3   8:47  1.07% {fprobe}
  12 root      -68    -     0K   200K WAIT    0   0:37  0.10% {irq257: bce0}
  23 root       45    -     0K     8K flowcl  3   9:08  0.05% flowcleaner
1454 root       44    0 20460K 13760K bpf     0   4:02  0.05% {fprobe}
  12 root      -44    -     0K   200K WAIT    0 376:28  0.00% {swi1: netisr 0}
  12 root      -32    -     0K   200K WAIT    0   6:01  0.00% {swi4: clock}

 

Потери доходят до 10-15%, появляется большая задержка, практически не загружается онлайн-видео.

Проблема появляется также неожиданно, как и пропадает. Иногда бывают "выходные", пару дней работает нормально, а потом опять ****.

Прежде чем задавать этот вопрос, на протяжении пары месяцев, я беспощадно мучил доки и ддосил гугл, но ответа так и не нашел, возможно в силу своей не компетенции. Прошу подсказать мне в какую сторону копать, опыта работы у меня мало, прошу относиться с пониманием.

Спасибо.

 

PS Незнаю какую информацию показать, запрашивайте - выложу.

Posted (edited)

Покажите top -SHP . Да и попробуйте PF nat может не много поможет. И выкиньте свои сетевые карты. Купите Intel 1000 на чипе 82576 Dual port

 

vpn122# cat /etc/pf.conf 
ext_if="igb1"
int_if="igb0"

set limit states 1600000
set optimization aggressive
set skip on lo0 
set skip on em0 
#scrub in all
nat on $ext_if from 172.16.0.0/16 to any -> 87.245.203.Х
pass in on $int_if from 172.16.0.0/16 to any
pass out on $ext_if from $ext_if to any

Edited by roysbike
Posted

Покажите top -SHP . Да и попробуйте PF nat может не много поможет. И выкиньте свои сетевые карты. Купите Intel 1000 на чипе 82576 Dual port

 

vpn122# cat /etc/pf.conf 
ext_if="igb1"
int_if="igb0"

set limit states 1600000
set optimization aggressive
set skip on lo0 
set skip on em0 
#scrub in all
nat on $ext_if from 172.16.0.0/16 to any -> 87.245.203.Х
pass in on $int_if from 172.16.0.0/16 to any
pass out on $ext_if from $ext_if to any

 

top -SHP

 

last pid: 63916;  load averages:  1.22,  1.32,  1.36                                                                                                     up 0+14:05:41  18:50:33
112 processes: 9 running, 84 sleeping, 19 waiting
CPU 0:  0.0% user,  0.0% nice,  0.5% system, 72.5% interrupt, 27.0% idle
CPU 1:  0.5% user,  0.0% nice,  0.5% system, 36.5% interrupt, 62.4% idle
CPU 2:  1.1% user,  0.0% nice,  6.9% system,  0.0% interrupt, 92.1% idle
CPU 3:  0.0% user,  0.0% nice, 65.1% system,  0.0% interrupt, 34.9% idle
Mem: 28M Active, 89M Inact, 279M Wired, 236K Cache, 416M Buf, 3536M Free
Swap: 4096M Total, 4096M Free

 PID USERNAME PRI NICE   SIZE    RES STATE   C   TIME   WCPU COMMAND
  11 root     155 ki31     0K    64K RUN     2 789:52 95.56% idle{idle: cpu2}
  12 root     -92    -     0K   352K CPU1    0 346:12 87.35% intr{irq258: bce1}
  11 root     155 ki31     0K    64K RUN     3 644:49 74.37% idle{idle: cpu3}
  11 root     155 ki31     0K    64K RUN     1 720:57 71.48% idle{idle: cpu1}
   0 root     -92    0     0K   160K CPU3    3 241:51 40.97% kernel{dummynet}
  11 root     155 ki31     0K    64K RUN     0 493:36 24.76% idle{idle: cpu0}
  12 root     -92    -     0K   352K CPU0    0 108:54 17.87% intr{irq260: bce3}
  12 root     -60    -     0K   352K RUN     0   4:17  4.39% intr{swi4: clock}
   0 root     -16    0     0K   160K sched   0   2:52  0.00% kernel{swapper}

 

vmstat -z для размышлений и поиск по форуму, уже неоднократно поднималось.

 

 

# vmstat -z
ITEM                   SIZE  LIMIT     USED     FREE      REQ FAIL SLEEP

UMA Kegs:               208,      0,      86,      16,      86,   0,   0
UMA Zones:              896,      0,      86,       2,      86,   0,   0
UMA Slabs:              568,      0,    1519,       7,    4712,   0,   0
UMA RCntSlabs:          568,      0,    4490,       4,    4490,   0,   0
UMA Hash:               256,      0,       2,      13,       3,   0,   0
16 Bucket:              152,      0,     138,      12,     138,   0,   0
32 Bucket:              280,      0,     159,       9,     159,   1,   0
64 Bucket:              536,      0,     138,       2,     138,  58,   0
128 Bucket:            1048,      0,    1757,       1,    1757,3242,   0
VM OBJECT:              216,      0,    3653,   16183,12345485,   0,   0
MAP:                    232,      0,       7,      25,       7,   0,   0
KMAP ENTRY:             120, 150505,      51,     476,   12173,   0,   0
MAP ENTRY:              120,      0,    1008,    3115,22619494,   0,   0
fakepg:                 120,      0,       0,       0,       0,   0,   0
mt_zone:               4112,      0,     307,       4,     307,   0,   0
16:                      16,      0,    2157,     867, 1515428,   0,   0
32:                      32,      0,    2716,     819, 2079409,   0,   0
64:                      64,      0,    5657,   31359, 2850894,   0,   0
128:                    128,      0,  306592,    1852,46392769,   0,   0
256:                    256,      0,    4163,   20272,1326770220,   0,   0
512:                    512,      0,    5151,   12496,45153080,   0,   0
1024:                  1024,      0,      66,     230,  261146,   0,   0
2048:                  2048,      0,      87,     181,   36043,   0,   0
4096:                  4096,      0,     411,     377,  693065,   0,   0
Files:                   80,      0,      93,     447, 3292427,   0,   0
TURNSTILE:              136,      0,     373,      87,     373,   0,   0
umtx pi:                 96,      0,       0,       0,       0,   0,   0
MAC labels:              40,      0,       0,       0,       0,   0,   0
PROC:                  1160,      0,      52,     191,  663156,   0,   0
THREAD:                1112,      0,     301,      71,     377,   0,   0
SLEEPQUEUE:              80,      0,     373,     120,     373,   0,   0
VMSPACE:                392,      0,      34,     196,  665526,   0,   0
cpuset:                  72,      0,       2,      98,       2,   0,   0
audit_record:           960,      0,       0,       0,       0,   0,   0
mbuf_packet:            256,      0,    6500,    2076,2048977559,   0,   0
mbuf:                   256,      0,    1580,    2144,3961775327,   0,   0
mbuf_cluster:          2048,  25600,    8576,     134,   13779,   0,   0
mbuf_jumbo_page:       4096,  12800,       0,     135,   20284,   0,   0
mbuf_jumbo_9k:         9216,   6400,       0,       0,       0,   0,   0
mbuf_jumbo_16k:       16384,   3200,       0,       0,       0,   0,   0
mbuf_ext_refcnt:          4,      0,       0,       0,       0,   0,   0
g_bio:                  232,      0,       0,    3344, 1517680,   0,   0
ttyinq:                 160,      0,     180,     228,     855,   0,   0
ttyoutq:                256,      0,      95,     160,     450,   0,   0
ata_request:            328,      0,       0,       0,       0,   0,   0
ata_composite:          336,      0,       0,       0,       0,   0,   0
VNODE:                  480,      0,    4381,   16027,   56762,   0,   0
VNODEPOLL:              112,      0,       0,     132,       3,   0,   0
NAMEI:                 1024,      0,       0,     112, 7387787,   0,   0
S VFS Cache:            108,      0,    4541,   15853,  120796,   0,   0
L VFS Cache:            328,      0,      20,     652,    1258,   0,   0
DIRHASH:               1024,      0,     174,     178,     522,   0,   0
NCLNODE:                560,      0,       0,       0,       0,   0,   0
Mountpoints:            768,      0,       2,      13,       2,   0,   0
pipe:                   728,      0,       1,     124,  426228,   0,   0
ksiginfo:               112,      0,     232,     824,    5701,   0,   0
itimer:                 344,      0,       0,       0,       0,   0,   0
KNOTE:                  128,      0,       0,     319,   69056,   0,   0
socket:                 680,  25602,      30,     150,  299691,   0,   0
ipq:                     56,    819,       0,     315,    1149,   0,   0
udp_inpcb:              392,  25600,      10,     120,   51691,   0,   0
udpcb:                   16,  25704,      10,     662,   51691,   0,   0
tcp_inpcb:              392,  25600,     206,     144,  183544,   0,   0
tcpcb:                  976,  25600,       9,     103,  183544,   0,   0
tcptw:                   72,   5150,     197,     403,  162649,   0,   0
syncache:               152,  15375,       0,     175,  168167,   0,   0
hostcache:              136,  15372,       2,      82,      34,   0,   0
tcpreass:                40,   1680,       0,     504,    1078,   0,   0
sackhole:                32,      0,       0,     303,       5,   0,   0
sctp_ep:               1368,  25600,       0,       0,       0,   0,   0
sctp_asoc:             2280,  40000,       0,       0,       0,   0,   0
sctp_laddr:              48,  80064,       0,     216,      18,   0,   0
sctp_raddr:             704,  80000,       0,       0,       0,   0,   0
sctp_chunk:             136, 400008,       0,       0,       0,   0,   0
sctp_readq:             104, 400032,       0,       0,       0,   0,   0
sctp_stream_msg_out:    112, 400026,       0,       0,       0,   0,   0
sctp_asconf:             40, 400008,       0,       0,       0,   0,   0
sctp_asconf_ack:         48, 400032,       0,       0,       0,   0,   0
ripcb:                  392,  25600,       1,      49,    2640,   0,   0
unpcb:                  240,  25600,      10,     182,   61810,   0,   0
rtentry:                200,      0,      50,      26,      53,   0,   0
IPFW dynamic rule:      120,      0,    1467,     858, 6214643,   0,   0
divcb:                  392,  25600,       0,       0,       0,   0,   0
selfd:                   56,      0,     358,     776, 6041213,   0,   0
SWAPMETA:               288, 116519,       0,       0,       0,   0,   0
FFS inode:              168,      0,    4339,   15791,   56708,   0,   0
FFS1 dinode:            128,      0,       0,       0,       0,   0,   0
FFS2 dinode:            256,      0,    4339,   15941,   56708,   0,   0

  • 1 year later...
Posted

Вообщем больше года боролся с этой проблемой. Менял сетевые на Intel 1000 82576 Dual port, ставил второй процессор, ковырял виланы, настраивал sysctl... Много чего перепробывал, и безрезультатно, процессор переодически ложился без каких-либо видимых причин.

Реально помог только переход на pf nat. Трафик ~700 Мбит, проц нагружен под 70%. Уже пол года полет нормальный. Если у кого похожая проблема, первым делом меняйте нат.

 

Да и попробуйте PF nat может не много поможет. И выкиньте свои сетевые карты. Купите Intel 1000 на чипе 82576 Dual port

 

Нужно было сразу послушать. Всем спасибо за советы :)

Posted

Да похер на тюнинг - если "я понменял нат и на внутреннем интерфейсе пропали ошибки" (я не ошибаюсь, на том что в сеть смотрит?) - то тут с логикой что-то да не то.

Ну или я ооочень дурак, и не понимаю, каким боком тут нат...

Posted

Да запросто, инпут еррорс могут означать что очереди переполнены на интерфейсе (то место где они из драйвера в стёк уходят).

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...
На сайте используются файлы cookie и сервисы аналитики для корректной работы форума и улучшения качества обслуживания. Продолжая использовать сайт, вы соглашаетесь с использованием файлов cookie и с Политикой конфиденциальности.