Jump to content
Калькуляторы

Dell Force10 C150 Странные сообщения в логе

Добрый день, на нашем с150 в логах периодически пишутся такие вот сообщения:

Mar 20 20:04:30: %E48PB:0 %FIB6-6-FIB_CAM_FULL: FIB:0, IPv4 FIB CAM is full on linecard 0

Mar 20 20:04:30: %E48TB:3 %FIB6-6-FIB_CAM_FULL: FIB:3, IPv4 FIB CAM is full on linecard 3

Mar 20 20:04:00: %E48PB:0 %FIB6-6-FIB_CAM_FULL: FIB:0, IPv4 FIB CAM is full on linecard 0

Mar 20 20:04:00: %E48PB:0 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.114.56 into the hardware due to hash failure

Mar 20 20:04:00: %E48PB:0 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.181.44 into the hardware due to hash failure

Mar 20 20:04:00: %E48PB:0 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.106.207 into the hardware due to hash failure

Mar 20 20:04:00: %E48TB:3 %FIB6-6-FIB_CAM_FULL: FIB:3, IPv4 FIB CAM is full on linecard 3

Mar 20 20:04:00: %E48PB:0 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.128.143 into the hardware due to hash failure

Mar 20 20:04:00: %E48TB:3 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.122.72 into the hardware due to hash failure

Mar 20 20:04:00: %E48TB:3 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.189.207 into the hardware due to hash failure

Mar 20 20:04:00: %E48TB:3 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.111.47 into the hardware due to hash failure

Mar 20 20:03:59: %E48PB:0 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.181.65 into the hardware due to hash failure

Mar 20 20:03:59: %E48TB:3 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.178.44 into the hardware due to hash failure

Mar 20 20:03:59: %E48TB:3 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.177.63 into the hardware due to hash failure

Mar 20 20:03:59: %E48TB:3 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.122.91 into the hardware due to hash failure

При этом периодически на L3 возникают задержки по пингам до 1000 мс.

Причем происходит это хаотично. Один и тот же адрес с разных адресов может пинговаться по разному - с одного меньше 1 мс, а с другого 1000...

Может кто-то с таким встречался? В данное время залит FTOS 8.4.2.6. Может у кого-то есть 8.4.2.7?

Share this post


Link to post
Share on other sites

а сколько всего маршрутов в FIB ? по сообщением FIB переполнено, - на с150 всего 12 000 ipv4.

если логи не врут то ничего удивительного в задержках нет.

Share this post


Link to post
Share on other sites

Сейчас получается вот так:

krd-core#show ip fib linecard 0 summary

Total Number of Routes in the FIB database is 4101

Total Number of Routes in the CAM is 4073

Total Number of Routes which can be entered in CAM is 16383

IPC Messages Received from RTM 7940

[Add route requests 4768; Delete Route requests 2130]

[Clear Route requests 1]

IPC Messages Received from ARPM 340432

 

Section Current Use

------------------------

32 3969

29 1

24 129

Пока переполнения не наблидается, но вчера в моменты переполнения, маршрутов было около 5000.

Сейчас в консоль постоянно валятся такие сообщения:

Mar 21 10:09:19: %E48TB:3 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.101.246 into the hardware due to hash failure

Mar 21 10:09:19: %E48TB:3 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.106.33 into the hardware due to hash failure

Mar 21 10:09:19: %E48TB:3 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.101.215 into the hardware due to hash failure

Mar 21 10:09:19: %E48TB:3 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.124.25 into the hardware due to hash failure

Mar 21 10:09:19: %E48TB:3 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.101.30 into the hardware due to hash failure

Mar 21 10:09:19: %E48TB:2 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.168.140 into the hardware due to hash failure

Mar 21 10:09:18: %E48PB:0 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.102.28 into the hardware due to hash failure

Mar 21 10:09:18: %E48TB:3 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.168.140 into the hardware due to hash failure

Mar 21 10:09:18: %E48TB:2 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.162.27 into the hardware due to hash failure

Mar 21 10:09:18: %E48PB:1 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.132.196 into the hardware due to hash failure

Mar 21 10:09:18: %E48PB:0 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.205.23 into the hardware due to hash failure

Mar 21 10:09:18: %E48TB:3 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.162.27 into the hardware due to hash failure

Mar 21 10:09:18: %E48PB:0 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.111.27 into the hardware due to hash failure

Mar 21 10:09:18: %E48TB:3 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.164.59 into the hardware due to hash failure

Mar 21 10:09:18: %E48PB:0 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.132.196 into the hardware due to hash failure

Mar 21 10:09:17: %E48TB:3 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.189.162 into the hardware due to hash failure

Mar 21 10:09:17: %E48TB:3 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.168.148 into the hardware due to hash failure

Mar 21 10:09:17: %E48TB:2 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.164.59 into the hardware due to hash failure

Mar 21 10:09:17: %E48TB:2 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.189.162 into the hardware due to hash failure

Mar 21 10:09:17: %E48TB:2 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.168.148 into the hardware due to hash failure

Mar 21 10:09:17: %E48TB:3 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.183.46 into the hardware due to hash failure

Mar 21 10:09:17: %E48TB:3 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.108.72 into the hardware due to hash failure

Mar 21 10:09:17: %E48TB:3 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.189.149 into the hardware due to hash failure

Mar 21 10:09:17: %E48TB:3 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.124.28 into the hardware due to hash failure

Mar 21 10:09:16: %E48TB:3 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.101.193 into the hardware due to hash failure

Mar 21 10:09:16: %E48TB:3 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.183.27 into the hardware due to hash failure

Mar 21 10:09:16: %E48TB:3 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.108.114 into the hardware due to hash failure

Mar 21 10:09:16: %E48TB:3 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.180.96 into the hardware due to hash failure

Mar 21 10:09:16: %E48TB:3 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.101.201 into the hardware due to hash failure

Mar 21 10:09:16: %E48TB:3 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.111.98 into the hardware due to hash failure

Mar 21 10:09:16: %E48TB:3 %FIB6-2-FIB6_HASH_FAIL: Couldn't write IP 10.160.124.49 into the hardware due to hash failure

Откатил FTOS до 7.8.1.0, будем перезагружать ночью, посмотрим что получится...

 

А вот еще интересная вещь. Окуда цифра initial size 4480 в 32 префиксах? И как ее изменить?

krd-core#show ip cam linecard 0 port-set 0 summary

 

Total number of CAM entries = 16384

 

Number of CAM entries used by ARP entries = 3848

 

Number of CAM entries used by Prefix entries = 262

 

Section Current Use Initial Size

--------------------------------------

32 3978 4480

31 0 372

30 0 372

29 1 372

28 0 372

27 0 372

26 0 372

25 0 372

24 129 372

23 0 372

22 0 372

21 0 372

20 0 372

19 0 372

18 0 372

17 0 372

16 2 372

15 0 372

14 0 372

13 0 372

12 0 372

11 0 372

10 0 372

9 0 372

8 0 372

7 0 372

6 0 372

5 0 372

4 0 372

3 0 372

2 0 372

1 0 372

0 0 372

Edited by snn

Share this post


Link to post
Share on other sites

tcam с150 как и в других l3 свичах память на расхват - т.е это и ipv4 роуты, мас таблица и ACL or QOS и все таки она скорее всего переполняется. что еще есть на свиче ? я так вижу на нем достаточно много серых сетей /24 и как следствия не маленькие mac таблицы. Кстати не нашел по C150 есть ли у него templates по настройке использования tcam - типа что, кому, сколько.

меня больше вот это смущает

Total number of CAM entries = 16384

потому как переполнения конкретно FIB таки нету - но tcam кончается.

Share this post


Link to post
Share on other sites

Свич выполняет роль ядра в сети с ~8K абонентов. Покупался на замену устаревшему Extreme BD6800. На нем работает маршрутизация между вланами с серыми сетями и pim с мультикастом. Вланы сведены на брасы с pppoe. И больше по сути ничего нет. Все было хорошо, пока не перенесли на него всю маршрутизацию. Теперь, вот и не знаю что с ним делать... Можно вынести с него маршрутизацию на отдельную железку, но это как-то не правильно... Можно конечно попытаться его вернуть и взять что-то типа cisco 6500, но старье тоже брать не охота... В общем хорошая железка, но с Л3 беда... Переназначение памяти есть, но какое-то странное. Есть всего 13 блоков и эти блоки распределяются между функционалом. По умолчанию так:

 

-- Line card 0 --
          Current Settings(in block sizes)  Next Boot(in block sizes)
L2Acl      :         6                                      5
Ipv4Acl    :         5                                      6
Ipv6Acl    :         0                                      0
Ipv4Qos    :         1                                      1
L2Qos      :         1                                      1

 

В колонке Next Boot мои изменеия. Ночью перезагрузим и посмотрим, что получится. Но, что-то уже не верится, что поможет...

Edited by snn

Share this post


Link to post
Share on other sites

А чё cisco 6500 старьё? Отличное решение и развивается по сей день.

Соотношение цена/качество и количество фич тоже на отличном уровне.

Share this post


Link to post
Share on other sites

Добрый день,

Может кто-то объяснить чем занимается процесс aclAgent на плате (show processes cpu lp) и по каким причинам он может сильно грузить проц?

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
Sign in to follow this