Jump to content
Калькуляторы

Juniper MX240 утечка памяти

Доброго времени суток.

В маршрутизатор установлены две линейные карты MPCE Type 2 3D P и MPCE Type 2 3D. Для сбора трафика настроен сэмплинг на картах

 

fpc 1 {
    pic 1 {
        tunnel-services {
            bandwidth 10g;
        }
    }
    sampling-instance nfv10-ipv4;
}
fpc 2 {
    pic 1 {
        tunnel-services {
            bandwidth 10g;
        }
    }
    sampling-instance nfv10-ipv4;
}

 

На интерфейсах куда подключаются вышестоящие операторы

 

unit 2 {
    vlan-id 2;
    family inet {
        sampling {
            input;
        }
        address X.X.X.X/X;
    }
}

unit 3 {
    vlan-id 3;
    family inet {
        sampling {
            input;
        }
        address X.X.X.X/X;
    }
}

 

Юниты висели на физических интерфейсах, всё было прекрасно. Решили перекинуть их на коммутатор который уже был подключен к маршрутизатору двумя линками и собран LAG. Юниты соответственно тоже перенесли под ae0.

Тут и началось самое интересное, на fpc моментально улетела свободная FW память, с 76% до 2%, а в логах

 

smid: FPC Resource Monitor: FPC 1 PFE 0 Next Hop Memory has crossed free memory watermark of 20
smid: FPC Resource Monitor: FPC 1 PFE 1 Next Hop Memory has crossed free memory watermark of 20
smid: FPC Resource Monitor: FPC 2 PFE 0 Next Hop Memory has crossed free memory watermark of 20
smid: FPC Resource Monitor: FPC 2 PFE 1 Next Hop Memory has crossed free memory watermark of 20

 

Отключаешь sampling-instance nfv10-ipv4 на fpc и память возвращается. В чём прикол?

Share this post


Link to post
Share on other sites

10 часов назад, GrandPr1de сказал:

ae0 собран из портов на разных платах?

подозреваю что надо уходить на сфлоу, есть предположение, что оно нетфлоу стейты начинает синхронизировать между платами и они вообще такому не рады

покажите полностью конфиг касательно семплинга, какие рейты, какой размер таблицы, вот это всё

Share this post


Link to post
Share on other sites

10 часов назад, GrandPr1de сказал:

подозреваю что надо уходить на сфлоу, есть предположение, что оно нетфлоу стейты начинает синхронизировать между платами и они вообще такому не рады

покажите полностью конфиг касательно семплинга, какие рейты, какой размер таблицы, вот это всё

Скорее всего вы правы, вот конфиг

 

chassis {
    redundancy {
        routing-engine 0 master;
        routing-engine 1 backup;
        graceful-switchover;
    }
    aggregated-devices {
        ethernet {
            device-count 1;
        }
    }
    fpc 1 {
        pic 1 {
            tunnel-services {
                bandwidth 10g;
            }
        }
        inactive: sampling-instance nfv10-ipv4;
    }
    fpc 2 {
        pic 1 {
            tunnel-services {
                bandwidth 10g;
            }
        }
        inactive: sampling-instance nfv10-ipv4;
    }
    alarm {
        management-ethernet {
            link-down ignore;
        }
    }
}
services {
    inactive: flow-monitoring {
        version-ipfix {
            template nfv10-ipv4 {
                template-refresh-rate {
                    seconds 60;
                }
                option-refresh-rate {
                    seconds 60;
                }
                ipv4-template;
            }
        }
    }
}
interfaces {
    xe-1/0/0 {
        gigether-options {
            802.3ad ae0;
        }
    }
    xe-2/0/0 {
        gigether-options {
            802.3ad ae0;
        }
    }
    ae0 {
        vlan-tagging;
        aggregated-ether-options {
            link-speed 10g;
            lacp {
                passive;
            }
        }
        unit 2 {
            vlan-id 2;
            family inet {
                inactive: sampling {
                    input;
                }
                address X.X.X.X/X;
            }
        }
        unit 3 {
            vlan-id 3;
            family inet {
                inactive: sampling {
                    input;
                }
                address X.X.X.X/X;
            }
        }
    }
}
forwarding-options {
    inactive: sampling {
        instance {
            nfv10-ipv4 {
                input {
                    rate 1;
                    run-length 0;
                }
                family inet {
                    output {
                        flow-inactive-timeout 15;
                        flow-active-timeout 60;
                        flow-server X.X.X.X {
                            port 2055;
                            version-ipfix {
                                template {
                                    nfv10-ipv4;
                                }
                            }
                        }
                        inline-jflow {
                            source-address X.X.X.X;
                        }
                    }
                }
            }
        }
    }
}

Share this post


Link to post
Share on other sites

2 часа назад, swat11 сказал:

rate 1;

ну это вот вообще огонь

лучше уже тапы делать и сниффать трафик чем-то другим чем rate 1 для нетфлоу

Share this post


Link to post
Share on other sites

21 час назад, GrandPr1de сказал:

ну это вот вообще огонь

лучше уже тапы делать и сниффать трафик чем-то другим чем rate 1 для нетфлоу

Я настраивал по этому мануалу https://www.juniper.net/documentation/en_US/northstar4.1.0/topics/concept/northstar-netflow-collector.html

Щас посмотрел старую конфигурацию на другом маршрутизаторе, там rate 100

Share this post


Link to post
Share on other sites

В 06.11.2019 в 12:08, GrandPr1de сказал:

ну это вот вообще огонь

лучше уже тапы делать и сниффать трафик чем-то другим чем rate 1 для нетфлоу

Пробовал выставлять rate 100/1000/2000, всё равно память уходит, но при 2000 появились новые ошибки, причём только на одной карте

 

fpc1 SAMPLER-RR:sampler_rr_add_as_info(3449): Failed to ADD AS-RECORD as-index=1014. status(8)

fpc1 jnh_partition_ok(15422): jnh_expand_partition failed, inst 0, jnh_app Inline Jflow Sample RR (DFW), dwords 65536

fpc1 jnh_add_prefix_table(343): Table Partition, Inline Jflow Sample RR (DFW) does not have enough room

fpc1 jnh_partition_ok(15422): jnh_expand_partition failed, inst 0, jnh_app Inline Jflow Sample RR (DFW), dwords 65536

Share this post


Link to post
Share on other sites

57 минут назад, swat11 сказал:

Пробовал выставлять rate 100/1000/2000

я думаю без разницы пока карты пытаются синхронизировать флоу между собой, это тупиковый путь

Share this post


Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.