La solution de «micro-rafale» dans le scénario d'application de capture de trafic de réseau de contournement

Dans le scénario d'application NPB typique, le problème le plus gênant pour les administrateurs est la perte de paquets causée par la congestion de paquets en miroir et de réseaux NPB. La perte de paquets dans le NPB peut provoquer les symptômes typiques suivants dans les outils d'analyse back-end:

- Une alarme est générée lorsque l'indicateur de surveillance des performances du service APM diminue et que le taux de réussite des transactions diminue

- L'alarme d'exception de l'indicateur de surveillance des performances du réseau NPM est générée

- Le système de surveillance de la sécurité ne parvient pas à détecter les attaques de réseau en raison de l'omission des événements

- Perte des événements d'audit de comportement de service générés par le système d'audit du service

... ...

En tant que système de capture et de distribution centralisé pour la surveillance du pontage, l'importance du NPB est évidente. Dans le même temps, la façon dont il traite le trafic de paquets de données est très différente du commutateur de réseau en direct traditionnel, et la technologie de contrôle de la congestion du trafic de nombreux réseaux en direct de service n'est pas applicable à NPB. Comment résoudre la perte de paquets NPB, commençons par l'analyse de cause profonde de la perte de paquets pour le voir!

Analyse des causes racines de la congestion des pertes de paquets NPB / Tap

Tout d'abord, nous analysons le chemin de la circulation réel et la relation de cartographie entre le système et le nouveau et sortant du niveau 1 ou du réseau NPB de niveau. Peu importe le type de topologie de réseau NPB Forms, en tant que système de collecte, il existe une relation de trafic et de sortie de trafic entre "l'accès" et la "sortie" de l'ensemble du système.

Micro Burst 1

Ensuite, nous examinons le modèle commercial de NPB du point de vue des puces ASIC sur un seul appareil:

Micro Burst 2

Caractéristique 1: Le "trafic" et la "vitesse d'interface physique" des interfaces d'entrée et de sortie sont asymétriques, ce qui entraîne un grand nombre de micro-burses est un résultat inévitable. Dans les scénarios d'agrégation de trafic typiques de plusieurs à un ou de plusieurs à plusieurs, la vitesse physique de l'interface de sortie est généralement inférieure à la vitesse physique totale de l'interface d'entrée. Par exemple, 10 canaux de collection 10g et 1 canal de sortie 10g; Dans un scénario de déploiement à plusieurs niveaux, tous les NPBB peuvent être considérés dans son ensemble.

Caractéristique 2: Les ressources ASIC Chip Cache sont très limitées. En termes de puce ASIC actuellement couramment utilisée, la puce avec une capacité d'échange de 640 Gbit / s a ​​un cache de 3 à 10 mètres; Une puce de capacité de 3,2 Tbps a un cache de 20 à 50 mytes. Y compris Broadcom, Barefoot, CTC, Marvell et d'autres fabricants de puces ASIC.

Caractéristique 3: Le mécanisme conventionnel de contrôle du flux PFC de bout en bout n'est pas applicable aux services NPB. Le cœur du mécanisme de contrôle du flux PFC est d'obtenir une rétroaction de suppression du trafic de bout en bout et, finalement, de réduire l'envoi de paquets à la pile de protocole du critère de fin de communication pour atténuer la congestion. Cependant, la source de paquets de services NPB est des paquets en miroir, de sorte que la stratégie de traitement de la congestion ne peut être rejetée ou mise en cache.

Ce qui suit est l'apparition d'un micro-burst typique sur la courbe d'écoulement:

Micro Burst 3

Prenant une interface 10g à titre d'exemple, dans le deuxième niveau du diagramme d'analyse de tendance de trafic, le taux de trafic est maintenu à environ 3 Gbit / s pour une longue période. Sur le graphique d'analyse des tendances micro millisecondes, la pointe de trafic (microburste) a considérablement dépassé le taux physique de l'interface 10g.

Techniques clés pour atténuer la microburste NPB

Réduire l'impact de la non-concordance de taux d'interface physique asymétrique- Lors de la conception d'un réseau, réduisez autant que possible les taux d'interface physique et de sortie asymétriques. Une méthode typique consiste à utiliser un lien d'interface de liaison montante à taux plus élevé et à éviter les taux d'interface physique asymétriques (par exemple, la copie du trafic GBIT / s et 10 Gbit / s en même temps).

Optimiser la politique de gestion du cache du service NPB- La stratégie de gestion de cache commune applicable au service de commutation n'est pas applicable au service de transfert du service NPB. La politique de gestion du cache de la garantie statique + le partage dynamique doit être implémentée en fonction des fonctionnalités du service NPB. Afin de minimiser l'impact de la microburste NPB sous la limitation actuelle de l'environnement matériel de la puce.

Mettre en œuvre la gestion classifiée de l'ingénierie du trafic- Mettre en œuvre la gestion de la classification des services d'ingénierie du trafic prioritaire en fonction de la classification du trafic. Assurez-vous la qualité du service des différentes files d'attente de priorité en fonction de la bande passante des files d'attente de catégorie et assurez-vous que les paquets de trafic de service sensibles aux utilisateurs peuvent être transmis sans perte de paquets.

Une solution système raisonnable améliore la capacité de mise en cache des paquets et la capacité de mise en forme du trafic- intègre la solution par divers moyens techniques pour étendre la capacité de mise en cache des paquets de la puce ASIC. En façonnant l'écoulement à différents endroits, le micro-burse devient une courbe d'écoulement micro-uniforme après la mise en forme.

Solution de gestion du trafic MyLinking ™ Micro Burst

Schéma 1 - Stratégie de gestion du cache optimisé par le réseau + gestion de priorité de qualité de service de service classifié à l'échelle du réseau

Stratégie de gestion du cache optimisée pour l'ensemble du réseau

Sur la base de la compréhension approfondie des caractéristiques du service NPB et des scénarios commerciaux pratiques d'un grand nombre de clients, les produits de collecte de trafic MyLinking ™ mettent en œuvre un ensemble de stratégie de gestion du cache NPB de "Assurance statique + dynamique" pour l'ensemble du réseau, qui a un bon effet sur la gestion du cache de trafic dans le cas d'un grand nombre d'interfaces d'entrée et de sortie asymétriques. La tolérance à la microburste est réalisée dans la mesure maximale lorsque le cache de puce ASIC actuel est fixé.

Technologie de traitement de Microburst - Gestion basée sur les priorités commerciales

Micro Burst 4

Lorsque l'unité de capture de trafic est déployée indépendamment, elle peut également être priorisée en fonction de l'importance de l'outil d'analyse back-end ou de l'importance des données de service elle-même. Par exemple, parmi de nombreux outils d'analyse, l'APM / BPC a une priorité plus élevée que les outils d'analyse / de surveillance de la sécurité car il implique la surveillance et l'analyse de diverses données d'indicateur de systèmes commerciaux importants. Par conséquent, pour ce scénario, les données requises par APM / BPC peuvent être définies comme une priorité élevée, les données requises par les outils de surveillance de la sécurité / d'analyse de sécurité peuvent être définies comme une priorité moyenne, et les données requises par d'autres outils d'analyse peuvent être définies comme une faible priorité. Lorsque les paquets de données collectés entrent dans le port d'entrée, les priorités sont définies en fonction de l'importance des paquets. Des paquets de priorités plus élevées sont transférés de préférence après que les paquets de priorités plus élevées sont transmis et que les paquets d'autres priorités soient transmis après la transmission des paquets de priorités plus élevées. Si des paquets de priorités plus élevées continuent d'arriver, les paquets de priorités plus élevées sont préférentiellement transmis. Si les données d'entrée dépassent la capacité de transfert du port de sortie pendant une longue période, l'excès de données est stocké dans le cache de l'appareil. Si le cache est plein, l'appareil rejette préférentiellement les paquets de l'ordre inférieur. Ce mécanisme de gestion hiérarchisé garantit que les outils d'analyse clés peuvent obtenir efficacement les données de trafic d'origine requises pour l'analyse en temps réel.

Technologie de traitement de Microburst - Mécanisme de garantie de classification de l'ensemble de la qualité du service du réseau

Micro Burst 5

Comme le montre la figure ci-dessus, la technologie de classification du trafic est utilisée pour distinguer différents services sur tous les appareils de la couche d'accès, de la couche d'agrégation / noyau et de la couche de sortie, et les priorités des paquets capturés sont redémarrés. Le contrôleur SDN fournit la politique de priorité du trafic de manière centralisée et l'applique aux dispositifs de transfert. Tous les appareils participant au réseautage sont cartographiés à différentes files d'attente de priorités en fonction des priorités transportées par les paquets. De cette façon, les paquets de priorité avancée à petit trafic peuvent atteindre zéro perte de paquets. Résolvez efficacement le problème de perte de paquets de la surveillance APM et des services de trafic de contournement des services spéciaux.

Solution 2 - Cache du système d'extension de niveau GB + Schéma de mise en forme du trafic
Cache étendue du système GB de niveau GB
Lorsque l'appareil de notre unité d'acquisition de trafic a des capacités de traitement fonctionnel avancées, il peut ouvrir une certaine quantité d'espace dans la mémoire (RAM) de l'appareil comme tampon global de l'appareil, ce qui améliore considérablement la capacité de tampon de l'appareil. Pour un seul dispositif d'acquisition, au moins une capacité GB peut être fournie comme l'espace de cache du dispositif d'acquisition. Cette technologie rend la capacité tampon de notre appareil d'unité d'acquisition de trafic des centaines de fois plus élevé que celle du dispositif d'acquisition traditionnel. Dans le même taux de transfert, la durée de micro-rafale maximale de notre dispositif d'unité d'acquisition de trafic devient plus longue. Le niveau de la milliseconde soutenu par un équipement d'acquisition traditionnel a été mis à niveau au deuxième niveau, et le temps de micro-burnière qui peut résister a été augmenté de milliers de fois.

Capacité de mise en forme du trafic à plusieurs quelles

Technologie de traitement de Microburst - Une solution basée sur une grande mise en cache de tampon + mise en forme du trafic

Micro Burst 6

Avec une capacité de tampon super-large, les données de trafic générées par Micro-Burst sont mises en cache et la technologie de mise en forme du trafic est utilisée dans l'interface sortante pour obtenir une sortie en douceur des paquets vers l'outil d'analyse. Grâce à l'application de cette technologie, le phénomène de perte de paquets causé par un micro-burst est fondamentalement résolu.


Heure du poste: février-27-2024