La solution du « micro-rafale » dans le scénario d'application de capture de trafic réseau de contournement

Dans le scénario d'application NPB typique, le problème le plus gênant pour les administrateurs est la perte de paquets causée par la congestion des paquets en miroir et des réseaux NPB. La perte de paquets dans NPB peut provoquer les symptômes typiques suivants dans les outils d'analyse back-end :

- Une alarme est générée lorsque l'indicateur de surveillance des performances du service APM diminue et que le taux de réussite des transactions diminue

- L'alarme d'exception de l'indicateur de surveillance des performances du réseau NPM est générée

- Le système de surveillance de la sécurité ne parvient pas à détecter les attaques réseau en raison de l'omission d'un événement

- Événements d'audit de comportement de perte de service générés par le système d'audit de service

... ...

En tant que système centralisé de capture et de distribution pour la surveillance du contournement, l’importance de NPB est évidente. Dans le même temps, la façon dont il traite le trafic de paquets de données est assez différente de celle du commutateur de réseau en direct traditionnel, et la technologie de contrôle des embouteillages de nombreux réseaux de service en direct n'est pas applicable au NPB. Comment résoudre la perte de paquets NPB, commençons par l'analyse des causes profondes de la perte de paquets pour le voir !

Analyse des causes profondes de la congestion des pertes de paquets NPB/TAP

Tout d'abord, nous analysons le chemin de trafic réel et la relation de cartographie entre le système et les entrées et sorties du réseau de niveau 1 ou niveau NPB. Quel que soit le type de topologie de réseau que NPB forme, en tant que système de collecte, il existe une relation plusieurs-à-plusieurs de trafic d'entrée et de sortie entre « l'accès » et la « sortie » de l'ensemble du système.

Micro-rafale 1

Nous examinons ensuite le modèle économique de NPB du point de vue des puces ASIC sur un seul appareil :

Micro-rafale 2

Caractéristique 1: Le "trafic" et le "taux d'interface physique" des interfaces d'entrée et de sortie sont asymétriques, ce qui entraîne un grand nombre de micro-rafales est un résultat inévitable. Dans les scénarios typiques d'agrégation de trafic plusieurs-à-un ou plusieurs-à-plusieurs, le débit physique de l'interface de sortie est généralement inférieur au débit physique total de l'interface d'entrée. Par exemple, 10 canaux de collecte 10G et 1 canal de sortie 10G ; Dans un scénario de déploiement à plusieurs niveaux, tous les NPBBS peuvent être considérés comme un tout.

Caractéristique 2: Les ressources du cache de la puce ASIC sont très limitées. En ce qui concerne la puce ASIC actuellement couramment utilisée, la puce avec une capacité d'échange de 640 Gbit/s dispose d'un cache de 3 à 10 Mo ; Une puce d'une capacité de 3,2 Tbit/s dispose d'un cache de 20 à 50 Mo. Y compris BroadCom, Barefoot, CTC, Marvell et d'autres fabricants de puces ASIC.

Caractéristique 3: Le mécanisme conventionnel de contrôle de flux PFC de bout en bout n'est pas applicable aux services NPB. Le cœur du mécanisme de contrôle de flux PFC est d'obtenir un retour de suppression du trafic de bout en bout et, en fin de compte, de réduire l'envoi de paquets à la pile de protocoles du point de terminaison de communication afin de réduire la congestion. Cependant, la source de paquets des services NPB est constituée de paquets en miroir, de sorte que la stratégie de traitement de la congestion ne peut être ignorée ou mise en cache.

Voici l’apparition d’une micro-rafale typique sur la courbe de débit :

Micro-rafale 3

En prenant l'interface 10G comme exemple, dans le diagramme d'analyse des tendances du trafic de deuxième niveau, le débit du trafic est maintenu à environ 3 Gbit/s pendant une longue période. Sur le graphique d'analyse des tendances en micromillisecondes, le pic de trafic (MicroBurst) a largement dépassé le débit physique de l'interface 10G.

Techniques clés pour atténuer les microrafales NPB

Réduire l’impact de l’inadéquation asymétrique des débits d’interface physique- Lors de la conception d'un réseau, réduisez autant que possible les débits d'interface physique asymétriques d'entrée et de sortie. Une méthode typique consiste à utiliser une liaison d'interface de liaison montante à débit plus élevé et à éviter les débits d'interface physique asymétriques (par exemple, copier du trafic à 1 Gbit/s et à 10 Gbit/s en même temps).

Optimiser la politique de gestion du cache du service NPB- La politique commune de gestion du cache applicable au service de commutation n'est pas applicable au service de redirection du service NPB. La politique de gestion du cache de garantie statique + partage dynamique doit être mise en œuvre en fonction des fonctionnalités du service NPB. Afin de minimiser l'impact de la microrafale NPB dans le cadre de la limitation actuelle de l'environnement matériel de la puce.

Mettre en œuvre la gestion de l’ingénierie du trafic classifié- Mettre en œuvre une gestion de la classification des services d'ingénierie du trafic prioritaire basée sur la classification du trafic. Garantissez la qualité de service des différentes files d'attente prioritaires en fonction des bandes passantes des files d'attente de catégorie et assurez-vous que les paquets de trafic de service sensibles à l'utilisateur peuvent être transférés sans perte de paquets.

Une solution système raisonnable améliore la capacité de mise en cache des paquets et la capacité de gestion du trafic- Intègre la solution via divers moyens techniques pour étendre la capacité de mise en cache des paquets de la puce ASIC. En façonnant l'écoulement à différents endroits, la micro-rafale devient une courbe d'écoulement micro-uniforme après mise en forme.

Solution de gestion du trafic Mylinking™ Micro Burst

Schéma 1 - Stratégie de gestion du cache optimisée pour le réseau + gestion des priorités de qualité de service classifiée à l'échelle du réseau

Stratégie de gestion du cache optimisée pour l'ensemble du réseau

Basés sur une compréhension approfondie des caractéristiques du service NPB et des scénarios commerciaux pratiques d'un grand nombre de clients, les produits de collecte de trafic Mylinking™ mettent en œuvre un ensemble de stratégies de gestion du cache NPB « assurance statique + partage dynamique » pour l'ensemble du réseau, qui a un bon effet sur la gestion du cache de trafic dans le cas d'un grand nombre d'interfaces d'entrée et de sortie asymétriques. La tolérance aux microrafales est atteinte au maximum lorsque le cache de la puce ASIC actuel est corrigé.

Technologie de traitement des microrafales - Gestion basée sur les priorités commerciales

Micro-rafale 4

Lorsque l’unité de capture du trafic est déployée de manière indépendante, elle peut également être priorisée en fonction de l’importance de l’outil d’analyse back-end ou de l’importance des données de service elles-mêmes. Par exemple, parmi de nombreux outils d’analyse, APM/BPC a une priorité plus élevée que les outils d’analyse/surveillance de la sécurité car il implique la surveillance et l’analyse de diverses données d’indicateurs de systèmes commerciaux importants. Par conséquent, pour ce scénario, les données requises par APM/BPC peuvent être définies comme étant de priorité élevée, les données requises par les outils de surveillance/analyse de la sécurité peuvent être définies comme étant de priorité moyenne et les données requises par d'autres outils d'analyse peuvent être définies comme étant de faible priorité. priorité. Lorsque les paquets de données collectés entrent dans le port d'entrée, les priorités sont définies en fonction de l'importance des paquets. Les paquets de priorités plus élevées sont transmis de préférence après la transmission des paquets de priorités plus élevées, et les paquets d'autres priorités sont transmis après la transmission des paquets de priorités plus élevées. Si des paquets de priorités plus élevées continuent d’arriver, les paquets de priorités plus élevées sont transmis de manière préférentielle. Si les données d'entrée dépassent la capacité de transfert du port de sortie pendant une longue période, les données excédentaires sont stockées dans le cache de l'appareil. Si le cache est plein, l'appareil rejette préférentiellement les paquets d'ordre inférieur. Ce mécanisme de gestion hiérarchisé garantit que les outils d'analyse clés peuvent obtenir efficacement les données de trafic originales requises pour l'analyse en temps réel.

Microburst Processing Technology - mécanisme de garantie de classification de la qualité de service de l'ensemble du réseau

Micro-rafale 5

Comme le montre la figure ci-dessus, la technologie de classification du trafic est utilisée pour distinguer différents services sur tous les appareils au niveau de la couche d'accès, de la couche d'agrégation/cœur et de la couche de sortie, et les priorités des paquets capturés sont remarquées. Le contrôleur SDN fournit la politique de priorité du trafic de manière centralisée et l'applique aux appareils de transfert. Tous les appareils participant au réseau sont mappés sur différentes files d'attente prioritaires en fonction des priorités portées par les paquets. De cette manière, les paquets prioritaires avancés à faible trafic peuvent atteindre une perte de paquet nulle. Résolvez efficacement le problème de perte de paquets de la surveillance APM et des services de trafic de contournement d'audit de services spéciaux.

Solution 2 - Cache système d'extension au niveau Go + schéma de mise en forme du trafic
Cache étendu du système au niveau Go
Lorsque l'appareil de notre unité d'acquisition de trafic dispose de capacités de traitement fonctionnelles avancées, il peut libérer une certaine quantité d'espace dans la mémoire (RAM) de l'appareil en tant que tampon global de l'appareil, ce qui améliore considérablement la capacité tampon de l'appareil. Pour un dispositif d'acquisition unique, une capacité d'au moins Go peut être fournie comme espace de cache du dispositif d'acquisition. Cette technologie rend la capacité tampon de notre unité d'acquisition de trafic des centaines de fois supérieure à celle du dispositif d'acquisition traditionnel. Avec le même taux de transfert, la durée maximale des micro-rafales de notre unité d'acquisition de trafic devient plus longue. Le niveau de millisecondes pris en charge par l'équipement d'acquisition traditionnel a été amélioré au deuxième niveau, et le temps de micro-rafale pouvant être supporté a été augmenté des milliers de fois.

Capacité de mise en forme du trafic multi-files d'attente

Microburst Processing Technology - une solution basée sur une grande mise en cache de tampons + une mise en forme du trafic

Micro-rafale 6

Avec une très grande capacité tampon, les données de trafic générées par micro-rafale sont mises en cache et la technologie de mise en forme du trafic est utilisée dans l'interface sortante pour obtenir une sortie fluide des paquets vers l'outil d'analyse. Grâce à l'application de cette technologie, le phénomène de perte de paquets provoqué par les micro-rafales est fondamentalement résolu.


Heure de publication : 27 février 2024