CNATDA 第五章学习笔记

Study Notes CNATDA

Introduction

control plane 计算 forwarding 和 flow tables 有两种方式:

  • per-router control: router 之间进行交流,分别计算自己的 forwarding table
  • logically centralized control: 由一个 remote controller 收集信息,计算并分发结果

Routing Algorithms

在 routing algorithms 中,network 被抽象为一张图,综合考虑 physical length、link speed、monetary cost 等作为边权。

routing algorithm 可以分为以下几类:

  • centralized / decentralized: 计算过程中是否知道整张图的信息
  • static / dynamic: 是否对网络负载、拓扑结构等的变化作出响应
  • load-sensitive / load-insensitive: 是否考虑 congestion 的状况

LS 是 centralized routing algorithm,需要每个结点将 attached links 的信息进行广播 (link-state broadcast) 让所有结点拥有整张图的信息,再用 Dijkstra 等算法计算最短路。

对于 load-sensitive routing algorithm,traffic load 的改变可能会导致出现 oscillations,解决办法就是改成 load-insensitive 的或者保证不是所有结点都在同时运行 LS。

The Distance-Vector (DV) Routing Algorithm

DV 是 distributed、 iterative、decentralized 的 routing algorithm。

每个结点维护自己到其他每个结点的 distance vector,当自己的 distance vector 更新了就将自己的 distance vector 发送给 neighbor,并且也会由 neighbor 的 distance vector 更新自己的,当 link state 发生改变时,DV 会经过多轮迭代并进行传播最终收敛。

当 link-cost 减小时,收敛较快。但是当 link-cost 增大时,由于不在这个 link 上的那个结点的消息滞后性,可能会导致 yyzz 来更新 Dy(x)D_y(x),然后 zzyy 来更新 Dz(x)D_z(x),两者互相更新最终需要边权值域大小次的迭代(称为 count to infinity problem),并在过程中产生 routing loop,如下图所示:

使用 poisoned reverse 可以避免出现二元环:如果 uu 通过 vv 走了 (u,w)(u, w) 这条路径,则在 uu 通知 vv 的时候将 Du(w)D_u(w) 改成 \infty

当出现大于 2 个结点的 loop 时,poisoned reverse 会失效。

A Comparison of LS and DV Routing Algorithms

  • message complexity: LS 需要每个结点获得全局的信息,而且需要结点将信息送到很远的地方;DV 仅仅需要结点知道 neighbor 的信息。
  • speed of convergence: LS 时间复杂度较低(Dijkstra 可以使用优先队列优化到 O(nlogn)\mathcal{O}(n\log n) ); DV 则较慢,过程中可能出现 routing loop,还有 count-to-infonity problem。
  • robustness: 在 LS 中每个结点可以发送错误的 link state 给其他结点,但是由于每个结点只计算自己的 forwarding table,不依赖于其他结点的,所以影响较小;DV 中每个结点的计算结果都是其他结点的结果的一部分,影响较大。

实际上 Internet 同时采用了这两种算法。

Intra-AS Routing in the Internet: OSPF

如果统一管理所有的 routers,会规模过大性能无法接受,也不能满足自治的需求。因此,routers 被划分成了很多个 autonomous system (AS),每个 AS 有一个 ICANN 赋予的编号,每个 ISP 可能管理一个或多个 AS。

每个 AS 内部都会使用一种 intra-AS routing protocol,例如 OSPF (Open Shortest Path First)。

OSPF 使用 LS routing algorithm,边权由管理员设定,router 向整个 AS 内部 broadcast link state(当 link state 发送改变时/周期性地)。

OSPF 有以下一些 advances:

  • security: routers 之间的信息可以利用 MD5 进行 authentication
  • multiple same-cost paths: 当有多条路径的 cost 相同时可以同时使用这些路径
  • 有 MOSPF 拓展来支持 unicast 和 multicast
  • hierarchy within a single AS: 可以将 AS 划分成多个 area 来形成 AS 内部的 hierarchy,每个 area 内部走最段路,不同 area 之间通过走 area 的 border router 来走 backbone area

Routing Among the ISPs: BGP

BGP (Border Gateway Protocol) 是一个 decentralized、asynchronous 的 inter-AS routing protocol。

The Role of BGP

在 BGP 中,destination 的不是确定的 IP 地址,而是 CIDR prefix。

BGP 使得一个 AS 可以向其他 AS advertise prefix,并计算出到达各个 prefix 的 route。

不同的 router 之间会建立称为 BGP connection 的 TCP connection,负责连接两个 AS 的 gateway router 之间会建立 external BGP (eBGP) connection,AS 内部的 router 两两之间会建立 internal BGP (iBGP)。

假设要向所有 router advertise 前往 prefix xx 的路径:

  • xx 所在的 AS 的 gateway router 会向周围 AS 的 gateway router 发送 eBGP message,类似于 AS3 x
  • 其他 AS 的 gateway router 收到后会向 AS 内部广播 iBGP message: AS3 x
  • 之后其他的 gateway router 会继续向相邻的 AS 的 gateway router 发送 eBGP message,并在 advertisement 中加入自己所在的 AS,类似于 AS2 AS3 x

Determining the Best Routes

一条 BGP advertisement 包含 AS-PATH 和 NEXT-HOP 等信息(称为 BGP attributes,加上 prefix 就称为一个 route):

  • AS-PATH 表示到达目的地需要经过的 AS,一个 AS 收到来自其他 AS 的 route 后可以在其中加上自己,然后继续发送给 neighbor
  • NEXT-HOP 表示离开当前 AS 去往目的地需要走到的下一个 AS 的第一个 router 的 IP 地址

从一个 AS 出发到达某个 prefix 有很多种路径,在实践中,BGP 采用的是 route- selection algorithm,router 按照顺序使用以下几条规则来选择 best route:

  • 由管理员设置或者从其他 AS 获得的 local preference(作为一个 attribute)
  • shortest AS-PATH(经过最少的 AS),当这条 rule 成为唯一的 rule 时采用 DV 算法,边权设置为 AS hops 的数量。
  • hot patato routing: 在 AS 内走最短路(通过 intra-AS protocol 以及 NEXT-HOP 得到)到达 gateway router
  • 根据 BGP identifier 选

IP-anycast

BGP 可以为前往某个 prefix 寻找 best route,如果给多个 host 设置相同的 IP 地址,即可实现 IP-anycast,例如 CDN 为客户寻找最合适的 server,这一过程是在 router 的挑选中实现的。

IP-anycast 如果用于 TCP 可能会导致同一个 TCP connection 中的 message 发送给不同的 host,所以 CDN 一般不采用 IP-anycast,而 DNS root server 则采用(使用 UDP)。

Routing Policy

local preference 的存在为管理员决定如何选择 route 以及实现某些 policy 提供了可能。

The SDN Control Plane

info

因为时间很紧 + 考试不考,所以这部分写的比较简略,而且~~基本全靠抄 ouuan dalao 的笔记~~,要有更好的理解还是去看书或者看 ouuan dalao 的笔记。

SDN 分为 SDN controller、network management applications(例如 routing、access control、load balancing) 和 controlled devices 三个部分。

SDN 使用 generalized forwarding,通过 network-control application 提供 network control functions,实现了 programmable network。

SDN 将 network functionality 进行了 unbundle,使得 packet switches、SDN controller、network management applications 可以来自不同供应商。

  • communication layer (northbound API): controlled devices 和 SDN controller 进行通信。
  • network-wide state-management layer: SDN controller 维护的一些信息。
  • interface to the network-control application layer (southbound API): 让 network-control applications 能够读写 network state 和 flow tables 等信息,通过 RESTful API 等方式进行通信。

在 OpenFlow 中,SDN controller 可以向 controlled device 发送:

  • configuration
  • modify/read-state
  • send packet

controlled device 可以向 SDN controller 发送:

  • flow-removed
  • port-status
  • packet-in

ICMP: The Internet Control Message Protocol

ICMP 被用来进行 router 和 host 之间的通信,作为 IP payload 进行传输。

ICMP 的 message 有很多种,例如:

  • ping 使用的 echo request 和 echo reply
  • destination network/host/protocol/port unreachable
  • destination network/host unknown
  • router advertisement/discovery
  • TTL expired
  • IP header bad

traceroute 使用 ICMP 通过发送 TTL 递增的 UDP segment with an unlikely port number 给 host,通过 TTL expired 得知每一个 router 的信息,通过 port unreachable 得到终点的信息。

Network Management and SNMP, NETCONF/YANG

network management 包括 managing server(包括 network managers)、managed device、data(每个 device 有 configuration data、operational data、device statistics,而 managing server 会维护每个 device 和整个 network 的 data)、network management agent、network management protocol。

进行 network management 有以下几种方式:

  • CLI: error-prone,不能 scale to larger-sized network。
  • SNMP/MIB: 每个 device 有 management information base (MIB) objects,可以使用 simple network management protocol (SNMP) 来获取/设置 MIB objects 的 data,device 可以发送 trap message 向 managing server 通知状态变化。由于 SNMP/MIB 针对的是单个的 device,也难以 scale。
  • NETCONF/YANG: NETCONF 比 SNMP 更注重配置管理,可以一次性操控多个 device,设置 constraint 来检查配置的正确性,使用 YANG 作为 data modeling language,以 XML 格式通过 TLS 进行通信。

Author: f1a3h

Permalink: https://blog.rbkou.me/Study-Notes/CNATDA/cnatda-ch5/

文章默认使用 CC BY-NC-SA 4.0 协议进行许可,使用时请注意遵守协议。

Comments