• 1. Docker的网络基础
    • 1.1. Network Namespace
      • 1.1.1. 网络命名空间的实现
      • 1.1.2. 网络命名空间的操作
  • 2. Docker的网络实现
    • 2.1. 容器网络
    • 2.2. 4类网络模式
  • 3. Docker网络模式
    • 3.1. bridge桥接模式
      • 3.1.1. 外部网络访问Docker容器
      • 3.1.2. Docker容器访问外部网络
      • 3.1.3. 缺点
    • 3.2. host模式
    • 3.3. container模式
    • 3.4. none模式

    1. Docker的网络基础

    1.1. Network Namespace

    不同的网络命名空间中,协议栈是独立的,完全隔离,彼此之间无法通信。同一个网络命名空间有独立的路由表和独立的Iptables/Netfilter来提供包的转发、NAT、IP包过滤等功能。

    1.1.1. 网络命名空间的实现

    将与网络协议栈相关的全局变量变成一个Net Namespace变量的成员,然后在调用协议栈函数中加入一个Namepace参数。

    1.1.2. 网络命名空间的操作

    1、创建网络命名空间

    ip netns add name

    2、在命名空间内执行命令

    ip netns exec name command

    3、进入命名空间

    ip netns exec name bash

    2. Docker的网络实现

    2.1. 容器网络

    Docker使用Linux桥接,在宿主机虚拟一个Docker容器网桥(docker0),Docker启动一个容器时会根据Docker网桥的网段分配给容器一个IP地址,称为Container-IP,同时Docker网桥是每个容器的默认网关。因为在同一宿主机内的容器都接入同一个网桥,这样容器之间就能够通过容器的Container-IP直接通信。

    Docker网桥是宿主机虚拟出来的,并不是真实存在的网络设备,外部网络是无法寻址到的,这也意味着外部网络无法通过直接Container-IP访问到容器。如果容器希望外部访问能够访问到,可以通过映射容器端口到宿主主机(端口映射),即docker run创建容器时候通过 -p 或 -P 参数来启用,访问容器的时候就通过[宿主机IP]:[容器端口]访问容器。

    这里写图片描述

    2.2. 4类网络模式

    Docker网络模式 配置 说明
    host模式 —net=host 容器和宿主机共享Network namespace。
    container模式 —net=container:NAME_or_ID 容器和另外一个容器共享Network namespace。 kubernetes中的pod就是多个容器共享一个Network namespace。
    none模式 —net=none 容器有独立的Network namespace,但并没有对其进行任何网络设置,如分配veth pair 和网桥连接,配置IP等。
    bridge模式 —net=bridge(默认为该模式) 桥接模式

    3. Docker网络模式

    3.1. bridge桥接模式

    在bridge模式下,Docker可以使用独立的网络栈。实现方式是父进程在创建子进程的时候通过传入CLONE_NEWNET的参数创建出一个网络命名空间。

    实现步骤:

    1. Docker Daemon首次启动时会创建一个虚拟网桥docker0,地址通常为172.x.x.x开头,在私有的网络空间中给这个网络分配一个子网。
    2. 由Docker创建处理的每个容器,都会创建一个虚拟以太设备对(veth pair),一端关联到网桥,另一端使用Namespace技术映射到容器内的eth0设备,然后从网桥的地址段内给eth0接口分配一个IP地址。

    这里写图片描述

    一般情况,宿主机IP与docker0 IP、容器IP是不同的IP段,默认情况,外部看不到docker0和容器IP,对于外部来说相当于docker0和容器的IP为内网IP。

    3.1.1. 外部网络访问Docker容器

    外部访问docker容器可以通过端口映射(NAT)的方式,Docker使用NAT的方式将容器内部的服务与宿主机的某个端口port_1绑定。

    外部访问容器的流程如下:

    1. 外界网络通过宿主机的IP和映射的端口port_1访问。
    2. 当宿主机收到此类请求,会通过DNAT将请求的目标IP即宿主机IP和目标端口即映射端口port_1替换成容器的IP和容器的端口port_0。
    3. 由于宿主机上可以识别容器IP,所以宿主机将请求发给veth pair。
    4. veth pair将请求发送给容器内部的eth0,由容器内部的服务进行处理。

    3.1.2. Docker容器访问外部网络

    docker容器访问外部网络的流程:

    1. docker容器向外部目标IP和目标端口port_2发起请求,请求报文中的源IP为容器IP。

    2. 请求通过容器内部的eth0到veth pair的另一端docker0网桥。

    3. docker0网桥通过数据报转发功能将请求转发到宿主机的eth0。

    4. 宿主机处理请求时通过SNAT将请求中的源IP换成宿主机eth0的IP。

    5. 处理后的报文通过请求的目标IP发送到外部网络。

    3.1.3. 缺点

    使用NAT的方式可能会带来性能的问题,影响网络传输效率。

    3.2. host模式

    host模式并没有给容器创建一个隔离的网络环境,而是和宿主机共用一个网络命名空间,容器使用宿主机的eth0和外界进行通信,同样容器也共用宿主机的端口资源,即分配端口可能存在与宿主机已分配的端口冲突的问题。

    实现的方式即父进程在创建子进程的时候不传入CLONE_NEWNET的参数,从而和宿主机共享一个网络空间。

    host模式没有通过NAT的方式进行转发因此性能上相对较好,但是不存在网络隔离性,可能产生端口冲突的问题。

    3.3. container模式

    container模式即docker容器可以使用其他容器的网络命名空间,即和其他容器处于同一个网络命名空间。

    步骤:

    1. 查找其他容器的网络命名空间。
    2. 新创建的容器的网络命名空间使用其他容器的网络命名空间。

    通过和其他容器共享网络命名空间的方式,可以让不同的容器之间处于相同的网络命名空间,可以直接通过localhost的方式进行通信,简化了强关联的多个容器之间的通信问题。

    k8s中的pod的概念就是通过一组容器共享一个网络命名空间来达到pod内部的不同容器可以直接通过localhost的方式进行通信。

    3.4. none模式

    none模式即不为容器创建任何的网络环境,用户可以根据自己的需要手动去创建不同的网络定制配置。

    参考:

    • 《Docker源码分析》