• Envoy mesh 教程
    • 前提条件
    • 部署应用
    • 部署 edge envoy
    • 部署 usersvc2
    • 服务发现服务 - SDS
    • 参考

    Envoy mesh 教程

    注意:本书中的 Service Mesh 章节已不再维护,请转到 istio-handbook 中浏览。

    本文是在 Kubernetes 集群中,使用 Envoy 来做 mesh,来为一个简单的使用 Python 编写的 Flask 应用程序做反向代理和负载均衡。

    :本教程中的示例来自 envoy-steps,本文中使用的所有的代码和 YAML 配置见 envoy-tutorial。

    Envoy Mesh架构图

    前提条件

    使用 kubernetes-vagrant-centos-cluster 部署 kubernetes 集群,只要启动集群并安装了 CoreDNS 即可,无须安装其他插件。

    部署应用

    我们首先将应用部署到 Kubernetes 中。

    部署 postgres 数据库。

    1. kubectl apply -f postgres

    创建 usersvc 镜像。

    1. docker build -t jimmysong/usersvc:step1 .

    部署 usersvc。

    1. kubectl apply -f usersvc

    查看 uservc 的 ClusterIP 地址。

    1. $ kubectl get svc usersvc
    2. kubectl get svc usersvc
    3. NAME TYPE CLUSTER-IP EXTERNAL-IP PORT(S) AGE
    4. usersvc ClusterIP 10.254.176.248 <none> 5000/TCP 11m

    进到 node1 中访问该服务,因为我们要访问的是 ClusterIP,在我们自己的电脑上是无法直接访问的,所以进到虚拟机中操作。

    1. $ vagrant ssh node1
    2. $ curl 10.254.176.248:5000
    3. {
    4. "hostname": "usersvc-7cf5bb9d85-9gx7w",
    5. "msg": "user health check OK",
    6. "ok": true,
    7. "resolvedname": "172.33.10.7"
    8. }

    尝试添加一个名为 Alice 的用户。

    1. $ curl -X PUT -H "Content-Type: application/json" \
    2. -d '{ "fullname": "Alice", "password": "alicerules" }' \
    3. 10.254.176.248/user/alice

    将会看到类似如下的输出。

    1. {
    2. "fullname": "Alice",
    3. "hostname": "usersvc-7cf5bb9d85-9gx7w",
    4. "ok": true,
    5. "resolvedname": "172.33.10.7",
    6. "uuid": "EF43B475F65848C6BE708F436305864B"
    7. }

    尝试再添加一个名为 Bob 的用户。

    1. $ curl -X PUT -H "Content-Type: application/json" \
    2. -d '{ "fullname": "Bob", "password": "bobrules" }' \
    3. 10.254.176.248/user/bob

    将会看到类似如下的输出。

    1. {
    2. "fullname": "Bob",
    3. "hostname": "usersvc-7cf5bb9d85-9gx7w",
    4. "ok": true,
    5. "resolvedname": "172.33.10.7",
    6. "uuid": "6AC944E7D4254D9A811A82C0FDAC3046"
    7. }

    当应用部署完毕后,我们该部署 edge envoy 了。

    部署 edge envoy

    部署 edge envoy 的方式很简单,执行下面的命令。

    1. kubectl apply -f edge-envoy

    现在访问 edge envoy 是就可以路由到 usersvc 上的,当然直接访问 usersvc 也是可以的。

    我们看下 edge-envoy 的 envoy 配置文件定义。

    1. {
    2. "listeners": [
    3. {
    4. "address": "tcp://0.0.0.0:80",
    5. "filters": [
    6. {
    7. "type": "read",
    8. "name": "http_connection_manager",
    9. "config": {
    10. "codec_type": "auto",
    11. "stat_prefix": "ingress_http",
    12. "route_config": {
    13. "virtual_hosts": [
    14. {
    15. "name": "backend",
    16. "domains": ["*"],
    17. "routes": [
    18. {
    19. "timeout_ms": 0,
    20. "prefix": "/user",
    21. "cluster": "usersvc"
    22. }
    23. ]
    24. }
    25. ]
    26. },
    27. "filters": [
    28. {
    29. "type": "decoder",
    30. "name": "router",
    31. "config": {}
    32. }
    33. ]
    34. }
    35. }
    36. ]
    37. }
    38. ],
    39. "admin": {
    40. "access_log_path": "/dev/null",
    41. "address": "tcp://127.0.0.1:8001"
    42. },
    43. "cluster_manager": {
    44. "clusters": [
    45. {
    46. "name": "usersvc",
    47. "connect_timeout_ms": 250,
    48. "type": "strict_dns",
    49. "service_name": "usersvc",
    50. "lb_type": "round_robin",
    51. "features": "http2",
    52. "hosts": [
    53. {
    54. "url": "tcp://usersvc:80"
    55. }
    56. ]
    57. }
    58. ]
    59. }
    60. }

    客户端访问 edge-envoyClusterIP:8000/user/health 就可以检查节点的健康状况。

    部署 usersvc2

    删除原来的 usersvc,部署第二版 usersvc2,它与原来的 usersvc 唯一不同的地方是在 entrypoint 中集成了 envoy,查看 Dockerfile 中指定的 entrypoint.sh 的内容便可知。

    1. #!/bin/sh
    2. python /application/service.py &
    3. /usr/local/bin/envoy -c /application/envoy.json

    首先删除老的 usersvc

    1. kubectl delete -f usersvc

    使用下面的命令部署 usersvc2,它仍然使用 usersvc 这个 service 名称。

    1. kubectl apply -f usersvc2

    Envoy 以 out-of-process 的方式运行,对应用进程没有侵入性,也可以使用 sidecar 的方式运行,让 envoy 与 应用容器运行在同一个 pod 中。

    增加 usersvc2 的实例个数。

    1. kubectl scale --replicas=3 deployment/usersvc

    此时我们有 3 个 usersvc 实例,现在通过 edge-envoyClusterIP:8000/user/health 检查节点的健康状况时,是不是会轮询的访问到后端的的 usersvc2 的实例呢?

    我们当初在 edge-nodeenvoy.json 中配置过 cluster 的,其中指定了 lb_typeround_robin

    1. "cluster_manager": {
    2. "clusters": [
    3. {
    4. "name": "usersvc",
    5. "connect_timeout_ms": 250,
    6. "type": "strict_dns",
    7. "service_name": "usersvc",
    8. "lb_type": "round_robin",
    9. "features": "http2",
    10. "hosts": [
    11. {
    12. "url": "tcp://usersvc:80"
    13. }
    14. ]
    15. }
    16. ]
    17. }

    而且该 serivce_name 也可以被 DNS 正确解析。

    1. root@usersvc-55b6857d44-gcg5c:/application# nslookup usersvc
    2. Server: 10.254.0.2
    3. Address: 10.254.0.2#53
    4. Name: usersvc.envoy-tutorial.svc.cluster.local
    5. Address: 10.254.123.166

    答案是否定的。

    虽然通过 DNS 可以正确的解析出 serivce 的 ClusterIP,但是负载均衡不再通过 kube-proxy 实现,所以不论我们访问多少次 edge-envoy 永远只能访问到一个固定的后端 usersvc

    服务发现服务 - SDS

    Kubernetes 中的 DNS 可以发现所有 serivce 的 ClusterIP,但是 DNS 中不包括所有 endpoint 地址,我们需要一个 SDS(服务发现服务)来发现服务的所有的 endpoint,我们将修改 lb_type,使用 sds 替代 strict_dns

    执行下面的命令部署 SDS。

    1. kubectl apply -f usersvc-sds

    因为在添加了 SDS 之后需要修改 edge-envoy 中的 envoy.josn 配置,在 clusters 字段中增加 sds 信息,我们将所有的配置都写好了,重新打包成了镜像,我们需要先删除之前部署的 edge-envoy

    1. kubectl delete -f edge-envoy

    部署新的 edge-envoy2

    1. kubectl apply -f edge-envoy2

    连续访问 usersvc 12 次看看输出结果如何。

    1. URL=http://172.17.8.101:30800/user/alice
    2. for i in `seq 1 12`;do curl -s $URL|grep "resolvedname"|tr -d " "|tr -d ","|tr -d '"';done

    我们可以看到类似如下的输出:

    1. resolvedname:172.33.71.2
    2. resolvedname:172.33.88.2
    3. resolvedname:172.33.10.2
    4. resolvedname:172.33.71.2
    5. resolvedname:172.33.88.2
    6. resolvedname:172.33.10.2
    7. resolvedname:172.33.71.2
    8. resolvedname:172.33.88.2
    9. resolvedname:172.33.10.2
    10. resolvedname:172.33.71.2
    11. resolvedname:172.33.88.2
    12. resolvedname:172.33.10.2

    再查看下 usersvc 服务的所有 pod 的 IP 地址。

    1. $ kubectl get pod -l service=usersvc -o wide
    2. NAME READY STATUS RESTARTS AGE IP NODE
    3. usersvc-55b6857d44-mkfpv 1/1 Running 0 9m 172.33.88.2 node1
    4. usersvc-55b6857d44-q98jg 1/1 Running 0 9m 172.33.71.2 node2
    5. usersvc-55b6857d44-s2znk 1/1 Running 0 9m 172.33.10.2 node3

    我们看到 round-robin 负载均衡生效了。

    参考

    • Part 2: Deploying Envoy with a Python Flask webapp and Kubernetes
    • envoy-steps
    • kubernetes-vagrant-centos-cluster
    • envoy-tutorial