• 使用 LightStep [?]PM 进行分布式追踪
    • 开始之前
    • 可视化追踪数据
    • 追踪采样
    • 清理

    使用 LightStep [?]PM 进行分布式追踪

    此任务说明如何配置 Istio 以收集追踪 span 并将其发送到 LightStep [?]PM。[?]PM 让您可以从大规模生产软件中分析 100% 未抽样的事务数据,从而产生有意义的分布式追踪信息和 metrics,用于帮助解释性能行为并加快根本原因分析。更多信息请访问 LightStep 网站。在此任务的最后,Istio 将从代理发送 span 到一个 LightStep [?]PM Satellite pool,使得它们在 web 界面上可用。

    开始之前

    • 请确保您拥有一个 LightStep 账号。请联系 LightStep 创建账号。

    • 请确保您具有配置了 TLS 证书的 satellite pool 和已公开的安全 GRPC 端口。关于如何设置 satellites 请查看 LightStep Satellite 配置。

    • 请确保您具有一个 LightStep 访问令牌。

    • 请确保您可以使用 <Host>:<Port> 的地址形式访问 satellite pool,例如 lightstep-satellite.lightstep:9292

    • 指定如下配置参数部署 Istio:

      • global.proxy.tracer="lightstep"
      • global.tracer.lightstep.address="<satellite-address>"
      • global.tracer.lightstep.accessToken="<access-token>"
      • global.tracer.lightstep.secure=true
      • global.tracer.lightstep.cacertPath="/etc/lightstep/cacert.pem"
        如果通过 helm template 进行安装,您可以在运行 helm 命令时,使用 —set key=value 的格式设置这些参数。例如:
    1. $ helm template \
    2. --set global.proxy.tracer="lightstep" \
    3. --set global.tracer.lightstep.address="<satellite-address>" \
    4. --set global.tracer.lightstep.accessToken="<access-token>" \
    5. --set global.tracer.lightstep.secure=true \
    6. --set global.tracer.lightstep.cacertPath="/etc/lightstep/cacert.pem" \
    7. install/kubernetes/helm/istio \
    8. --name istio --namespace istio-system > $HOME/istio.yaml
    9. $ kubectl create namespace istio-system
    10. $ kubectl apply -f $HOME/istio.yaml
    • 将您的 satellite pool 的 CA 证书以 secret 形式保存在 default namespace 中。如果您在不同的 namespace 中部署 Bookinfo 应用,请在该 namespace 中创建这个 secret。
    1. $ CACERT=$(cat Cert_Auth.crt | base64) # Cert_Auth.crt contains the necessary CACert
    2. $ NAMESPACE=default
    1. $ cat <<EOF | kubectl apply -f -
    2. apiVersion: v1
    3. kind: Secret
    4. metadata:
    5. name: lightstep.cacert
    6. namespace: $NAMESPACE
    7. labels:
    8. app: lightstep
    9. type: Opaque
    10. data:
    11. cacert.pem: $CACERT
    12. EOF
    • 遵循部署 Bookinfo 示例应用程序说明。

    可视化追踪数据

    • 遵循为 Bookinfo 应用创建 ingress gateway 的说明。

    • 为了验证前序步骤是否成功,请确保在 shell 中设置了 GATEWAY_URL 环境变量。

    • 发送流量到示例应用程序。

    1. $ curl http://$GATEWAY_URL/productpage
    • 加载 LightStep [?]PM web UI。

    • 浏览该界面。

    • 在页面顶部找到查询栏。查询栏允许你通过 ServiceOperationTag 值交互式的筛选结果。

    • Service 下拉列表中选择 productpage.default

    • 点击 Run。您将看到一些和下面相似的东西:

    Explorer
    Explorer

    • 单击延迟直方图下方的示例追踪表中的第一行,以查看与刷新 /productpage 时相对应的详细信息。页面看起来像这样:

    Detailed Trace View
    Detailed Trace View

    屏幕截图显示追踪由一组 span 组成。 每个 span 对应于执行 /productpage 时调用的 Bookinfo 服务。

    追踪中的两个 span 代表了每个 RPC。例如,从 productpagereviews 的请求带有的 span 使用 reviews.default.svc.cluster.local:9080/ operation 和 productpage.default: proxy client 进行标记。这个service 代表了客户端请求的 span。屏幕截图显示请求耗时 15.30 毫秒。第二个 span 使用 reviews.default.svc.cluster.local:9080/ operation 和 reviews.default: proxy server service 进行标记。第二个 span 是第一个的子级,代表了服务端请求的 span。屏幕截图显示请求耗时 14.60 毫秒。




    LightStep 集成目前不能捕获 Istio 内部组件(如 Mixer)产生的 span。

    追踪采样

    Istio 以可配置的追踪采样百分比捕获追踪数据。要了解如何修改追踪采样百分比,请访问使用 Jaeger 追踪采样进行分布式追踪小节。当使用 LightStep [?]PM 时,我们不推荐将追踪采样百分比降低到 100% 以下。要处理高流量网格,请考虑对您的 satellite pool 进行扩容。

    清理

    如果您没有计划任何后续任务,请从集群中删除 Bookinfo 示例应用程序及任何 LightStep [?]PM secret。

    • 要删除 Bookinfo 应用程序,请参考 Bookinfo 清理说明。

    • 删除为 LightStep [?]PM 生成的 secret。

    1. $ kubectl delete secret lightstep.cacert