K8S中的APF是怎么用的
这期内容当中小编将会给大家带来有关K8S中的APF是怎么用的,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。
公司专注于为企业提供成都网站制作、做网站、微信公众号开发、购物商城网站建设,重庆小程序开发,软件定制制作等一站式互联网企业服务。凭借多年丰富的经验,我们会仔细了解各客户的需求而做出多方面的分析、设计、整合,为客户设计出具风格及创意性的商业解决方案,创新互联更提供一系列网站制作和网站推广的服务。
先看K8S APF的官方描述:
“对于集群管理员来说,控制Kubernetes API服务器在过载情况下的行为是一项关键任务。kube-apiserver具有一些可用的控件(即--max-requests-inflight和--max-mutating-requests-inflight命令行标志),用于限制将要接受的未完成工作量,从而防止大量入站API服务器超载并可能导致API服务器崩溃的请求,但这些标志不足以确保最重要的请求在高流量期间通过。
API Priority and Fairness(APF)是一种替代方案,可改善上述 max-inflight限制。APF以更细粒度的方式对请求进行分类和隔离。它还引入了数量有限的排队,因此在非常短暂的突发情况下不会拒绝任何请求。 通过使用公平排队技术从队列中分发请求,这样, 一个行为不佳的K8S apiserver就不会影响其他apiserver接受新的请求(即使优先级相同)。”
简单来说:Api server 加入了限流机制。保护api被恶意请求消耗资源然后死掉。但由于默认权重数值设置不当(SA访问workload-low的加权是20,Account Token 访问global-default加权是100),可能造成K8S集群类似:KubeAPILatencyHigh, KubeAPIErrorsHigh, KubeAPIDown的报警问题。
https://github.com/kubernetes/kubernetes/pull/95259
如果发现KubeAPILatencyHigh, KubeAPIErrorsHigh, KubeAPIDown的报警问题,使用如下命令进行判断:
# oc get --raw /debug/api_priority_and_fairness/dump_priority_levels
上图中我们看到 workload-low那一行有很多等待。
针对这个问题,目前在OpenShift的方法是暂时关闭这个APF的功能:
# oc patch kubeapiserver cluster --type=merge -p '{"spec":{"unsupportedConfigOverrides":{"apiServerArguments":{"feature-gates":["APIPriorityAndFairness=false"]}}}}'
执行完命令后,关注openshift-kube-apiserver ns中的pod:
# oc get pods -n openshift-kube-apiserver -w
kube-api server的pod自动重建(先自动创建 installer 的pod,然后自动重建 api-server pod)。
重建成功:
需要注意的是,如果要对OCP进行升级,请在升级前对这个参数进行还原,以免影响OCP的升级。
# oc patch kubeapiserver cluster --type=merge -p '{"spec":{"unsupportedConfigOverrides":{"apiServerArguments":{"feature-gates":["APIPriorityAndFairness=true"]}}}}'
上述就是小编为大家分享的K8S中的APF是怎么用的了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注创新互联行业资讯频道。
当前标题:K8S中的APF是怎么用的
链接分享:http://azwzsj.com/article/gphgog.html