• 热门搜索 热门搜索
菜单

您现在的位置是:博客 > 文章详情文章详情

k8s "command failed" err="failed to parse kubelet flag: unknown flag: --network-plugin"

原创
时间2023/09/02 00:44:38 发布 预览数量1445
分类: docker k8s 标签: k8s

一、问题描述

服务器夜间异常断电后在k8s Master主节点发现挂了。并且所有的容器都起不来,乍一看头皮发麻,没办法只能一步一步的排查问题了。

[root@t224yuntu1 ~]# kubectl get node
E0901 09:29:47.011209    9042 memcache.go:265] couldn't get current server API group list: Get "https://10.1.20.224:6443/api?timeout=32s": dial tcp 10.1.20.224:6443: connect: connection refused
E0901 09:29:47.011679    9042 memcache.go:265] couldn't get current server API group list: Get "https://10.1.20.224:6443/api?timeout=32s": dial tcp 10.1.20.224:6443: connect: connection refused
E0901 09:29:47.013172    9042 memcache.go:265] couldn't get current server API group list: Get "https://10.1.20.224:6443/api?timeout=32s": dial tcp 10.1.20.224:6443: connect: connection refused
E0901 09:29:47.014891    9042 memcache.go:265] couldn't get current server API group list: Get "https://10.1.20.224:6443/api?timeout=32s": dial tcp 10.1.20.224:6443: connect: connection refused
E0901 09:29:47.015849    9042 memcache.go:265] couldn't get current server API group list: Get "https://10.1.20.224:6443/api?timeout=32s": dial tcp 10.1.20.224:6443: connect: connection refused
The connection to the server 10.1.20.224:6443 was refused - did you specify the right host or port?

二、解决思路

1、检查环境变量情况(正常)

env | grep -i kub

检查环境变量情况

2、检查docker服务(正常)

systemctl status docker.service

检查docker服务

3、检查kubelet服务(异常)

systemctl status kubelet.service

检查kubelet服务

发现 kubelet.service起不来,如下:

[root@t224yuntu1 ~]# systemctl status kubelet.service
● kubelet.service - kubelet: The Kubernetes Node Agent
   Loaded: loaded (/usr/lib/systemd/system/kubelet.service; enabled; vendor preset: disabled)
  Drop-In: /usr/lib/systemd/system/kubelet.service.d
           └─10-kubeadm.conf
   Active: activating (auto-restart) (Result: exit-code) since 五 2023-09-01 09:36:28 CST; 2s ago
     Docs: https://kubernetes.io/docs/
  Process: 9544 ExecStart=/usr/bin/kubelet $KUBELET_KUBECONFIG_ARGS $KUBELET_CONFIG_ARGS $KUBELET_KUBEADM_ARGS $KUBELET_EXTRA_ARGS (code=exited, status=1/FAILURE)
 Main PID: 9544 (code=exited, status=1/FAILURE)

9月 01 09:36:28 t224yuntu1 systemd[1]: kubelet.service: main process exited, code=exited, status=1/FAILURE
9月 01 09:36:28 t224yuntu1 systemd[1]: Unit kubelet.service entered failed state.
9月 01 09:36:28 t224yuntu1 systemd[1]: kubelet.service failed.

我们尝试通过 journalctl -xeu kubelet 来查询日志,日志内容如下:

[root@t224yuntu1 ~]# journalctl -xeu kubelet
-- 
-- The start-up result is done.
9月 01 09:36:48 t224yuntu1 kubelet[9571]: E0901 09:36:48.727154    9571 run.go:74] "command failed" err="failed to parse kubelet flag: unknown flag: --network-plugin"
9月 01 09:36:48 t224yuntu1 systemd[1]: kubelet.service: main process exited, code=exited, status=1/FAILURE
9月 01 09:36:48 t224yuntu1 systemd[1]: Unit kubelet.service entered failed state.
9月 01 09:36:48 t224yuntu1 systemd[1]: kubelet.service failed.
9月 01 09:36:58 t224yuntu1 systemd[1]: kubelet.service holdoff time over, scheduling restart.
9月 01 09:36:58 t224yuntu1 systemd[1]: Stopped kubelet: The Kubernetes Node Agent.
-- Subject: Unit kubelet.service has finished shutting down
-- Defined-By: systemd
-- Support: http://lists.freedesktop.org/mailman/listinfo/systemd-devel
-- 
-- Unit kubelet.service has finished shutting down.
9月 01 09:36:58 t224yuntu1 systemd[1]: Started kubelet: The Kubernetes Node Agent.
-- Subject: Unit kubelet.service has finished start-up
-- Defined-By: systemd
-- Support: http://lists.freedesktop.org/mailman/listinfo/systemd-devel
-- 
-- Unit kubelet.service has finished starting up.
-- 
-- The start-up result is done.
9月 01 09:36:58 t224yuntu1 kubelet[9585]: E0901 09:36:58.980725    9585 run.go:74] "command failed" err="failed to parse kubelet flag: unknown flag: --network-plugin"
9月 01 09:36:58 t224yuntu1 systemd[1]: kubelet.service: main process exited, code=exited, status=1/FAILURE
9月 01 09:36:58 t224yuntu1 systemd[1]: Unit kubelet.service entered failed state.
9月 01 09:36:58 t224yuntu1 systemd[1]: kubelet.service failed.
9月 01 09:37:09 t224yuntu1 systemd[1]: kubelet.service holdoff time over, scheduling restart.
9月 01 09:37:09 t224yuntu1 systemd[1]: Stopped kubelet: The Kubernetes Node Agent.
-- Subject: Unit kubelet.service has finished shutting down
-- Defined-By: systemd
-- Support: http://lists.freedesktop.org/mailman/listinfo/systemd-devel
-- 
-- Unit kubelet.service has finished shutting down.
9月 01 09:37:09 t224yuntu1 systemd[1]: Started kubelet: The Kubernetes Node Agent.
-- Subject: Unit kubelet.service has finished start-up
-- Defined-By: systemd
-- Support: http://lists.freedesktop.org/mailman/listinfo/systemd-devel
-- 
-- Unit kubelet.service has finished starting up.
-- 
-- The start-up result is done.
9月 01 09:37:09 t224yuntu1 kubelet[9596]: E0901 09:37:09.237987    9596 run.go:74] "command failed" err="failed to parse kubelet flag: unknown flag: --network-plugin"
9月 01 09:37:09 t224yuntu1 systemd[1]: kubelet.service: main process exited, code=exited, status=1/FAILURE
9月 01 09:37:09 t224yuntu1 systemd[1]: Unit kubelet.service entered failed state.
9月 01 09:37:09 t224yuntu1 systemd[1]: kubelet.service failed.

三、原因分析

根据日志可以初步判断,应该是网络模块除了问题,kebelet重启后,启动网络插件的命令无法执行。然后我又分别在master和node节点上查看下kubelet的版本,结果发现了问题:
原因分析

即master节点的 kubeadm、kubelet、kubernetes-cni、kubectl和node节点的版本不一致,且master节点使用的版本的高于node节点。

四、解决办法

我尝试将 master 节点和 node 节点的版本统一一下。

yum downgrade   kubeadm-1.23.0-0.x86_64 kubectl-1.23.0-0.x86_64 kubelet-1.23.0-0.x86_64

完成后重启kubelet

systemctl restart kubelet.service
systemctl daemon-reload

最后我们在看下k8s 服务的状态
K8s服务运行状态

大功告成!

版权声明:本文为Converts的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

原文链接:https://www.converts.cn/article/3443750.html

暂无评论

暂无评论

推荐阅读

  • .net 项目发布中的 Debug和Release的区别是什么?

    ![.net 项目发布中的 Debug和Release的区别是什么?](/ArticleFile/2023-09-09/93b4042444ff40aba6e7c913250e425f.png '.net 项目发布中的 Debug和Release的区别是什么?') 一、Debug 版本 Debug 是“调试”的意思,

  • Vs2022 设置类、接口默认创建的模板

    一、前言 在团队协作中,每个人都负责这自己模块的代码。为了清楚的分辨代码是谁开发的, 我们往往会在类、接口增加一个额外的注释信息,例如:创建人、创建时间、描述等等。所以有些时候,我们希望 visual Studio 在创建类,接口的时候,生成的代码文件能更丰富一下, 例如:自动增加基础的注释功能, 类文件自动增加 p

  • 如何使用 vs 2022 远程调试 Linux系统中的Docker容器项目

    一、前言 在项目上,总会遇到一些奇怪的问题,例如:“在本地好好的, 为什么部署到线上就不行” 等等,这样的问题时长困扰着我们。但是作为一个资深的码农,“远程调试” 是一个不可或缺的手段。下面就来看下如果使用 vs 在本地远程调试部署在Linux系统中,运行在Docker容器中的项目吧。 二、远程调试 调试的前提,

  • 移除Linux系统启动时的等待时间

    一、前言 VMware 虚拟机中安装了很多Linux 系统,每次启动的时候, 都卡在系统选择的界面上,除非手动选择, 否则要等很久才会进入系统,如下图所示: ![移除Linux系统启动时的等待时间](/ArticleFile/2024-06-24/e3ab02212cc946bd9c23159895177fb3.png '移除Linux系统启动时的等待时间') 二、关闭系统等待的事件 我们

  • GitLab 私有化部署

    一、GitLab 概述 git作为目前最流行的代码管理工具,已经成为了程序员必备的技能。虽然目前有 github(对国人不太友好) 、gitee 两个比较大的代码托管平台。但是出于各种原因,搭建自己的私有代码平台也成了一部分开发人员的选择。针对这种需求,这里为大家介绍的是其中的佼佼者gitlab,也是我们公司内部正在使用的一个代码管理平台。 GitLab是一个基于Git的开源代码管理平台,它

  • 云服务器购买按量付费实例,并搭建私有网络图解

    一、前言 最近在自学 k8s 集群化部署, 奈何云服务器包年包月太贵了, 学习成本飙升。好在各大云服务商支持按量计费 , 接下来就带大家一起过一下购买流程,并且使用私有网络。 二、私有网络 在购买云服务器之前,先了解下什么是私有网络。官网给出的解释是:私有网络(Virtual Private Cloud,VPC)是一块在云服务器上自定义的逻辑隔离网络空间,可以使云服务器, 云数据库资源构建逻

  • Docker 部署FastTunnel,实现内网穿透

    一、前言 最近在学习搭建Elasticsearch集群,但是发现云服务(2核4G)资源根本就不够用,部署上去就直接宕机了。想着服务器资源太贵, 家里刚好有一台64G内存的闲置电脑。不如做一个内网穿透,可以远程访问。工作学习两不误。其实目前市面上已经有很多穿透工具了,比如向日葵~~ ,但是奈何带宽太小了,免费的才1M~~~ 二、什么是 FastTunnel FastTunnel 是用.net

  • IP地址和子网掩码的关系

    一、概述 IP地址(Internet Protocol Address)和子网掩码(Subnet Mask)是计算机网络中两个核心的概念,它们共同工作以确保数据能够正确地在复杂的网络环境中传输到目标设备。 二、IP地址 `IP地址`是IP协议提供的一种统一的地址格式,它为互联网上的每一个网络和每一台主机分配一个逻辑地址,以此来屏蔽物理地址的差异。它是一个32位的二进制数,但是在习惯上,我们

  • 修改Docker默认的存储驱动程序目录

    一、前言 今天使用jenkins对程序进行更新的时候,发现更新失败。经排查是因为系统磁盘满了,然而通过堡垒机看了下,系统空间还有很多,于是看了下系统分区: ![修改Docker默认的存储驱动程序目录](/ArticleFile/2024-06-06/444ede8a1b1b42058db18690fa995952.png '修改Docker默认的存储驱动程序目录') ![修改Docker默认

  • Windows 安装git的详细安装步骤 ,以及TortoiseGit 图形化工具

    一、前言 `Git` 是一个开源的分布式版本控制系统,用于有效、高速地处理从很小到非常大的项目版本管理。Git 与常用的版本控制工具 CVS, Subversion 等不同,它采用了分布式版本库的方式,不需要服务器端软件支持。 二、安装Git 1、Git 下载地址 [Git 下载地址](https://git-scm.com/downloads "Git 下载地址") ![Windows

加载中