[[ Kubernetes ]]

47 篇文章提到了此关键词

…ike a dinosaur myself, but when the tools work (which is not every problem!), they can be amazing. kubernetes 仓库添加了 AGENT.md,和前阵子 QEMU 社区的态度是相反的。 --- [Litestar is worth a look](https://www.b-list.org/webl…

…is experimental: use at your on risk. Pinterest 在整个 2024 年决定将自己的搜索系统迁移到了内部的 kubernetes 集群,近期在进行验验收时遇到了部分请求超时的问题,进行了调查。在前期验收过程中,如果只关注指标的 P99 可能会忽略这个问题,之后需要注意下要了解集群最差情况。在排查过程中用了各种方式,最终还是…

…live 避免。 --- IronCore · GitHub 有趣,看着是 SAP 基于 kubernetes 来管理 BareMetal 项目,看上去是完整的实现,该有的都有了,不过感觉组装起来不那么容易,一堆的 controller。 其中 [BMC](/m…

…treadmill/) 作者自造词,安全跑步机:在安全方面,你需要不断的努力只是为了停留在原地,最终没有取得真正的进展。 故事背景是其他团队为了阻止人们使用免费的 GPU 资源来挖矿,所以提出在 kubernetes 集群中部署 Falco(Falco is a cloud native security tool that provides runtime security…

…s://github.com/Xe/yoke-stuff/blob/main/within-website-app/v1/app.go) Yoke 是一个 kubernetes 的包管理器,定位与 Helm 和 Timoni 相同,Yoke 的 Flights 相当于 Helm 的 Chart。主要…

…with GET rights on pods/exec tried to use kubectl exec in 1.29 you’d get an error like this kubernetes 在 1.31 版本从 SPDY 切换到 Websockets 之后,会导致有 get API 权限的用户可以执行 exec 。 --- [x.com](https://x.com/kiru…

…ring](https://slack.engineering/advancing-our-chef-infrastructure/) Slack 的 Chef 治理,2024 年看到公司没有使用 kubernetes 来进行基础设施管理,很难得了。 因为从来没用过 Chef,所以对于其中的一些痛点理解不深。 --- [Remove global-rate-limit feature by rikatz ·…

…· GitHub](https://github.com/kubernetes/website/pull/47414issuecomment-2277646230) 最近有人在小红书,发了自己给 kubernetes 贡献了一个 PR,修复了一个文档样式问题,引发了大家的讨论。我觉得修复文档样式问题挺好的,很多项目看似很完整,但是当真正走一遍 Quick Start 的时候,多多少少会发现点问题,我都会顺手提一个…

…e ~370MB of RAM available for running applications! k2d,预期是解决在工业场景下节点配置很低,运行一个完整的 kubernetes 资源消耗过多的场景。 通过在本地 docker 环境中,运行 k2d,来暴露 : 6443 端口,对外提供一个 [kubernetes](/mentions/kub…

…CPU Limits on Kubernetes (Updated) | Robusta](https://home.robusta.dev/blog/stop-using-cpu-limits) kubernetes 如何设置 Pod 的 request 和 limit: - CPU - 始终设置 CPU requests - 确保 CPU requests 正确性 - 不要设置 CPU limits -…

…--- Kubernetes 与 Cybernetics (初稿) 海剑同学的文章,关于控制论和 kubernetes 的关系。 >kubernetes 是一个典型的负反馈控制系统,它基于负反馈等控制方法实现了高效实时稳定的容器编排管理。一个控制系统可以由多个子控制系统组成。一个大的目标可以拆分成多个小目标,并由不…

…/) Kubernetes 2.0 - Justin Garrison kubernetes 已经发布 10 年了,作者讲述了自己与 kubernetes 的故事,已经对下一阶段的展望: - 可选择的 etcd:Almost every cus…

…er 的自习室](https://oilbeater.com/2024/04/18/k8gb-best-cloudnative-gslb/) k8gb 是可以和 kubernetes 无缝对接的一款 GSLB,解决多个 kubernetes 集群之间的负载均衡问题。当前已有的 GSLB 实现方案存在无法和 kubernetes 无缝对接、公有云…

…s | Medium](https://medium.com/@mohamedfaris2/coredns-is-going-to-fail-you-scale-k8s-2d5d9f14bc12) kubernetes 900+ 节点,15k+ pod 的环境中,因为默认的 coreDNS 不足以支撑这个量级的请求,导致服务崩溃。建议为 coreDNS 配置 HPA,并针对内部关键组件进行监控。 --- [Ev…

…ttps://blog.palark.com/sre-troubleshooting-ceph-systemd-containerd/) Palark 内部 kubernetes 集群 事故分析。 内部的日志存储系统运行在 kubernetes 上,依赖于 S3,[…

…k3d 大比拼 | Oilbeater 的自习室](https://oilbeater.com/2024/02/22/minikube-vs-kind-vs-k3d/) 需要在 CI 环境中运行 kubernetes 的话,先明确自己需要什么隔离需求,如果需求只需要一个 kubernetes 环境的话,那么 k3d 是最快的。 K…

…le/) Slack 定时任务系统设计。之前一直使用 Linux 附带的 crontab 配合 flock 运行定时任务,但是管理起来很痛苦,重新设计。依托于 kubernetes 的Leader Election ,leader pod 负责任务的下发任务到 Kafka。 思考: Slack 这么大规模的定时任务,之前一直依靠 crontab 就撑住了?简单粗暴但有效啊。…

…inaries/) 通过在 Golang 代码仓库中增加 tools.go 文件,在文件中声明依赖的工具,执行 go mod tidy 自动拉取相关依赖。kubernetes 示例:[kubernetes/hack/tools/tools.go at master · kubernetes/kubernetes · GitHub](https://github.com/k…

…dmin?, when it's super-admin!](https://raesene.github.io/blog/2024/01/06/when-is-admin-not-admin/) kubernetes 1.29 版本修改了 kubeadm 生成的 admin.conf 默认权限,从 system:masters 变为了 cluster-admins 。 --- [I quit my j…

…homelab-part2/V2-%E5%90%AF%E5%8A%A8) 使用 BGP 和 MetalLB 来给自己的 kubernetes 集群暴露服务,为了保证 openwrt 的可用性,引入了 keepalived 来实现 VIP。 >熟悉我的朋友都知道,我是个 SRE 我最近也在想,是不是家里也整点设备搞事情,虽然公司的资源很…

….io](/mentions/flyio) 使用 k3s 配合 Virtual kubelet 构建自己的 kubernetes 平台,最小组件:CoreDNS,SQLite,Virtual kubelet,将 virtual kubelet 相关接口实现为自己的 Fly machine API 。 --- [Flask…

…,正好蹭个热点,讲讲这几年在kubernetes上踩过的坑。” / X](https://twitter.com/halfbloodrock/status/1729876674786070751) kubernetes 升级遇到的坑汇总: - ip pool block要是配小了,很可能出现pod拿不到IP起不来而计算资源空闲的情况。调度器可不看IPAM里还有多少剩余IP - 为啥要改k8s代码?For KPI?…

…com/blog/post/building-a-cheaper-kubernetes-cluster-at-home) 在 Orange Pi 搭建 kubernetes ,看着折腾起来没什么坑,但是我选择虚拟机。 --- [We Have To Talk About Flask - miguelgrinberg.com](https://blog.miguel…

…s://kubernetes.io/blog/2023/10/12/bootstrap-an-air-gapped-cluster-with-kubeadm/) 官方下场,手把手教你如何部署一个离线kubernetes 集群。 --- [2023 年 10 月 4 日 1.1.1.1 查询失败](https://blog.cloudflare.com/zh-cn/1-1-1-1-lookup-failures-…

…f-hosted](/mentions/self-hosted),作者自托管了很多机器和应用,大部分采用 VM + Container 的形式,没有引入 kubernetes,比较好奇他如何管理这些机器和设备。 --- 有关 TLS/SSL 证书的一切 | 卡瓦邦噶! 关于 [TLS…

…th-an-sql-database-7e1b2e9b5f8f) 使用PostgreSQL 配合 Kine 运行 kubernetes。其中 PG 通过 systemd 控制,Kine 通过 StaticPod 控制。应该只是看看就好,etcd 目前有了 Kubernetes SIG,开始积极维护中了。Kine 的问题也不少。 -…

…erprogramming.pub/backup-and-restore-of-containers-with-kubernetes-checkpointing-api-e310cf29cd4a) kubernetes Pod checkpoint 方式,后续应该可以作为 Pod Live Migration 的前置动作。 --- [I'm done with Red Hat…

…2023 | Medium](https://medium.com/adevinta-tech-blog/its-not-always-dns-unless-it-is-16858df17d3f) kubernetes DNS 问题调查。一开始汇报的问题是 HTTP 5xx,调查的方向是 Ingress Controller,尝试调整 Ingress Controller 实例数量…

…www.example.com. --- DNS Lookups in Kubernetes kubernetes 中 DNS 解析的优先级,可以直接硬编码 FQDN 来减少无效解析。 --- [Nginx Buffer 机制引发的下载故障 - poslua | ms2008…

…能会比较大。 --- 记一次 BUG 定位:时钟偏移引起 K8S 鉴权失败 | 三点水 kubernetes 节点时钟不一致导致的JWT 校验不通过问题。 > B 节点的时间比 A 节点快 1min30s; 任务被调度到 B 节点,B 节点的 kubelet 为 Pod…

…e) 事件驱动Ansible,可以指定 Source,Rule和 Action 来进行一些自动化的处理,但是现在大部分涉及到 kubernetes 的场景应该都是独立的去实现 Operator 了吧,没想到什么场景会这么用。 另外这里的进程管理看上去也是一个问题。 生活 [这次在北京玩回来,在经历了景区排队,地铁先下后上,和有些…

…uildKit on Kubernetes 构建多架构容器镜像 | Reimu's blog](https://blog.k8s.li/buildkit-on-kubernetes.html) 在 kubernetes上部署都架构Buildkit 说明。公司内部 CI 已经采用这种方式进行使用了。 --- [Should Rye Exist? · mitsuhiko/…

…s Using The Kubelet API | Kubernetes](https://kubernetes.io/blog/2023/04/21/node-log-query-alpha/) kubernetes 可以通过 kubelet API 获取 Host 节点上的日志。这个功能是 openshift 贡献的。 --- [It’s fine to use…

…signals.com/bringing-our-apps-back-home/) 37Signals 将服务从公有云 和 kubernetes 迁移出来的记录,使用到之前开源的 mask 工具。 --- [We updated our RSA SSH host key | The GitHub Blo…

…zation - Symbiosis](https://symbiosis.host/blog/comparing-node-launch-times) 在公有云上创建 kubernetes 节点的 benchmark,不知道当考虑 scale 的时候是否能够满足用户需求。 --- [详解 TCP 半连接队列与全连接队列 - 个人笔记](…

…发的另一个思考是,我理解 Crossplane 提供的产品已经是较为上层了,但是他们的客户遇到问题需要 OnCall 到 OCI 这一层,莫名的为我司 kubernetes 产品之后的运维成本担忧。 --- [5 production surprises worth investigating – Dan Slimmon](https://blog.danslimm…

…re-metal-kubernetes-or-to-there-and-back-1868c0356eff) 使用 Bare Metal 管理 kubernetes 集群的回顾。作者选择kubespray 来部署集群,在早期使用感受是较好的,但是随着集群规模越来越大,[kubespray](/mentions/kub…

…quinix](/mentions/equinix) 通过 cloud-init 配合 kubeadm 部署 kubernetes 集群。 --- [Buf | Introducing buf curl - Call your gRPC endpoints with the simplicity of buf](http…

…022/12/01/runtime-observability-opentelemetry/) 使用 OpenTelemetry 来观测 kubernetes内部状态。 部分 OCI 没有计划支持 OpenTelemetry,用 [Rust](/mentions/…

…VM](/mentions/microvm) 来运行 github actions。主要解决了直接使用 docker和 kubernetes 面临的资源隔离问题。也许 virtink 可以很好的解决这个场景? 生活 [苹果的偏执 | Yanng](https://xia0bs.gi…

…(https://www.groundcover.com/blog/murre) 通过从 kubelet 直接获取 metric 来展示给用户,轻量的 kubernetes top. --- A Visual Guide to SSH Tunnels (with labs)…

…bernetes 1.25: cgroup v2 graduates to GA](https://kubernetes.io/blog/2022/08/31/cgroupv2-ga-1-25/) kubernetes 正式支持 cgroup v2 。kubelet 和 container runtime 使用 systemd 来做 cgroup 管理。 > cgroup v…

…ss Probes](https://datree.io/resources/kubernetes-readiness-and-liveness-probes-best-practices) 关于 kubernetes 的 Readiness 和 Liveness 最佳实践。 根据应用实际情况适当的调整参数:initial…

…nderstand](https://snyk.io/blog/10-kubernetes-security-context-settings-you-should-understand/) 关于 kubernetes 安全配置的一些方法(感觉大部分人都用不上) --- [The people of the cloud](https://aeon.co/essays/downtime-is-not-an-o…