…把开发环境放在本地,可惜解决不了网络问题。 --- 为什么我的 GPU 节点都挂了 | 邹扒皮实验室 cgroup 没有正确统计到内存使用情况,没有触发 oom,导致一直在发生内存颠簸,导致磁盘 IO 被打爆,最终表现为节点宕机。 类似的情况很多都遇到过,原因多种多样,使用 [cgroup](/mentions…
[[ Cgroup ]]
4 篇文章提到了此关键词
…-aware OOM killer 的支持。这个功能允许 OOM killer 杀死整个 cgroup,而不仅仅是杀死内存使用最多的进程。 kernel cgroup v2 文档中关于这个功能的介绍: > memory.oom.group A read-write single value file which exists on non-root cgro…
…](https://kubernetes.io/blog/2022/08/31/cgroupv2-ga-1-25/) kubernetes 正式支持 cgroup v2 。kubelet 和 container runtime 使用 systemd 来做 cgroup 管理。 > cgroup v2 offers several improvements ov…
…ironment](https://www.uber.com/en-SG/blog/avoiding-cpu-throttling-in-a-containerized-environment/) cgroup 使用 cpuset 来避免 CPU throttling 。 --- [How to remove a stuck namespace](https://blog.ediri.io/how-to…