文章 链接到标题

技术 链接到标题

介绍 GoConvey 和 testify 两种单测框架。公司内部用 Ginkgo 比较多。

2022 年 10 月 25 日 Cloudflare 服务部分故障
[[CloudFlare]] 故障复盘,在引入 opentracing 时清理了部分 header 信息,导致上游逻辑判断错误。

Give Your Tail a Nudge
[[Nudge]] 对于 [[FCFS]] 的优化:

The intuition behind the Nudge algorithm is that we’d like to basically stick to FCFS, which we know is great for handling the extreme tail (high 𝑡), while at the same time incorporating a little bit of prioritization of small jobs, which we know can be helpful for the mean and lower 𝑡.

However, when a “small” job arrives and finds a “large” job immediately ahead of it in the queue, we swap the positions of the small and large job in the queue. The one caveat is that a job which has already swapped is ineligible for further swaps.

Ops to Bots — Smartening incident recovery
通过构建 Bot 来标准化事件处理流程,降低 MTTD(Mean time to Detect) 和 MTTE(Mean time to Engage) 时间。


在 Bash 中,同时重定向标准输出和标准错误:some-command >logfile 2>&1 或者 some-command &>logfile。通常,为了保证命令不会在标准输入里残留一个未关闭的文件句柄捆绑在你当前所在的终端上,在命令后添加 </dev/null 是一个好习惯。

Python 3.11 micro-benchmark
[[Python]] 3.11 发布说明提到有不小的性能提升: “Python 3.11 is between 10-60% faster than Python 3.10. On average, we measured a 1.25x speedup on the standard benchmark suite. See Faster CPython for details.",作者针对一些常见场景进行了性能测试对比。

Why MTTR should be a ‘business’ metric

Ex: A practice from Last9 I love: 2 day auto-delete messages on personal DMs in slack, because you want to control the spread of tribal knowledge; forcing engineers to talk on public slack channels. (Full disclosure: I’m an investor in Last9)

Backblaze: Buying less reliable disk drives can make financial sense


Murre - the lightweight K8s metrics monitoring tool
通过从 [[kubelet]] 直接获取 metric 来展示给用户,轻量的 [[kubernetes]] top.

A Visual Guide to SSH Tunnels (with labs)
[[SSH]] Tunnel 介绍。(把事情讲明白是一种能力啊)

通过 google/wire 实现 [[依赖注入]]。

“Nobody could have known”: inclusive behaviors to counter short-termism | by Elizabeth Ayer | Oct, 2022 | MediumThere Is No Shame in Customer-Reported Incidents - The New Stack
给客户呈现完整实时的事件报告,可以建立用户信任,这里的前提应该不是 P0/P1 级别的故障。 当客户遇到故障后,应该:最快更新问题状态、持续沟通、承担责任。“honesty is the best policy”

Golang gRPC 错误处理 - Jiajun的编程随想
通过在 [[grpc]] 中间件将自定义错误转换为对应业务码,同时支持 gRPC 和 HTTP 状态码。

Processing Large Files with Go (Golang) | by snassr | Oct, 2022 | Medium
使用 [[Golang]] 通过 [[goroutine]] 和 [[channel]] 并行处理大文件。

HTTP Resource Leak Mysteries in Go - Coder
[[Golang]] 内存泄漏调查,原因是没有执行 response.Body.Close()

生活 链接到标题

离开国产 SaaS

How to communicate effectively as a developer

2022-43: 工作中的自我调适

工作热情高涨的时候总是会提出各种宏大的重构方案和计划功能,遇到的各种挑战和困难感觉都不是个事儿;但是在低迷的时候就感觉千头万绪无从下手,很难鼓起勇气去开始第一步,充满了挫折感以及失败感。为了缓解这种情绪,我选择先把这些特别大的计划暂停下,从一些细小而具体的工作着手,通过稳定的交付来恢复自己的感觉。 工作中遇到状态不好的时候可以尝试从外部环境和工作本身两个方面进行调整,跟自己的朋友和爱人多聊天,积极调适坚持度过。祝愿大家都能早日走出难捱的时光,好日子还在后头哪~

BO ZENG BBOC, My Escondido: 互联网的庸众


Clay - Be more thoughtful with the people in your network.
[[Clay]] 是面向个人用户的 [[CRM]]。肯能有人觉得有些“功利”,但是人际关系是需要认真维护的。

书影 链接到标题

《100 Go Mistakes and How to Avoid Them》 ,本周读了10个,推荐阅读。

《边缘世界 第一季》,有一种要烂尾的趋势。


《孤单又灿烂的神:鬼怪》,终于看完了,不得不说,现在的韩剧水平距离 2015/2016 年真的差太多了。