文章 链接到标题

技术 链接到标题

🔨 Add internal scripts to generate language translations with PydanticAI, include Spanish prompt by tiangolo · Pull Request #13123 · fastapi/fastapi · GitHub

使用 [[Pydantic]] AI 将 [[FastAPI]] 的文档翻译为西班牙语。看上去使用起来很方便。[[piglei]]的 https://github.com/piglei/ai-vocabulary-builder 也在用 [[Pydantic]] AI。


关于 RAG 的一些碎碎念 | 三点水

落地的最大问题: 人力 链接到标题

遇到效果问题,很多客户都会提“微调行不行”,可以,但是得加钱。 我只调过 Ranking 模型和 LLM,都需要高质量的标注数据。但一般产出这些数据需要对应的业务专家,尤其是 LLM 的 SFT 数据,还需要提供结果的回答。我们见到的很多客户,连知识库的数据预期从哪来,哪些合适放在知识库都回答不了,更别说调动资源来准备这些数据了。 也因此,ToB 的 RAG 项目很难落地,无监督的各种方法很快就会达到上限,而后续的数据治理又没法推进,于是死局。

我司的内部工具中,只包含了 KB,没有所有的对外文档,导致 KB 的信息明显过于细节,割裂感严重,作为研发了解还可以,对于最终客户是否好用很难说。


Parkinson’s Law: It’s Real, So Use It

帕金森定律:指工作必须占用所有预先分配的时间才能完成。工作内容是会膨胀的。

如果一项工具没有 deadline,那么这项工作很有可能会无限的持续下去。无论是工作还是生活,从个人体感上说都是如此,所以需要给所有的事项都设置一个 deadline。下一个问题是如何设置一个“合理的” deadline?


Saka 馬鹿

备份一定需要做; 验证不同规模下数据恢复的时间,在事故发生后对于恢复周期有个预期。

对于数据备份的场景,我的经验是,即使有周期性的备份,优先选择重建,在前端进行流量切换,如果只能回滚,在时间允许的情况下,尽量把当前状态也备份一下。因为:

  • 备份是上一个周期完成的,但是上一个备份周期和验证备份有效性大概率是有时间差,无法 100%确定备份是可用的;
  • 后续在 debug 时会方便些。

生活 链接到标题

年度扯淡 2024

对于产品经理来说,第一要考虑是,到底要解决什么问题,解决这个问题是否会产生价值。而这个过程中,最痛苦的就是要持续不断的审视自己在做的事情到底是不是创造了价值,创造了多大的价值,是否有更大的价值被忽略掉了,真的为客户着迷了吗,足够着迷了吗。同时感叹中国 ToB 领域真的缺少优秀的产品经理,我们之前决定要自己来培养产品经理的思路还是非常明智的。

老板的年终总结。最近由于一些原因,也需要写一个工具类产品的需求文档,发现产品经理的活很难做,找到明确的用户很难,从明确的用户中找到共性,尽可能的均衡很难,从共性转换到功能需求也很难。


新疆二十日(上):雪域沙海,我的北疆探索之旅 - Simon’s Blog

[[新疆]] [[游记]]。我对冬天和大雪很熟悉,对冬天的雪山一无所知,这种地貌特征,太美了。 可惜我不会开车,不知道什么时候有机会去新疆。


书影 链接到标题

《一往无前》,趁着元旦假期把这本读完了。顺势而为,在顺势的前提下要有做事的能力。

《生活大爆炸》,B 站最近有了版权,又重新开始看,真好看啊,放佛回到了大学时期。

碎碎念 链接到标题

  • 看到书店自救卖盲盒,虽然被中图网恶心过,还是下单了。最终 4 本书,质量还行。
  • 在南京东路这边瞎溜达,听到有个人说还有364天就会跨年了,我好好奇他们跨年发生了什么,让他们如此的怀念跨年
  • 发现现在 self-hosted 的应用有一种依赖越来越多的趋势,比如最近看到的几个项目依赖了 Redis、PG、ES/Meili、Headless Browser。这也产生了另一个现象,如果你开发一个提供相同功能的应用,但是依赖很少,那么很容易在早期获得关注。
  • Talahon 指的是 2024 年德国社交媒体及其他社交平台上的一种趋势。该趋势的特点是年轻男性,通常有移民背景,尤其来自阿拉伯国家,在视频中摆出侵略性姿态,展示奢华但往往是假的配饰。这种现象根植于对父权制、男子气概、厌女症和物质主义的特定描绘,并引发了广泛的讨论和争议。
  • 一件商品如果可以使用信用卡,那么它是消费,反之则是投资。常见的比如汽车可以使用信用卡,房子不能。
  • 大人是制造年味的,不是享受年味的。小孩才是享受年味的
  • 把小红书的个性化推荐关了之后,推荐的每一个东西我都不喜欢,非常的精准

2024 链接到标题

元旦期间对自己的 2024 进行了一些总结,记录一些数据。

按照惯例,回答了 40 个问题,其中关于作品的:

  • 最喜欢的电视节目:《花儿与少年-丝路季》
  • 度过最好的一本书是什么?《外面是夏天》
  • 看过最喜欢的一部电影是什么?《好东西》

Wakatime 的编码统计:

  • 编码时长 996 小时(???)
  • 平均每天 3h10min
  • 一周哪天最高效:周二(会议最少)
  • 主要的编辑器:VS Code

Last.fm:

  • Top Artist: New Jeans
  • Top Album: How Sweet

豆瓣:

  • 看过 53 部影视,389 小时,最多的导演是大鹏

小宇宙:

  • 638 个单集,792 小时:
    • 正经叭叭 109 小时
    • 不开玩笑 79 小时
    • 基本无害 69 小时

小红书:

  • 每天都用(有点离谱,现在把个性化推荐关掉了)
  • 旅游相关信息最多,15小时

Bilibili:

  • 每天都用,667 小时

滴滴:

  • 打车 21 次,869元。