开场白
来阅读一下《Minder: Faulty Machine Detection for Large-scale Distributed Model Training》原论文。
ο(=•ω<=)ρ⌒☆
论文链接:https://www.usenix.org/conference/nsdi25/presentation/deng
Minder
论文贡献
调查了:故障类型以及其与各个指标的相关性。从经验上解释了这些相关性的表现。概述检测的挑战。
提出Minder的设计思想:相似度、连续性、数据降噪模型、指标优先级。并通过全面的评估加上消融实验,来凸显其反应速度快、准确率高的特点以及
2025-10-061.8k 字6 分钟
LAKE论文解读
开场白
来阅读一下《Towards a Machine Learning-Assisted Kernel with LAKE》原论文。
o((>ω< ))o
论文链接:https://dl.acm.org/doi/abs/10.1145/3575693.3575697
LAKE
Learning-assisted, Accelerated KErnel
5个启发式内核子系统可以被ML加速:(最后一行是文件系统加密(EFS))
应用
ML算法
API
推理频次
存储系统里I/O延迟的预测
神经网络
CUDA
细粒度
预测缓存中的页热度以替换
LSTM
Hig
2025-06-152.9k 字12 分钟
MixMatch与FixMatch论文解读
开场白
做模式识别课内作业,有关MixMatch和FixMatch。
来阅读一下《MixMatch: A Holistic Approach to Semi-Supervised Learning》和《FixMatch: Simplifying Semi-Supervised Learning with Consistency and Confidence》两篇原论文。
(*^-^ *)
原论文阅读
MixMatch
Consistency Regularization
MixMatch使用了一致性正则化(自洽正则化),即对无标签数据进行数据增广,产生的新数据输入分类器,预测结果应保
2025-01-013.1k 字13 分钟
Paxos一致性算法
开场白
水了那么久的博客,这次来点稍微硬核的吧。
来读一下Leslie Lamport 的论文《Paxos Made Simple》。
全程坚持读下来,我能保证读者明白什么是Paxos。
开干!
(~ ̄▽ ̄)~
Paxos算法注解
参阅 Leslie Lamport 的论文《Paxos Made Simple》。
三类角色
proposers
acceptors
learners
算法要求(requirements)
An acceptor can accept a proposal numbered n if it has not responded to a prepar