跳转至

笔记

AI Post Traning: DiffusionNFT

导言

DiffusionNFT 直接在前向加噪过程(forward process)上进行优化,在彻底摆脱似然估计与特定采样器依赖的同时,显著提升了训练效率与生成质量。在GenEval任务上,DiffusionNFT仅用约1.7k步就达到0.94分,而对比方法FlowGRPO需要超过5k步且依赖CFG才达到0.95分。这表明DiffusionNFT的训练效率比FlowGRPO快约25倍。

Career Transferable skill / Durable skills / Core capabilities

简介

最近失眠还蛮多的,对被AI淘汰、被同辈后辈淘汰的担心,即使天天加班,时间还是不够,项目还是来不及,身体也扛不住。

作为SE还要具备领域内的前沿技术能力,但是担心的也不是技术,而是对能力提升有追求,不要过了一年发现还是在吃能力的老本。而且我希望个人能力的增强是持续有效的,不是那种之后用不上或者马上被淘汰的技术能力。

SE

导言

SE 的主要工作拆解:

  1. 领域内最懂技术的专家,对技术趋势有判断,有未来技术能力有预埋;
  2. 引导客户技术方向,达成合作;
  3. 技术团队建设,

时刻思考对公司的启示: 总结出了什么新东西,对华为昇腾NPU/Ascend的启示;思考昇腾的当前的能力和发展方向。

Contribution Allocation

导言

最近发现贡献分配是团队合作的一大难点, 产出的商业价值, 在不同场景下如何分配:

  1. 年终打绩效时,手底下不同员工负责不同项目,做的事情都不一样,怎么比较来分配。
  2. 一个组内的领导或者组织者,和实际手底下干脏活的人谁贡献大;
  3. 在一线调试的员工,和在家里负责版本的研发谁贡献大;
  4. 负责预埋技术的研究人员,和负责当季度软件版本交付的人谁贡献大。

但是注意:贡献分配不是为了“分高下”,而是为了“定义导向”。如果你希望团队更有创新性,就重赏 SE;如果你希望项目交付更稳健,就必须重赏那些默默把“脏活”干得极其漂亮的人。

RL Weekly News

导言

RL 相关的洞察: 算法趋势、热点模型策略、框架优化、实验规律、流派观点。