AI Post Traning: DanceGRPO
导言
DanceGRPO是25年5月发表的论文,把GRPO的方法引入到了生成领域。(类似的有flowGRPO)。字节客户基于此魔改,故学习。
导言
DanceGRPO是25年5月发表的论文,把GRPO的方法引入到了生成领域。(类似的有flowGRPO)。字节客户基于此魔改,故学习。
导言
DiffusionNFT 直接在前向加噪过程(forward process)上进行优化,在彻底摆脱似然估计与特定采样器依赖的同时,显著提升了训练效率与生成质量。在GenEval任务上,DiffusionNFT仅用约1.7k步就达到0.94分,而对比方法FlowGRPO需要超过5k步且依赖CFG才达到0.95分。这表明DiffusionNFT的训练效率比FlowGRPO快约25倍。
简介
最近失眠还蛮多的,对被AI淘汰、被同辈后辈淘汰的担心,即使天天加班,时间还是不够,项目还是来不及,身体也扛不住。
作为SE还要具备领域内的前沿技术能力,但是担心的也不是技术,而是对能力提升有追求,不要过了一年发现还是在吃能力的老本。而且我希望个人能力的增强是持续有效的,不是那种之后用不上或者马上被淘汰的技术能力。
导言
最近发现贡献分配是团队合作的一大难点, 产出的商业价值, 在不同场景下如何分配:
但是注意:贡献分配不是为了“分高下”,而是为了“定义导向”。如果你希望团队更有创新性,就重赏 SE;如果你希望项目交付更稳健,就必须重赏那些默默把“脏活”干得极其漂亮的人。