My Digital Worker : Work with AI
导言
26年开年,Agent爆火,我也尝试了OpenClaw、CC等前沿工具和API接口。当前问题还是记忆力不够(即使1M也远远不够),这导致你还是不能将其看作是一个“数字员工”。从技术发展、幻觉和使用成本角度考虑,AI仍然将作为单点技术咨询/单问题解决( 定制prompt )的角色参与到个人的工作中,来增强个人能力,促成“生产力”超高的超级个体的产生。
大部分员工只是按部就班的做事,但是AI时代下,什么有价值,应该做什么(应该要AI帮你做什么)反而是最重要的。
本文将从SE角度:热点跟踪、技术调研、客户交流/筛选规划、按期执行、测试看护、总结汇报。 这些方面来介绍我是怎么利用AI辅助加速的。
热点跟踪¶
交付件¶
- 领域内的重磅模型、开源工作跟踪
- 微信公众号、
- github、
- arxiv
- O-DataMap
- AI辅助开发技术跟踪
- 日常数据跟踪文档
加速方案¶
OpenClaw或者其他定时任务。
多模态RL仓跟踪 prompt
跟踪下面Github仓库的PR合入,总结成markdown报告发送给我,**报告要求**: 阅读每条PR内容,总结技术思路,不只是标题,全部输出中文翻译和总结。
总结时深入思考:关注多模态RL领域内最新变化;(出了什么新东西,对华为昇腾NPU/Ascend的启示)2. 思考昇腾的当前的能力和发展方向;(当前能力,后续规划)
- VeRL (verl-project/verl) - 需持续关注已合入PR
- VllmOmni (vllm-project/vllm-omni) - 需持续关注已合入PR
- Slime (THUDM/slime) - 智谱RL,需持续关注已合入PR
- VeRL-Recipe (verl-project/verl-recipe) - 需关注已合入PR + Open PR
- VeOmni (ByteDance-Seed/VeOmni) - 字节Omni,需持续关注已合入PR
- DiffSynth-Studio (modelscope/DiffSynth-Studio) - 魔搭DiffSynth,需持续关注已合入PR
- DiffusionNFT (NVlabs/DiffusionNFT) - NVIDIA Diffusion,监控每个commit(不活跃仓库)
- SteptronOss (stepfun-ai/SteptronOss) - StepFun训练框架,监控每个commit(不活跃仓库)
- MobileAgent (X-PLUG/MobileAgent) - 阿里GUI Agent,监控PR(含UI-S1 RL训练框架)
- ROLL (alibaba/ROLL) - 阿里大模型RL训练框架,监控已合入PR
微信公众号很难爬取
技术调研¶
交付件¶
- 针对热点,调研/明确相关知识(技术的来龙去脉
- 背景(缘起、热门契机);
- 核心技术、重点工作及其技术解释;
- 当前主航道、衍生流派;
- 开源Github工作
- 未来技术发展方向;
- 对公司的启示。
- 输出调研文档和PPT,用于内部分享和技术交流。
加速方案¶
围绕NotebookLM的调研产出(不充会员,每天次数有限)
借助LLM,拓展并明确拓展范围 prompt
中转站都没有思考能力,建议网页版,或者OpenRouter。