Programming¶
Triton & Triton Ascend
导言
- Ascend上训练编译成全图有功能问题,导致下发问题并不能像GPU一样完全解决;
- 在浦江实验室的经验是,triton确实能快速拿到2~3倍的收益,如果算子还有问题就能考虑
Pytorch 7 :Memory Optimization(Freeing GPU/NPU Memory Early)
导言
- 对于不使用的python对象,如何释放?
- python 的对象管理机制
- del,empty_cache , gc_collect的原理
Pytorch 2.5 :Dataset & Dataloader
导言
- 数据集与数据加载器:学习如何使用torch.utils.data.Dataset和DataLoader来加载和处理数据。
- 数据预处理:介绍常用的数据预处理方法,如归一化、数据增强等。
宛如泥潭的大型项目开发困境
导言
当时我选择一线的原因是决定能最解决客户,每个工作能产生最大的价值。
通过一段时间的开发,我感觉在一线开发就像在泥潭里前进:走得越快越远,泥潭陷得越深,前进阻力越大。
困境为何而来,如何解决困境,是我想讨论的重点。
[C++] Destructor Order
导言
- 一般来说,析构函数应该只处理释放资源,不处理逻辑。
- 但是PTA的代码里,在全局变量的析构函数里,写了向子线程发送结束信号的函数,和
childThread.join()。这导致了很奇怪的问题,string demalloc等。
为此,想研究一下C++的析构函数执行顺序。包括嵌套的Class结构,和全局变量的析构时机。