笔记大全

OneFlow源码解析之Eager模式下Tensor存储管理方法是什么

更新时间：2023-10-27

前言：

OneFlow是一个面向深度学习的开源框架，支持动态图模式和静态图模式，并提供了Eager模式和Graph模式两种计算模式。Eager模式是指即时执行的模式，它可以方便地进行前向传播和反向传播计算，并动态地查看和调试计算结果。在Eager模式下，OneFlow的Tensor存储管理方法主要包括内存分配、引用计数和垃圾回收等方面。

内存分配：

在Eager模式下，OneFlow会动态地分配和管理Tensor的内存。当用户创建一个新的Tensor时，OneFlow会根据Tensor的大小和数据类型，在内存池中申请一块连续的内存空间，并将该内存空间的地址保存在Tensor中。在Tensor不再被使用时，OneFlow会自动释放这块内存空间，以便其他Tensor可以复用。为了高效地管理内存，OneFlow使用了内存池的技术。内存池是一种预先分配一定大小的内存空间，并通过指针来记录该内存空间的使用情况。当用户创建一个新的Tensor时，OneFlow会首先检查内存池中是否有足够的空闲内存空间可供分配，如果有，则直接分配给Tensor；如果没有，则会通过扩展内存池的方式获得更多的内存空间。

引用计数：

在Eager模式下，OneFlow使用引用计数的方式来管理Tensor的生命周期。每个Tensor对象都有一个引用计数，表示有多少个指针指向该Tensor。当一个新的Tensor从旧的Tensor拷贝构造而来时，新的Tensor的引用计数会增加1。当一个Tensor不再被使用时，其引用计数会减少1。只有当Tensor的引用计数减少到0时，表示没有任何指针指向该Tensor，OneFlow会自动释放该Tensor所占用的内存空间。引用计数的管理是通过智能指针来实现的。在OneFlow中，每个Tensor对象都有一个shared_ptr指针，用于保存该Tensor对象的引用计数。当需要创建一个新的Tensor对象时，会通过拷贝构造函数来增加被拷贝Tensor对象的引用计数，并共享该Tensor对象所占用的内存空间。当不再使用该Tensor对象时，会通过shared_ptr的析构函数来减少引用计数，并在引用计数减少到0时自动释放内存空间。

垃圾回收：

在Eager模式下，OneFlow采用了一种基于垃圾回收的机制来管理Tensor的生命周期。当一个Tensor不再被使用时，其引用计数会减少到0，此时OneFlow会将该Tensor加入到垃圾回收队列中。垃圾回收队列是一个保存不再被使用的Tensor的队列，其中的Tensor会在特定的时机被回收。 OneFlow通过周期性地检查垃圾回收队列来回收不再使用的Tensor。当检查到有Tensor需要回收时，OneFlow会调用Tensor的析构函数来释放该Tensor所占用的内存空间，并将其从垃圾回收队列中移除。垃圾回收的频率和时机是由OneFlow内部的调度器控制的，通常会在计算任务结束后进行垃圾回收。总结：在Eager模式下，OneFlow的Tensor存储管理方法主要包括内存分配、引用计数和垃圾回收。OneFlow使用内存池来动态分配和管理Tensor的内存，通过引用计数来管理Tensor的生命周期，并通过垃圾回收机制回收不再使用的Tensor。这些方法的综合应用，可以有效地管理Tensor的内存使用，提高OneFlow在Eager模式下的计算性能和可靠性。

c语言编程笔录