如何解决使用NumPy的np.full方法时遇到的"MemoryError"问题？

更新时间 2025-12-04

一、问题现象与重现

当开发者尝试使用np.full((10000, 10000), 1.0)这样的语句初始化大型数组时，控制台可能抛出MemoryError异常。典型错误信息为：

MemoryError: Unable to allocate 762. MiB for an array with shape (10000, 10000)

该问题主要由三个核心因素导致：

改用内存效率更高的数据类型可立即降低内存消耗：

np.full((10000, 10000), 1, dtype=np.float32)  # 节省50%内存

采用分块处理策略避免单次大内存分配：

blocks = [np.full((1000, 1000), 1) for _ in range(100)]
result = np.block(blocks)

对于含大量重复值的数组，scipy.sparse是更好的选择：

from scipy import sparse
matrix = sparse.csr_matrix((10000, 10000), dtype=np.float32)

通过np.memmap实现磁盘-内存交换：

arr = np.memmap('temp.dat', dtype='float32', mode='w+', shape=(10000,10000))
arr[:] = 1.0

特定场景下这些方法更高效：

np.zeros() + value  # 对全零初始化有效
np.ones() * value   # 对全1初始化有效

使用Dask等工具进行分布式计算：

import dask.array as da
arr = da.full((10000, 10000), 1.0, chunks=(1000, 1000))