尝试加载5 GB文本文件时出现内存错误

2024-08-21Python开发问题
8

本文介绍了尝试加载5 GB文本文件时出现内存错误的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着跟版网的小编来一起学习吧!

问题描述

我要读取以文本格式存储在5 GB文件中的数据。当我尝试使用以下代码读取文件内容时:

file = open('../data/entries_en.txt', 'r')
data = file.readlines()
发生错误: data=file.readines() 内存错误 我的笔记本电脑有8 GB内存,当我想运行程序时,至少有4 GB是空的。但是当我监控系统性能时,当python使用大约1.5 GB的内存时,会出现这个错误。
我使用的是python2.7,但如果有问题,请告诉我2.x和3.x的解决方案 要阅读此文件,我应该做些什么?

推荐答案

处理大文件的最佳方式是-

with open('../file.txt', 'r') as f:
    for line in f:
        # do stuff

readlines()会出错,因为您试图将过大的文件直接加载到内存中。处理完文件后,上面的代码将自动关闭该文件。

这篇关于尝试加载5 GB文本文件时出现内存错误的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持跟版网!

The End

相关推荐

在xarray中按单个维度的多个坐标分组
groupby multiple coords along a single dimension in xarray(在xarray中按单个维度的多个坐标分组)...
2024-08-22 Python开发问题
15

Pandas中的GROUP BY AND SUM不丢失列
Group by and Sum in Pandas without losing columns(Pandas中的GROUP BY AND SUM不丢失列)...
2024-08-22 Python开发问题
17

GROUP BY+新列+基于条件的前一行抓取值
Group by + New Column + Grab value former row based on conditionals(GROUP BY+新列+基于条件的前一行抓取值)...
2024-08-22 Python开发问题
18

PANDA中的Groupby算法和插值算法
Groupby and interpolate in Pandas(PANDA中的Groupby算法和插值算法)...
2024-08-22 Python开发问题
11

PANAS-基于列对行进行分组,并将NaN替换为非空值
Pandas - Group Rows based on a column and replace NaN with non-null values(PANAS-基于列对行进行分组,并将NaN替换为非空值)...
2024-08-22 Python开发问题
10

按10分钟间隔对 pandas 数据帧进行分组
Grouping pandas DataFrame by 10 minute intervals(按10分钟间隔对 pandas 数据帧进行分组)...
2024-08-22 Python开发问题
11