python 高速去重比list 快速
2023-12-15 16:54:59
高速去重代码
from glob import glob
from tqdm import tqdm
path_list=glob("E:/sky_150b/任务组_20231207_2023/*")
for one in tqdm(path_list):
with open(one,"r",encoding="utf-8") as f:
data=f.readlines()
data_list={}
for i in tqdm(data):
if data_list.get(i,False)==False:
data_list[i]="1"
with open(one, "w", encoding="utf-8") as f:
f.writelines([i for i in data_list.keys()])
高速去重解析
该段代码使用了python中的glob和tqdm库,glob用于匹配满足某个规则的文件路径列表,tqdm用于显示进度条。
首先,通过glob匹配所有指定路径下的文件,然后遍历每个文件,使用with open语句以只读方式打开文件,并使用utf-8编码读取文件的全部内容。接着,使用一个字典类型变量data_list来记录每个不重复的行,并将每行内容作为字典的键。如果数据已存在于字典中,则不会添加。最后,再次使用with open语句以只写方式打开原文件,并使用utf-8编码将字典中的每个键写入文件中。因为字典的键是唯一的,所以写入后的文件中所有行都是唯一的,没有重复内容。
文章来源:https://blog.csdn.net/weixin_32759777/article/details/134914755
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:veading@qq.com进行投诉反馈,一经查实,立即删除!
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:veading@qq.com进行投诉反馈,一经查实,立即删除!