Python文件遍历os.walk()与os.listdir()使用及说明
Python文件遍历os.walk()与os.listdir()
在图片处理过程中,样本数据的组织是个常见的问题,样本组织好了,后面数据转换、读取等都能得心应手。
在这里讲一下我在准备样本时的一些心得
首先是os.walk()函数
os.walk(path)返回三个值:
- parent
- dirnames
- filenames
分别表示path的路径、path路径下的文件夹的名字和path路径下文件夹以外的其他文件;
我用下面的代码来对样本图片建立标签:
不过不知walk到底是怎么遍历的,我生成的标签顺序乱了
所以这就想到用listdir来重新做标签:
os.listdir(path)返回一个包含path路径下所有文件的列表
我用下面的方法来建立标签:
不过还是之前一样的乱序,最后采用sort():
先获取文件夹下图片文件的名字列表list,再对图片的序号进行排序,将排序好的文件名列表逐一写入txt中
os.walk和os.listdir遍历目录比较
假设存在下面的目录和文件结构:
/a ----> /b ----> 1.py,2.py
----> /c ----> 3.py , 4.py
----> 5.py
----> 6.py
os.walk()
运行下面的测试代码
import os for root, dirs, files in os.walk('../a'): # 指向当前的测试文件夹 print(root) print(dirs) print(files)
输出结果,我们解析一下输出结果
../a # 当前遍历的根目录
['b', 'c'] # 根目录下的两个子目录b,c
['5.py', '6.py'] # 根目录下的两个子文件
../a\b # 遍历根目录下的子目录b
[] # 子目录b中的子目录
['1.py', '2.py'] # 子目录b中的文件
../a\c # 遍历根目录下的子目录c
[] # 子目录c中的子目录
['3.py', '4.py'] # 子目录c中的文件
os.listdir()
运行如下测试代码
for f in os.listdir('../a'): print(f)
输出结果
5.py
6.py
b
c
两种方法比较
os.walk将当前目录下的所有子目录及其中的内容,都会遍历到;而os.listdir只会遍历当前目录中所包含的内容。当存在如下的目录级别时
/a ----> /b ------> b1.txt b2.txt
----> /c ------> c1.txt c2.txt
----> /d ------> d1.txt d2.txt
当我们想要将所有的txt文件提取出来,此时使用os.walk是最好的选择,直接将files遍历即可,因为files在其父目录成为根目录时,会将当前文件夹中的所有files遍历出来,即:
import os for root, dirs, files in os.walk('./a'): for file in files: print(file)
#运行结果
b1.txt
b2.txt
c1.txt
c2.txt
以上为个人经验,希望能给大家一个参考,也希望大家多多支持编程宝库。
merge()import pandas as pdpd.merge(DateFrame1,DateFrame2,on = ' ',how = ' ')merge是pandas中用来合 ...