
import os
data=pd.read_excel('/Users/kelan/Downloads/2月5日/安徽.xlsx')
a=data.columns
df_empty=pd.DataFrame(columns=a)
for parents,adds,filenames in os.walk('/Users/kelan/Downloads/2月5日'):
for filename in filenames:
#print(os.path.join(parents,filename))
data = pd.read_excel(os.path.join(parents,filename))
df_empty=df_empty.append(data,ignore_index=True)
df_empty.to_excel('/Users/kelan/Downloads/2月5日/11.xlsx')
注意中文写乎辩贺入,os.walk会返回3个参数,分别是路径,目录list,文件list,取第一灶饥个和最后一个,最后一个遍历。ignore_index可以忽略索引。开始先在pandas中建一个dataframe,岁派columns中填写行标
使用路径对象glob()函数和rglob()函数,可以查看指定路径下的文件和子文件夹,两者亩裂磨的区别在于,glob()函数只进行一级查找,而rglob()函数会进行多级查找。
from pathlib import Path
p = Path('d:\\文源拦件夹\\')
r = p.glob('*')
for i in r:
print(i) #显示glob()函数的结果
print('-' * 25) #这里是分割线
r = p.rglob('*')
for i in r:
print(i)#显示rglob()函数的结果
查看对应迅斗结果如下:
d:\11\11.txt
d:\11\r.mp3
d:\11\t.mp3
d:\11\tp1000
d:\11\文件夹
-------------------------
d:\11\11.txt
d:\11\r.mp3
d:\11\t.mp3
d:\11\tp1000
d:\11\文件夹
d:\11\文件夹\文档.txt
________________END______________
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)