
df = pd.read_csv(‘my_csv.csv’) #默认可以读取以逗号为分隔符的数据,如csv
df = pd.read_table(‘my_table.txt’) #默认可以读取以空格或者制表符为分隔符的数据,如txt,xls
df = pd.read_excel(‘my_excel.xlsx’) #可以读取xlsx为后缀的文件
参数(共用)
header = None #第一行是否作为列名
index_col = ‘col1’ #设置索引-单列
index_col = [‘col1’,’col2’] #设置索引-多列
usecols = [‘col1’] #读取列的集合
parse_dates #转换为时间的列
nrows=2 #读取的行数,此处为2行
sep ='\t' 分割参数,可以选择分割符号类型,至此所有读取都可以互相转换。‘\|\|\|\|’为||||,’\t‘为制表符
#tsv文件是以制表符作为分隔符
2.文件写入df_csv.to_csv(‘my_csv.csv’,index = False)
df_excel.to_excel(‘my_excel.xlsx’)
df_txt.to_csv(‘my_txt.txt’,sep=’\t’,index=False) #写为txt文件,关键在sep=‘\t’
参数(共用)
index =False #是否保留索引
sep 用途和上面一样
3.特性df = df[‘col1’] #单括号,格式为Series
df = df[[‘col1’,’col2’]] #双括号,格式为dataframe
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)