
pd.read_csv(file, header=None, names = ['a','b','c'] )1
names为指定的名字
数据tab分隔的时候去读方式
sep指定
df = pd.read_csv('../input/data_train.csv',sep = '\t',encoding='GBK')
在合并两个数据时,发现两个df的列顺序不一致,得把其中的一个给修改下;
方法一:
把需要的列顺序给弄成一个list,然后再选取;
order_columns = ['user_id', 'name', 'create_time']
然后再选取数据赋给一个新的数据框;
df1 = df[order_columns]
方法二:
先把需要调整的列的数据拿出来,之后,再将这个列删掉,最后,再用插入的方式把这个列调整到对应的位置上。
df_id = df.id
df = df.drop('id',axis=1)
df.insert(0,'id',df_id)
详细参考:
https://blog.csdn.net/a19990412/article/details/81945315
r语言中添加新列的方法:
假设你数据是data,那么前几列的和是rowSums(data);
然后你可以重新做一个dataframe
data_new<-data.frame(data,sum=rowSums(data))
R语言Data Frame数据框常用 *** 作:
Data Frame一般被翻译为数据框,感觉就像是R中的表,由行和列组成,与Matrix不同的是,每个列可以是不同的数据类型,而Matrix是必须相同的。
Data Frame每一列有列名,每一行也可以指定行名。如果不指定行名,那么就是从1开始自增的Sequence来标识每一行。
使用data.frame函数就可以初始化一个Data Frame。比如我们要初始化一个student的Data Frame其中包含ID和Name还有Gender以及Birthdate,那么代码为:
student<-data.frame(ID=c(11,12,13),Name=c("Devin","Edward","Wenli"),Gender=c("M","M","F"),Birthdate=c("1984-12-29","1983-5-6","1986-8-8”))
另外也可以使用read.table() read.csv()读取一个文本文件,返回的也是一个Data Frame对象。读取数据库也是返回Data Frame对象。
查看student的内容为:
ID Name Gender Birthdate
1 11 Devin M 1984-12-29
2 12 Edward M 1983-5-6
3 13 Wenli F 1986-8-8
这里只指定了列名为ID,Name,Gender和Birthdate,使用names函数可以查看列名,如果要查看行名,需要用到row.names函数。这里我们希望将ID作为行名,那么可以这样写:
row.names(student)<-student$ID
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)