
1、首先打开电脑检查网络。
2、其次打开《dataframesetindex》编辑软件进行测试网络连接是否异常。
3、最后等待网络连接正常后,点击索引即可。
首先是引入pandas和numpy,这是经常配合使用的两个包,pandas依赖于numpy,引入以后我们可以直接使用np/pd来表示这个两个模块先创建一个时间索引,所谓的索引(index)就是每一行数据的id,可以标识每一行的唯一值为了快速入门,我们看一下如何创建一个6X4的数据:randn函数用于创建随机数,参数表示行数和列数,dates是上一步创建的索引列我们还可以使用字典来创建数据框,例如创建一个列名为A的数据框,索引是自动创建的整数这又是一个字典创建DataFrame的例子假如字典内的数据长度不同,以最长的数据为准,比如B列有4行:可以使用dtypes来查看各行的数据格式接着看一下如何查看数据框中的数据,看一下所有的数据使用head查看前几行数据(默认是前5行),不过你可以指定前几行查看前三行数据使用tail查看后5行数据查看数据框的索引查看列名用columns查看数据值,用values查看描述性统计,用describe使用type看一下输出的描述性统计是什么样的数据类型——DataFrame数据使用T来转置数据,也就是行列转换对数据进行排序,用到了sort,参数可以指定根据哪一列数据进行排序。1.首先用股票交易软件导出成交明细,导出格式为.xls
2.用excel打开后,另存为csv格式 用记事本打开即可
格式如下 用逗号分隔
时间,成交价,手数,笔数
09:15:03,15.3500,0,0
09:15:12,15.4000,0,0
09:17:00,15.4100,0,0
09:17:09,15.4000,0,0
09:17:36,15.4100,0,0
09:17:45,15.4000,0,0
09:17:54,15.4100,0,0
09:25:03,15.4100,"8,147,900","2,015"
09:30:03,15.3000,"761,900",371
09:30:06,15.3200,"1,690,900",935
3.使用二维数组Dataframe读取
用pd.read_csv()方法读取
df_csvload = pd.read_csv( path, header = 1 , names=range(2,8), index_col=0 , encoding='gb2312' ) #header 1第1行作为列索引
#header = None 就是没有定义列索引,系统会自动添加一个列索引0开始的
# names指定列索引名称 2到7结束
#index_col指定数据中哪一列作为行索引 encoding设置编码格式
print(df_csvload )
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)