频道栏目
首页 > 程序开发 > 软件开发 > 其他 > 正文
用NumPy和pandas对CSV文件进行写操作
2017-01-16 10:02:53      个评论    来源:星空永恒  
收藏   我要投稿
用NumPy和pandas对CSV文件进行写操作:数组存储成CSV之类的区隔型文件:下面代码给随机数生成器指定种子,并生成一个3*4的NumPy数组。

将一个数组元素的值设为NaN:

In [26]: import numpy as np

In [27]: np.random.seed(42)

In [28]: a = np.random.randn(3,4)

In [29]: a[2][2] = np.nan

In [30]: print(a)

[[ 0.49671415 -0.1382643   0.64768854  1.52302986]

[-0.23415337 -0.23413696  1.57921282  0.76743473]

[-0.46947439  0.54256004         nan -0.46572975]]

 

NumPy的savetxt()函数是与loadtxt()相对应的一个函数,它能以诸如CSV之类的区隔型文件格式保存数组:

In [31]: np.savetxt('np.csv',a,fmt='%.2f',delimiter=',',header="#1,#2,#3,#4")

上面的函数调用中,我们规定了用以保存数组的文件的名称、数组、可选格式、间隔符和一个可选的标题

通过cat np.csv,可以查看刚才所建的np.csv文件的具体内容

 

利用随机数组来创建pandas DataFrame:

In [38]: df = pd.DataFrame(a)

In [39]: df

Out[39]: 

 0         1         2         3

0  0.496714 -0.138264  0.647689  1.523030

1 -0.234153 -0.234137  1.579213  0.767435

2 -0.469474  0.542560       NaN -0.465730

pandas会自动替我们给数据取好列名

利用pandas的to_csv()方法可以为CSV文件生成一个DataFrame:

In [40]: df.to_csv('pd.csv',float_format='%.2f',na_rep="NAN!")

对于这个方法,我们需要提供文件名、类似于NumPy的savetxt()函数的格式化参数的可选格式串和一个表示NaN的可选字符串

点击复制链接 与好友分享!回本站首页
上一篇:浅谈对象的序列化
下一篇:hdu 1873 看病要排队(优先队列)
相关文章
图文推荐

关于我们 | 联系我们 | 广告服务 | 投资合作 | 版权申明 | 在线帮助 | 网站地图 | 作品发布 | Vip技术培训 | 举报中心

版权所有: 红黑联盟--致力于做实用的IT技术学习网站