将unicode元素读入​​numpy数组

将unicode元素读入​​numpy数组,第1张

将unicode元素读入​​numpy数组

在内存中,Unipre字符串表示为UCS-2或UCS-4,具体取决于您的Python解释器的编译方式。您的文件采用UTF-8编码,因此您需要先对其进行编码,然后才能将其映射到NumPy数组。

loadtxt()
不能为您完成重新编码-毕竟NumPy主要针对数字数组。

假设每行具有相同数量的字符,则还可以使用更有效的变体

s = precs.open("new.txt", encoding="utf-8").read()arr = numpy.frombuffer(s, dtype="<U3")

这将在字符串中包含换行符。要不包括它们,请使用

arr = numpy.frombuffer(s.replace("n", ""), dtype="<U2")

编辑 :如果文件的行长不同,并且您希望避免使用中间列表,则可以使用

arr = numpy.fromiter(precs.open("new.txt", encoding="utf-8"), dtype="<U2")

我不确定这是否会在内部创建一些临时列表。



欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/zaji/5617081.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2022-12-15
下一篇2022-12-15

发表评论

登录后才能评论

评论列表(0条)

    保存