怎么用python读取txt文件里指定行的内容,并导入excel

怎么用python读取txt文件里指定行的内容,并导入excel,第1张

建议使用下面的方法。由于linecache会缓存,所以对大文件可以使用自己简单是实现getline如下:

Python code

def getline(thefilepath, desired_line_number): if desired_line_number < 1: return '' for current_line_number, line in enumerate(open(thefilepath, 'rU')): if current_line_number == desired_line_number - 1 : return line return ''

读excel要用到xlrd模块,官网安装(>

全文使用的是xlswriter模块写的,也有人使用 xlrd与 xlutils模块实现,不过还未进行验证import xlsxwriterworkbook = xlsxwriterWorkbook("D:\\Program Files\\subpy\\sql2xlsx")#在指定目录下创建一个excleworksheet = workbookadd_worksheet("students")#新建一个sheettitle_index = ["A","B","C","D"]#sheet中的区域li = [] #定义一个空列表blod = workbookadd_format({"bold":True})#定义exlce中写入的字体wi全文

import openpyxl

workbook=openpyxlload_workbook('文件路径名xslx')

sheet=workbook["表单名"]

for row in sheet:#遍历每一行

for cell in row:#遍历每一行中的每个单元格

if cellvalue == "筛选数据":#获取到了筛选数据所在的单元格

"所在行" = cellrow

break

break

list1=[]#一个空列表用来装行数据

row_num="所在行"-1#目标行的上一行开始获取值

for i in range(3)#3行循环3次

list1append([])

for cell in sheet[ row_num]:

list1[i]append(cellvalue)#一行的数据添加到列表

row_num+=1#一行完了后,行数+1

最后list1=[[目标上一行数据],[目标行数据],[目标下一行数据]]

原文非常清晰,全程无bug,调试通过,留作记录以防丢失

一、xlrd和xlwt

使用之前需要先安装,windows上如果直接在cmd中运行python则需要先执行pip3 install xlrd和pip3 install xlwt,如果使用pycharm则需要在项目的解释器中安装这两个模块,File-Settings-Project:layout-Project Interpreter,点击右侧界面的+号,然后搜索xlrd和xlwt,然后点击Install Package进行安装。

对于excel来说,整个excel文件称为工作簿,工作簿中的每个页称为工作表,工作表又由单元格组成。

对于xlrd和xlwt,行数和列数从0开始,单元格的行和列也从0开始,例如sheetrow_values(2)表示第三行的内容,sheetcell(1,2)value表示第二行第三列单元格的内容。

1xlrd模块读取excel文件

使用xlrd模块之前需要先导入import xlrd,xlrd模块既可读取xls文件也可读取xlsx文件。

获取工作簿对象 :book = xlrdopen_workbook('excel文件名称')

获取所有工作表名称 :names = booksheet_names(),结果为列表

根据索引获取工作表对象 :sheet = booksheet_by_index(i)

根据名称获取工作表对象 :sheet = booksheet_by_name('工作表名称')

获取工作表行数 :rows = sheetnrows

获取工作表列数 :cols = sheetncols

获取工作表某一行的内容 :row = sheetrow_values(i) ,结果为列表   sheetrow(i),列表

获取工作表某一列的内容 :col = sheetcol_values(i)  结果为列表   sheetcol(i),列表

获取工作表某一单元格的内容 :cell = sheetcell_value(m,n)、 sheetcell(m,n)value、sheetrow(m)[n]value,sheetcol(n)[m]value,结果为字符串或数值    sheetcell(0,0),xlrdsheetCell对象

示例:假设在py执行文件同层目录下有一fruitxls文件,有三个sheet页Sheet1、Sheet2、Sheet3,其中Sheet1内容如下:

import xlrd

book = xlrdopen_workbook('fruitxls')print('sheet页名称:',booksheet_names())

sheet = booksheet_by_index(0)

rows = sheetnrows

cols = sheetncolsprint('该工作表有%d行,%d列'%(rows,cols))print('第三行内容为:',sheetrow_values(2))print('第二列内容为%s,数据类型为%s'%(sheetcol_values(1),type(sheetcol_values(1))))print('第二列内容为%s,数据类型为%s'%(sheetcol(1),type(sheetcol(1))))print('第二行第二列的单元格内容为:',sheetcell_value(1,1))print('第三行第二列的单元格内容为:',sheetcell(2,1)value)print('第五行第三列的单元格内容为:',sheetrow(4)[2]value)print('第五行第三列的单元格内容为%s,数据类型为%s'%(sheetcol(2)[4]value,type(sheetcol(2)[4]value)))print('第五行第三列的单元格内容为%s,数据类型为%s'%(sheetcol(2)[4],type(sheetcol(2)[4])))# 执行结果# sheet页名称: ['Sheet1', 'Sheet2', 'Sheet3']# 该工作表有5行,3列# 第三行内容为: ['梨', 35, 1300]# 第二列内容为['单价/元', 80, 35, 45, 38],数据类型为<class 'list'># 第二列内容为[text:'单价/元', number:80, number:35, number:45, number:38],数据类型为<class 'list'># 第二行第二列的单元格内容为: 80# 第三行第二列的单元格内容为: 35# 第五行第三列的单元格内容为: 3000# 第五行第三列的单元格内容为3000,数据类型为<class 'float'># 第五行第三列的单元格内容为number:3000,数据类型为<class 'xlrdsheetCell'>

可以看出通过sheetrow(i)、sheetcol(i)也可获取行或列的内容,并且结果也是一个列表,但是列表中的每一项类似字典的键值对,形式为数据类型:值。

而sheetcell(0,0)获取单元格内容,结果是一个键值对,并且是一个xlrdsheetCell对象。

2xlwt写入excel文件

使用xlwt模块之前需要先导入import xlwt,xlwt模块只能写xls文件,不能写xlsx文件(写xlsx程序不会报错,但最后文件无法直接打开,会报错)。

创建工作簿 :book = xlwtWorkbook(),如果写入中文为乱码,可添加参数encoding = 'utf-8'

创建工作表 :sheet = bookadd_sheet('Sheet1')

向单元格写入内容 :sheetwrite(m,n,'内容1')、sheetwrite(x,y,'内容2')

保存工作簿 :booksave('excel文件名称'),默认保存在py文件相同路径下,如果该路径下有相同文件,会被新创建的文件覆盖,即xlwt不能修改文件。

import xlwt

book = xlwtWorkbook()

sheet = bookadd_sheet('Sheet1')

sheetwrite(0,0,'hello')

sheetwrite(1,0,'你好')

booksave('helloxls')

逐个单元格写入excel比较麻烦,可以按行或者列写入。

import xlwt

proj = ['名称','单价/元','库存/kg']

fruit = ['苹果','梨','香蕉','橘子']

price = [8,35,45,38]

storage = [150,130,100,300]

book = xlwtWorkbook()

sheet = bookadd_sheet('Sheet1')foriin range(0,len(proj)):

    sheetwrite(0,i,proj[i]) #按行插入行标题foriin range(0,len(fruit)):

    sheetwrite(i+1,0,fruit[i])#插入第一列水果名称foriin range(0,len(price)):

    sheetwrite(i+1,1,price[i])#插入第二列单价foriin range(0,len(storage)):

    sheetwrite(i+1,2,storage[i])#插入第三列库存booksave('fruit2xls')

二、openpyxl模块

openpyxl模块可实现对excel文件的读、写和修改,只能处理xlsx文件,不能处理xls文件,使用之前同样需要先安装该模块,再导入 import openpyxl。

对于openpyxl,行数和列数都从1开始,单元格的行和列也从1开始。例如sheetcell(1,2)value表示第一行第二列单元格的内容

1openpyxl读取excel文件

获取工作簿对象:book = openpyxlload_workbook('excel文件名称')

获取所有工作表名称:names = booksheetnames

获取工作表对象:sheet1 = bookworksheets[n]、sheet2 = book['工作表名称']、sheet3 = book[booksheetnames[n]]

获取工作表名称:title = sheet1title

获取工作表行数:rows = sheet1max_row

获取工作表列数:cols = sheet1max_column

获取某一单元格内容:cell = sheetcell(1,2)value、sheet['单元格']value例如sheet['B1']value

假设有一fruit2xlsx,除后缀名其他与上述fruitxls完全一样

import openpyxl

book = openpyxlload_workbook('fruit2xlsx')print('所有sheet页名称:',booksheetnames) 

sheet = bookworksheets[0]

sheet2 = book['Sheet1']

sheet3 = book[booksheetnames[0]]print('工作表名称:',sheet3title)

rows = sheetmax_row

cols = sheetmax_columnprint('该工作表有%d行,%d列'%(rows,cols))# 执行结果# 所有sheet页名称: ['Sheet1', 'Sheet2', 'Sheet3']# 工作表名称: Sheet1# 该工作表有5行,3列

2行和列生成器

对于xlrd模块来说,可直接通过sheetrow[i]和sheetcol[i]获取行和列的内容,但是对于openpyxl模块来说,无法直接获取某一行或列的内容,openpyxl模块的sheetrows和sheetcolumns表示行和列的生成器,即generator object,需要通过循环或转换成列表、元组的形式得到行或列的值。

print(sheetrows,sheetcolumns)forcolin sheetcolumns:

    print(col)forrowin sheetrows:

    foriin row:

        print(ivalue,end='')

    print()# 执行结果# <generator object Worksheet_cells_by_row at 0x00000230E011A2A0> <generator object Worksheet_cells_by_col at 0x00000230E102FC00># (<Cell 'Sheet1'A1>, <Cell 'Sheet1'A2>, <Cell 'Sheet1'A3>, <Cell 'Sheet1'A4>, <Cell 'Sheet1'A5>)# (<Cell 'Sheet1'B1>, <Cell 'Sheet1'B2>, <Cell 'Sheet1'B3>, <Cell 'Sheet1'B4>, <Cell 'Sheet1'B5>)# (<Cell 'Sheet1'C1>, <Cell 'Sheet1'C2>, <Cell 'Sheet1'C3>, <Cell 'Sheet1'C4>, <Cell 'Sheet1'C5>)# 名称  单价/元  库存/kg# 苹果  8  150# 梨  35  130# 香蕉  45  100# 橘子  38  300

如果要获取某一行或者列的内容,可将行、列生成器对象转换成列表或者元组,再循环列表或者元组得到内容。

前面说过openpyxl模块的行和列都从1开始,但是由于将生成器转化成了列表list(sheetrows),而列表的索引从0开始,因此list(sheetrows)[1]还是表示第二行的内容,不是第一行的内容。

foriinlist(sheetrows)[1]:

    print(ivalue,end='')print()foriin list(sheetcolumns)[0]:

    print(ivalue,end='')# 执行结果# 苹果  8  150# 名称  苹果  梨  香蕉  橘子

获取单元格的内容

print(sheetcell(1,2)value)#第一行第二列单元格的内容print(sheet['a2']value)#使用excel单元格的表示法,字母不区分大小写

3openpyxl写excel文件 

创建工作簿 :book = openpyxlWorkbook(),如果写入中文为乱码,可添加参数encoding = 'utf-8'

创建工作表: sheet = bookcreate_sheet('工作表名称',0),0表示创建的工作表在工作薄最前面

向单元格写入内容 :sheetcell(m,n,'内容1')、sheetcell(x,y,'内容2')

保存工作簿 :booksave('excel文件名称'),默认保存在py文件相同路径下,如果该路径下有相同文件,会被新创建的文件覆盖。

book = openpyxlWorkbook()

sheet = bookcreate_sheet('Sheet1',0)

proj = ['名称','单价/元','库存/kg']

fruit = ['苹果','香蕉','梨','橘子']

price = [8,35,45,38]

storage = [150,130,300,100]foriin range(len(proj)):

    sheetcell(1,i+1,proj[i])foriin range(len(fruit)):

    sheetcell(i+2,1,fruit[i])foriin range(len(price)):

    sheetcell(i+2,2,price[i])foriin range(len(storage)):

    sheetcell(i+2,3,storage[i])

booksave('fruit2xlsx')

4openpyxl修改excel文件

sheetinsert_rows(m)和sheetinsert_cols(n)分别表示在第m行、第n列前面插入行、列

sheetdelete_rows(m)和sheetdelete_cols(n)分别表示删除第m行、第n列

rows = sheetmax_row

sheetinsert_rows(rows+2)

cherry = ['樱桃',17,80]  forjin cherry:

    sheetcell(rows+1,cherryindex(j)+1,j)

booksave('fruit2xlsx')

修改单元格内容:sheetcell(m,n) = '内容1'或者sheet['B3'] = '内容2' 

sheetcell(3,2,4)

sheet['B3'] = 5booksave('fruit2xlsx')

在最后追加行:sheetappend(可迭代对象)

straberry = ['草莓',20,50]

sheetappend(straberry)

booksave('fruit2xlsx')

三、xlsxwriter 模块

只能 *** 作xlsx,只能写。在excel中插入

import matplotlibpyplot as plt

  2 import pandas as pd

  3 import random

  4 import xlsxwriter

  5

  6 ts = pdSeries(randomrandrange(10))

  7 fig = pltfigure()

  8 ax = figadd_subplot(1,1,1)

  9 tsplot(ax=ax)

10 figsavefig('foopng')

11

12 workbook = xlsxwriterWorkbook('pngxlsxlsx')    # 创建excel文件

13 worksheet1 = workbookadd_worksheet('png')  # 括号内为工作表表名

14 # 第一个参数是插入的起始单元格,第二个参数是你文件的绝对路径

15 worksheet1write('A1','hello')

16 worksheet1insert_image('B2','foopng')

18 workbookclose()

xlrd、xlwt和openpyxl处理excel文件,在写入文件的时候不如pandas简单,pandas处理excel文件见另外一篇博客 >

就是把xls or xlsx另存为CSV格式,然后再检索。代码如下

# -- coding: cp936 --

import linecache

o=open('d:\\test\\14csv')#文件路径

oseek(0)

r=oreadlines()

s1=str(input('输入要定位的信息:'))

a=0

count=0

for i in r:    #按和值组合查找

   if ifind(s1)>=0:

       print r[a-1]#显示上一行

       print i#显示定位行

       print r[a+1]#显示下一行

   a+=1

print 'Total:%d'%count

例:

在以下数据中,查找含有T的行,并显示上一行(n行) or 下一行(n行)    。

1,2,3,4

W,R,GFR,T

12,,F,34,G

这个就用上面的代码就行了。

以上就是关于怎么用python读取txt文件里指定行的内容,并导入excel全部的内容,包括:怎么用python读取txt文件里指定行的内容,并导入excel、python中怎么打开excel、怎么用python读取txt文件里指定行的内容,并导入excel等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/web/9580370.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-29
下一篇2023-04-29

发表评论

登录后才能评论

评论列表(0条)

    保存