f = open('1.txt','r',encoding='utf-8')
q = open('3.txt','a+',encoding='utf-8')
line1 = f.readlines()
for l in line1:
p = open('2.txt', 'r', encoding='utf-8')
line2 = p.readlines()
for ll in line2:
# print(ll)
if l.strip() in ll:
# print(ll)
# print(l)
#print(l.strip())
q.writelines(ll)
p.close()
f.close()
q.close()
用python实现关键字提取内容,用于初学者在这里先将关键字存放再文件中1.txt,需要读取的内容再2.txt中,最后提取出来的内容存放在3.txt中。代码如下:f = open('1.txt','r',encoding='utf-8')q = open('3.txt','a+',encoding='utf-8')line1 = f.readlines()for l in line...
问题描述:
如下图所示,有一个近2000
行
的数据表,需要把其中
含有
关键字
‘颈廓清术,中央组(VI组)’的数据所在
行
都都给抽取出来,且
提取
后的表格不能改变原先的顺序。
问题分析:
一开始想用excel的筛选功能,但是发现只提供单列筛选,由于关键词在P,S,V,Y,AB列都有,故需要筛选5次。但是筛选完后再整合再一起的表格顺序就乱了,而原先的表格排序规律不可知,无法通过简单的排序实现。于是决定用
Python
写个代码来解决这个问题~
python
生成的表格是这个样子滴^_^那些空白的
行
就是不符合要求的,我们还需要把这些空白的
行
给删掉~
方法很简单,使用excel的定位条件->空值->将所选
行
删
最近对由于研究图像,需要对对图像数据集的关键点定位文件
提取
某一
行
然后倒入到excel里头,每个关键点定位文件有五
行
,需要对很多类似文件进
行
提取
同一
行
重新写入到另一个txt里头,所以研究了很长时间写了一个脚本文件,在此记录一下。
如图假设我的result文件夹下有1521个txt文件
每个txt的文件
内容
是差不多的(我这里有五
行
,当然你的也可以大于5
行
)
def get_mml_for_keyword(sourepath, keywordpath, IsSort=True):
获取
含有
某个或某些
关键字
的
行
如:“RNCID=XXX”
sourepath:待处理的源数据
keywordpath:过滤条件或方法(
关键字
)
IsSort:是否排序,True:是,False:否
:return: result
在获取测试的一些数据时,需要对数据重新
提取
保存,因此记录。
原始
文本
样式:
2018-09-06 16:42 - INFO - Coordinate: [-285.444793701, 1958.66479492, 175.649078369], End of execution.
2018-09-06 16:43 - INFO - Coordinate: [-301.866485596, 195...
2.dstfilename函数实现某列关键词获取并去重
3keywordsdeal函数实现文件的写入生成
4main函数实现对keywordsdeal函数出栈,实现内存清空。避免
内容
重复写入
下面时所有 代码片。
// An highlighted block
import os
import xlwt
import xlrd
##目的文件夹
filename = 'D:\\MyDocs\\dst.xls'
##遍历函数
# def fil
可以使用
Python
的文件
读取
和字符串处理功能来实现。首先,打开txt文件并逐
行
读取
,然后使用字符串的split()方法将每
行
文本
按照空格或其他分隔符分割成单词列表。接着,使用
Python
的in
关键字
判断
关键字
是否在单词列表中出现,如果出现则将整
行
文本
输出。具体代码如下:
with open('file.txt', 'r') as f:
for line in f:
words = line.split()
if '
关键字
' in words:
print(line)
其中,'file.txt'为待处理的txt文件名,'
关键字
'为需要
提取
的
关键字
。执
行
以上代码后,程序会逐
行
读取
txt文件并输出包含
关键字
的整
行
文本
。