1200字范文,内容丰富有趣,写作的好帮手!
1200字范文 > Python查找文件夹下含有特定关键字的文档word 查找word中的关键词等

Python查找文件夹下含有特定关键字的文档word 查找word中的关键词等

时间:2021-04-11 21:36:09

相关推荐

Python查找文件夹下含有特定关键字的文档word 查找word中的关键词等

应用场景:我们学校搞综测会发放一个压缩包,里面含有各种活动的加分证明,想要快速且不遗漏的找到自己的名字的话,就可以来跑一下这个py啦!

环境:jupyter

要求:事先安装 pip install python-docx

代码修改处:文件存放根目录和要搜索的关键词

#coding=utf-8from docx import Documentimport os,sysdef search_word(filename,word):#打开文档document = Document(filename)#读取每段资料pa=document.paragraphs#拼接每一段的内容para_list = []for para in pa:para_list.append(para.text)#合并字符串file_text = ''.join(para_list)if word in file_text:print("find file for {}:".format(word))print(filename)process_list=[]def get_process_files(root_dir):"""process all files in directory"""cur_dir=os.path.abspath(root_dir)file_list=os.listdir(cur_dir)for file in file_list:fullfile=cur_dir+"\\"+fileif os.path.isfile(fullfile):process_list.append(fullfile)elif os.path.isdir(fullfile):dir_extra_list=get_process_files(fullfile)return process_listdef find_files(root_dir,word):get_process_files(root_dir)print("总计文件数:{}".format(len(process_list)))for files in process_list:search_word(files, word)returnif __name__=='__main__':#此处修改自己存放文件位置和名字#文件根目录root_dir=r'D:\beizhai\study\大四\综测\【】XX学院综测公示文件'#要搜索的关键字word="beizhai"count=0try:find_files(root_dir,word)except:pass

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。