博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
cpg数据库处理_找到未提取的pdf
阅读量:6584 次
发布时间:2019-06-24

本文共 1332 字,大约阅读时间需要 4 分钟。

(博主亲自录制视频)

cpg数据库处理_找到未提取的pdf,存放于文件夹Chinese_undeal_pdfs

 

move_unextracted_pdfs.py

# -*- coding: utf-8 -*-"""Created on Sun Sep 18 17:06:15 2016@author: Administrator"""# -*- coding: utf-8 -*-"""Spyder EditorThis is a temporary script file."""import shutil,xlrdexcelFilename="unextracted.xlsx"sheetName="Sheet1"data = xlrd.open_workbook(excelFilename)table = data.sheets()[0] #总pdf列表totalpdfs_list=table.col_values(0)[1:]extractedpdfs_list=table.col_values(1)[1:]#已经提取的pdf文件列表extractedpdfs_list1=[i for i in extractedpdfs_list if i!=""]#未被提取的pdf文件列表unextractedPdfs_list=[i for i in totalpdfs_list if i not in extractedpdfs_list1]#移动失败的文件列表failed_files=[]#移动函数,目录里不匹配文件移入unmatching_file文件夹def RemoveFile():    dir="Chinese_undeal_pdfs"    for file in unextractedPdfs_list:        try:            shutil.move(file,dir)        except:            failed_files.append(file)            continueRemoveFile()

 

 

移动英语pdf文件

remove_englishFile.py
# -*- coding: utf-8 -*-"""Spyder Editorremove_englishFile.pyThis is a temporary script file."""import shutil,xlrdexcelFilename="be_cpg_English.xlsx"sheetName="Sheet1"data = xlrd.open_workbook(excelFilename)table = data.sheets()[0] EnglishFile_list=table.col_values(0)[1:]#移动函数,目录里不匹配文件移入unmatching_file文件夹def RemoveFile():    dir="English"    for file in EnglishFile_list:        shutil.move(file,dir)

 

转载地址:http://hzano.baihongyu.com/

你可能感兴趣的文章
pl/sql development 查询的数据复制到excel
查看>>
自定义指令的参数
查看>>
python实现进度条
查看>>
Android 一个应用启动另一个应用的说明
查看>>
阿里云CentOS7服务器利用LVM分区挂载磁盘全记录
查看>>
Setting up the Web Admin Tool in LDAP 6.x to communicate via SSL
查看>>
SQL好习惯:编写支持可搜索的SQL
查看>>
Shadowbox
查看>>
【 程 序 员 】:伤不起的三十岁,你还有多远 ?
查看>>
openldap安装
查看>>
[leetcode]count and say
查看>>
润乾报表 - 缓存问题
查看>>
利用IFormattable接口自动参数化Sql语句
查看>>
泛型Dictionary的用法详解
查看>>
明晰三种常见存储技术:DAS、SAN和NAS
查看>>
ContentProvider简单介绍
查看>>
Visual Studio 2014 CTPs 下载 和C# 6.0 语言预览版介绍
查看>>
js混淆 反混淆 在线
查看>>
WinForm 之 程序启动不显示主窗体
查看>>
FragmentTransaction.replace() 你不知道的坑
查看>>