python模块详解 | filecmp

简介

filecmp是python内置的一个模块,用于比较文件及文件夹的内容,它是一个轻量级的工具,使用非常简单

两个主要的方法:

  • filecmp.cmp(f1, f2[, shallow])

    比较两个文件的内容是否匹配。参数f1, f2指定要比较的文件的路径。可选参数shallow指定比较文件时是否需要考虑文件本身的属性(通过os.stat函数可以获得文件属性)。如果文件内容匹配,函数返回True,否则返回False。

  • filecmp.cmpfiles(dir1, dir2, common[, shallow])

    比较两个文件夹内指定文件是否相等。S参数dir1, dir2指定要比较的文件夹,参数common指定要比较的文件名列表。函数返回包含3个list元素的元组,分别表示匹配、不匹配以及错误的文件列表。错误的文件指的是不存在的文件,或文件被琐定不可读,或没权限读文件,或者由于其他原因访问不了该文件。

Example:

>>> import filecmp
>>> filecmp.cmp('undoc.rst', 'undoc.rst')
True
>>> filecmp.cmp('undoc.rst', 'index.rst')
False

dircmp类:

filecmp模块中定义了一个dircmp类,用于比较文件夹,通过该类比较两个文件夹,可以获取一些详细的比较结果(如只在A文件夹存在的文件列表),并支持子文件夹的递归比较。

dircmp提供了三个方法用于报告比较的结果

  • report():只比较指定文件夹中的内容(文件与文件夹)
  • report_partial_closure():比较文件夹及第一级子文件夹的内容
  • report_full_closure():递归比较所有的文件夹的内容

dircmp还提供了下面这些属性用于获取比较的详细结果

  • left_list:左边文件夹中的文件与文件夹列表;  
  • right_list:右边文件夹中的文件与文件夹列表;
  • common:两边文件夹中都存在的文件或文件夹;
  • left_only:只在左边文件夹中存在的文件或文件夹;
  • right_only:只在右边文件夹中存在的文件或文件夹;
  • common_dirs:两边文件夹都存在的子文件夹;
  • common_files:两边文件夹都存在的子文件;
  • common_funny:两边文件夹都存在的子文件夹;
  • same_files:匹配的文件;
  • diff_files:不匹配的文件;
  • funny_files:两边文件夹中都存在,但无法比较的文件;
  • subdirs:我没看明白这个属性的意思,python手册中的解释如下:A dictionary mapping names in common_dirs to dircmp objects
mycomp=filecmp.dircmp(dir1,dir2)
#备份模式1、若dir1中有dir2中没有的文件,则继续执行
if len(mycomp.left_list) > 0:#dir1中的文件
        for file in mycomp.left_list:#dir1中的所有文件
            if not os.path.exists(dir2+file):#如dir2中不存在此文件,则
                shutil.copy(dir1+file,dir2+file)#复制dir1中的文件
                print('已备份|', dir2 + file)
#备份模式2、若dir1中的文件与dir2中的文件存在差异,则继续执行
for file in mycomp.common:#dir1、dir2中的相同文件
        about_update_files=[]
        if is_common(dir1+file,dir2+file) == False:
            about_update_files.append(file)
            print('待更新|',dir2+file)
            shutil.copy(dir1 + file, dir2 + file)  # 复制dir1中的文件
            print('已更新|', dir2 + file)
        else:print('无需更新|',dir2+file)

更多内容参考官方文档:https://docs.python.org/3.0/library/filecmp.html


1345 字