关于python:使用python统计指定目录下任意编程语言的代码行数

42次阅读

共计 863 个字符,预计需要花费 3 分钟才能阅读完成。

目标:统计指定目录下任意编程语言的代码行数。

代码:
# coding=utf-8
import os
import time
# 设定根目录
basedir = './'     #这种写法示意:与本文件在同一目录下的所有文件及文件夹中的多层文件
filelists = []
# 指定想要统计的文件类型
# whitelist = ['cpp', 'h']
whitelist = ['java', 'xml', 'yml', 'jsp', 'html']
#遍历文件, 递归遍历文件夹中的所有
def getFile(basedir):
    global filelists
    for parent,dirnames,filenames in os.walk(basedir):
        for filename in filenames:
            ext = filename.split('.')[-1]
            #只统计指定的文件类型,略过一些 log 和 cache 文件
            if ext in whitelist:
                filelists.append(os.path.join(parent,filename))
#统计一个的行数
def countLine(fname):
    count = 0
    # 把文件做二进制对待,read.
    for file_line in open(fname, 'rb').readlines():
        if file_line != ''and file_line !='\n': #过滤掉空行
            count += 1
    print (fname + '----' , count)
    return count
if __name__ == '__main__' :
    startTime = time.clock()
    getFile(basedir)
    totalline = 0
    for filelist in filelists:
        totalline = totalline + countLine(filelist)
    print ('total lines:',totalline)
    print ('Done! Cost Time: %0.2f second' % (time.clock() - startTime))

 

运行后果:

c 代码测试

Java 代码测试

 


参考:实验楼

正文完
 0