>백엔드 개발 >파이썬 튜토리얼 >Python을 사용하여 코드 통계 도구 설계

Python을 사용하여 코드 통계 도구 설계

不言
不言원래의
2018-04-04 16:57:571472검색

이 글에서는 파일 수, 코드 줄 수, 주석 줄 수, 빈 줄 수 등 Python을 사용하여 코드 통계 도구를 설계하는 것과 관련된 정보를 주로 소개합니다. 관심 있는 친구들은 Script House 편집자를 팔로우하여 살펴보세요

Question

파일 수, 코드 줄 수를 포함하여 프로젝트의 코드 줄 수를 계산하는 프로그램을 설계하세요. , 주석 줄 수, 빈 줄 수. 다양한 매개변수를 입력하여 다양한 언어로 프로젝트 수를 계산하여 디자인을 더욱 유연하게 만들어 보세요. 예:

# type用于指定文件类型
python counter.py --type python

출력:

files:10
code_lines:200
comments:100
blanks:20

분석

이것은 매우 간단해 보이지만 해결하기가 약간 복잡한 디자인 문제입니다. 파일의 코드 줄 수를 올바르게 계산할 수 있는 한 문제를 더 작게 만들 수 있습니다. , 디렉토리 수를 세는 것은 문제가 되지 않습니다. 그 중에서 가장 복잡한 것은 여러 줄 주석에 관한 것입니다. Python을 예로 들면, 주석 코드 줄은 다음과 같은 상황을 갖습니다.

1. 파운드 기호

# 한 줄 주석

2. 같은 줄에 여러 줄 주석 상황

"""여러 줄 주석입니다"""
'''이것도 여러 줄 주석입니다 '''
3. 여러 줄 주석 문자

"""
이 3줄은 모두 주석 문자입니다
"""

우리의 아이디어는 여러 줄 주석을 식별하기 위해 in_multi_comment에 추가 식별자가 필요하다는 것입니다. 현재 줄이 여러 줄 주석에 있는지 여부. 여러 줄 주석이 시작되면 다음 여러 줄 주석 문자에 도달하면 True로 설정됩니다. 여러 줄 주석의 시작 기호와 다음 끝 기호 사이의 코드는 주석 라인에 속해야 합니다.

지식

파일을 올바르게 읽는 방법, 파일을 읽을 때 문자열을 처리하는 일반적인 방법

간소화된 버전

단계별로 반복하고 먼저 단순화를 구현합니다. 이 버전의 프로그램 Python 코드의 단일 파일만 계산하고 여러 줄 주석은 고려하지 않습니다. 이는 Python을 처음 접하는 사람이라면 누구나 달성할 수 있는 기능입니다. 중요한 점은 각 줄을 읽은 후 먼저 Strip() 메서드를 사용하여 문자열 양쪽의 공백과 캐리지 리턴을 제거한다는 것입니다. 코드는 여러 줄 주석의 통계를 해결해야 합니다. 실제 코드 통계학자가 되십시오.

# -*- coding: utf-8 -*-
"""
只能统计单行注释的py文件
"""
def parse(path):
 comments = 0
 blanks = 0
 codes = 0
 with open(path, encoding='utf-8') as f:
 for line in f.readlines():
  line = line.strip()
  if line == "":
  blanks += 1
  elif line.startswith("#"):
  comments += 1
  else:
  codes += 1
 return {"comments": comments, "blanks": blanks, "codes": codes}
if __name__ == '__main__':
 print(parse("xxx.py"))

여러 줄 주석이 포함된 py 파일을 계산할 수 있습니다

# -*- coding: utf-8 -*-
"""

이 경우 여러 줄 주석 기호가 나타나면 이것이 핵심 작업입니다. in_multi_comment 식별자를 단순히 False 또는 True로 설정하는 대신 처음으로 """를 만나면 True이고 두 번째로 " ""를 만나면 여러 줄 주석의 끝 문자입니다. 부정은 False이고, 세 번째는 시작이고, 부정은 다시 True입니다.

그럼 다른 언어에서 구문 분석 기능을 다시 작성해야 하는지 확인하려면? 잘 관찰해보면 다줄 주석의 4가지 상황은 4가지 판단 조건을 추상화할 수 있는데, 대부분의 언어에는 한 줄 주석과 다줄 주석이 있지만 그 기호가 다르기 때문이다.

"""
def parse(path):
 in_multi_comment = False # 多行注释符标识符号
 comments = 0
 blanks = 0
 codes = 0
 with open(path, encoding="utf-8") as f:
 for line in f.readlines():
  line = line.strip()
  # 多行注释中的空行当做注释处理
  if line == "" and not in_multi_comment:
  blanks += 1
  # 注释有4种
  # 1. # 井号开头的单行注释
  # 2. 多行注释符在同一行的情况
  # 3. 多行注释符之间的行
  elif line.startswith("#") or \
    (line.startswith('"""') and line.endswith('"""') and len(line)) > 3 or \
   (line.startswith("'''") and line.endswith("'''") and len(line) > 3) or \
   (in_multi_comment and not (line.startswith('"""') or line.startswith("'''"))):
  comments += 1
  # 4. 多行注释符的开始行和结束行
  elif line.startswith('"""') or line.startswith("'''"):
  in_multi_comment = not in_multi_comment
  comments += 1
  else:
  codes += 1
 return {"comments": comments, "blanks": blanks, "codes": codes}
if __name__ == '__main__':
 print(parse("xxx.py"))

cond1에서 cond4에 해당하는 모든 언어의 한 줄 및 여러 줄 주석 기호를 표시하려면 하나의 구성 상수만 필요합니다. 남은 작업은 여러 파일을 구문 분석하는 것인데, 이는 os.walk 메서드를 사용하여 수행할 수 있습니다.

CONF = {"py": {"start_comment": ['"""', "'''"], "end_comment": ['"""', "'''"], "single": "#"},
 "java": {"start_comment": ["/*"], "end_comment": ["*/"], "single": "//"}}
start_comment = CONF.get(exstansion).get("start_comment")
end_comment = CONF.get(exstansion).get("end_comment")
cond2 = False
cond3 = False
cond4 = False
for index, item in enumerate(start_comment):
 cond2 = line.startswith(item) and line.endswith(end_comment[index]) and len(line) > len(item)
 if cond2:
 break
for item in end_comment:
 if line.startswith(item):
 cond3 = True
 break
for item in start_comment+end_comment:
 if line.startswith(item):
 cond4 = True
 break
if line == "" and not in_multi_comment:
 blanks += 1
# 注释有4种
# 1. # 井号开头的单行注释
# 2. 多行注释符在同一行的情况
# 3. 多行注释符之间的行
elif line.startswith(CONF.get(exstansion).get("single")) or cond2 or \
 (in_multi_comment and not cond3):
 comments += 1
# 4. 多行注释符分布在多行时,开始行和结束行
elif cond4:
 in_multi_comment = not in_multi_comment
 comments += 1
else:
 codes += 1

물론 이 프로그램을 완성하려면 명령줄 구문 분석과 지정된 매개변수를 기반으로 특정 언어만 구문 분석하는 등 아직 해야 할 일이 많습니다.

보충:

코드 줄 계산 도구의 Python 구현

우리는 종종 프로젝트의 코드 줄 수를 세고 싶지만, 더 완전한 계산 기능을 원한다면 그리 간단하지 않을 수도 있습니다. 오늘은 Python을 사용하여 코드라인 통계 도구를 구현하는 방법에 대해 살펴보겠습니다.

아이디어: 먼저 모든 파일을 가져온 다음 각 파일의 코드 줄 수를 계산하고 마지막으로 줄 수를 추가합니다.

구현된 기능:

줄 수 계산. 총 줄 수를 계산합니다. 통계 파일 형식 지정을 지원하고 계산하지 않으려는 파일 형식을 제외합니다.


빈 줄 제외

def counter(path):
 """
 可以统计目录或者某个文件
 :param path:
 :return:
 """
 if os.path.isdir(path):
 comments, blanks, codes = 0, 0, 0
 list_dirs = os.walk(path)
 for root, dirs, files in list_dirs:
  for f in files:
  file_path = os.path.join(root, f)
  stats = parse(file_path)
  comments += stats.get("comments")
  blanks += stats.get("blanks")
  codes += stats.get("codes")
 return {"comments": comments, "blanks": blanks, "codes": codes}
 else:
 return parse(path)



결과:


[root@pythontab 스크립트]# python countCodeLine.py

/root/script/test/gametest.php--- 16

/root/script/smtp.php ---- 284

/root/script/gametest.php ---- 16

/root/script/countCodeLine.py---- 33

/root/script/sendmail .php---- 17

/root /script/test/gametest.php---- 16
총 줄: 382

완료! 비용 시간: 0.00초

[root@pythontab script]#

만 계산됩니다 php, python 파일이 있어서 매우 편리합니다.

관련 권장 사항:

Python 디자인 계산기 기능 구현의 전체 예제 공유

Python 디자인 패턴 프로그래밍의 방문자 및 관찰자 패턴 예제 소개


위 내용은 Python을 사용하여 코드 통계 도구 설계의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.