집 >백엔드 개발 >파이썬 튜토리얼 >Python을 사용하여 코드 통계 도구 설계

Python을 사용하여 코드 통계 도구 설계

不言원래의: 2018-04-04 16:57:571553검색

이 글에서는 파일 수, 코드 줄 수, 주석 줄 수, 빈 줄 수 등 Python을 사용하여 코드 통계 도구를 설계하는 것과 관련된 정보를 주로 소개합니다. 관심 있는 친구들은 Script House 편집자를 팔로우하여 살펴보세요

Question

파일 수, 코드 줄 수를 포함하여 프로젝트의 코드 줄 수를 계산하는 프로그램을 설계하세요. , 주석 줄 수, 빈 줄 수. 다양한 매개변수를 입력하여 다양한 언어로 프로젝트 수를 계산하여 디자인을 더욱 유연하게 만들어 보세요. 예:

# type用于指定文件类型
python counter.py --type python

출력:

files:10
code_lines:200
comments:100
blanks:20

분석

이것은 매우 간단해 보이지만 해결하기가 약간 복잡한 디자인 문제입니다. 파일의 코드 줄 수를 올바르게 계산할 수 있는 한 문제를 더 작게 만들 수 있습니다. , 디렉토리 수를 세는 것은 문제가 되지 않습니다. 그 중에서 가장 복잡한 것은 여러 줄 주석에 관한 것입니다. Python을 예로 들면, 주석 코드 줄은 다음과 같은 상황을 갖습니다.

1. 파운드 기호

# 한 줄 주석

2. 같은 줄에 여러 줄 주석 상황

"""여러 줄 주석입니다"""
'''이것도 여러 줄 주석입니다 '''
3. 여러 줄 주석 문자

"""
이 3줄은 모두 주석 문자입니다
"""

우리의 아이디어는 여러 줄 주석을 식별하기 위해 in_multi_comment에 추가 식별자가 필요하다는 것입니다. 현재 줄이 여러 줄 주석에 있는지 여부. 여러 줄 주석이 시작되면 다음 여러 줄 주석 문자에 도달하면 True로 설정됩니다. 여러 줄 주석의 시작 기호와 다음 끝 기호 사이의 코드는 주석 라인에 속해야 합니다.

지식

파일을 올바르게 읽는 방법, 파일을 읽을 때 문자열을 처리하는 일반적인 방법

간소화된 버전

단계별로 반복하고 먼저 단순화를 구현합니다. 이 버전의 프로그램 Python 코드의 단일 파일만 계산하고 여러 줄 주석은 고려하지 않습니다. 이는 Python을 처음 접하는 사람이라면 누구나 달성할 수 있는 기능입니다. 중요한 점은 각 줄을 읽은 후 먼저 Strip() 메서드를 사용하여 문자열 양쪽의 공백과 캐리지 리턴을 제거한다는 것입니다. 코드는 여러 줄 주석의 통계를 해결해야 합니다. 실제 코드 통계학자가 되십시오.

# -*- coding: utf-8 -*-
"""
只能统计单行注释的py文件
"""
def parse(path):
 comments = 0
 blanks = 0
 codes = 0
 with open(path, encoding=&#39;utf-8&#39;) as f:
 for line in f.readlines():
  line = line.strip()
  if line == "":
  blanks += 1
  elif line.startswith("#"):
  comments += 1
  else:
  codes += 1
 return {"comments": comments, "blanks": blanks, "codes": codes}
if __name__ == &#39;__main__&#39;:
 print(parse("xxx.py"))

여러 줄 주석이 포함된 py 파일을 계산할 수 있습니다

# -*- coding: utf-8 -*-
"""

이 경우 여러 줄 주석 기호가 나타나면 이것이 핵심 작업입니다. in_multi_comment 식별자를 단순히 False 또는 True로 설정하는 대신 처음으로 """를 만나면 True이고 두 번째로 " ""를 만나면 여러 줄 주석의 끝 문자입니다. 부정은 False이고, 세 번째는 시작이고, 부정은 다시 True입니다.

그럼 다른 언어에서 구문 분석 기능을 다시 작성해야 하는지 확인하려면? 잘 관찰해보면 다줄 주석의 4가지 상황은 4가지 판단 조건을 추상화할 수 있는데, 대부분의 언어에는 한 줄 주석과 다줄 주석이 있지만 그 기호가 다르기 때문이다.

"""
def parse(path):
 in_multi_comment = False # 多行注释符标识符号
 comments = 0
 blanks = 0
 codes = 0
 with open(path, encoding="utf-8") as f:
 for line in f.readlines():
  line = line.strip()
  # 多行注释中的空行当做注释处理
  if line == "" and not in_multi_comment:
  blanks += 1
  # 注释有4种
  # 1. # 井号开头的单行注释
  # 2. 多行注释符在同一行的情况
  # 3. 多行注释符之间的行
  elif line.startswith("#") or \
    (line.startswith(&#39;"""&#39;) and line.endswith(&#39;"""&#39;) and len(line)) > 3 or \
   (line.startswith("&#39;&#39;&#39;") and line.endswith("&#39;&#39;&#39;") and len(line) > 3) or \
   (in_multi_comment and not (line.startswith(&#39;"""&#39;) or line.startswith("&#39;&#39;&#39;"))):
  comments += 1
  # 4. 多行注释符的开始行和结束行
  elif line.startswith(&#39;"""&#39;) or line.startswith("&#39;&#39;&#39;"):
  in_multi_comment = not in_multi_comment
  comments += 1
  else:
  codes += 1
 return {"comments": comments, "blanks": blanks, "codes": codes}
if __name__ == &#39;__main__&#39;:
 print(parse("xxx.py"))

cond1에서 cond4에 해당하는 모든 언어의 한 줄 및 여러 줄 주석 기호를 표시하려면 하나의 구성 상수만 필요합니다. 남은 작업은 여러 파일을 구문 분석하는 것인데, 이는 os.walk 메서드를 사용하여 수행할 수 있습니다.

CONF = {"py": {"start_comment": [&#39;"""&#39;, "&#39;&#39;&#39;"], "end_comment": [&#39;"""&#39;, "&#39;&#39;&#39;"], "single": "#"},
 "java": {"start_comment": ["/*"], "end_comment": ["*/"], "single": "//"}}
start_comment = CONF.get(exstansion).get("start_comment")
end_comment = CONF.get(exstansion).get("end_comment")
cond2 = False
cond3 = False
cond4 = False
for index, item in enumerate(start_comment):
 cond2 = line.startswith(item) and line.endswith(end_comment[index]) and len(line) > len(item)
 if cond2:
 break
for item in end_comment:
 if line.startswith(item):
 cond3 = True
 break
for item in start_comment+end_comment:
 if line.startswith(item):
 cond4 = True
 break
if line == "" and not in_multi_comment:
 blanks += 1
# 注释有4种
# 1. # 井号开头的单行注释
# 2. 多行注释符在同一行的情况
# 3. 多行注释符之间的行
elif line.startswith(CONF.get(exstansion).get("single")) or cond2 or \
 (in_multi_comment and not cond3):
 comments += 1
# 4. 多行注释符分布在多行时，开始行和结束行
elif cond4:
 in_multi_comment = not in_multi_comment
 comments += 1
else:
 codes += 1

물론 이 프로그램을 완성하려면 명령줄 구문 분석과 지정된 매개변수를 기반으로 특정 언어만 구문 분석하는 등 아직 해야 할 일이 많습니다.

보충:

코드 줄 계산 도구의 Python 구현

우리는 종종 프로젝트의 코드 줄 수를 세고 싶지만, 더 완전한 계산 기능을 원한다면 그리 간단하지 않을 수도 있습니다. 오늘은 Python을 사용하여 코드라인 통계 도구를 구현하는 방법에 대해 살펴보겠습니다.

아이디어: 먼저 모든 파일을 가져온 다음 각 파일의 코드 줄 수를 계산하고 마지막으로 줄 수를 추가합니다.

구현된 기능:

줄 수 계산. 총 줄 수를 계산합니다. 통계 파일 형식 지정을 지원하고 계산하지 않으려는 파일 형식을 제외합니다.

빈 줄 제외

def counter(path):
 """
 可以统计目录或者某个文件
 :param path:
 :return:
 """
 if os.path.isdir(path):
 comments, blanks, codes = 0, 0, 0
 list_dirs = os.walk(path)
 for root, dirs, files in list_dirs:
  for f in files:
  file_path = os.path.join(root, f)
  stats = parse(file_path)
  comments += stats.get("comments")
  blanks += stats.get("blanks")
  codes += stats.get("codes")
 return {"comments": comments, "blanks": blanks, "codes": codes}
 else:
 return parse(path)

결과:

[root@pythontab 스크립트]# python countCodeLine.py

/root/script/test/gametest.php--- 16

/root/script/smtp.php ---- 284

/root/script/gametest.php ---- 16

/root/script/countCodeLine.py---- 33

/root/script/sendmail .php---- 17

/root /script/test/gametest.php---- 16
총 줄: 382

완료! 비용 시간: 0.00초

[root@pythontab script]#

만 계산됩니다 php, python 파일이 있어서 매우 편리합니다.

관련 권장 사항:

Python 디자인 계산기 기능 구현의 전체 예제 공유

Python 디자인 패턴 프로그래밍의 방문자 및 관찰자 패턴 예제 소개

위 내용은 Python을 사용하여 코드 통계 도구 설계의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명：

이전 기사：numpy에서 배열 요소의 균일 할당 예다음 기사：numpy에서 배열 요소의 균일 할당 예