ホームページ >バックエンド開発 >Python チュートリアル >Python でコード統計ツールを実装する方法

Python でコード統計ツールを実装する方法

php中世界最好的语言
php中世界最好的语言オリジナル
2018-04-09 16:02:471515ブラウズ

今回は Python でコード統計ツールを実装する方法を説明します。 Python でコード統計ツールを実装する際の 注意事項 は何ですか? ここでは実際の事例を見てみましょう。

質問

ファイル数、コード行数、コメント行数、空白行数など、プロジェクト内のコード行数をカウントするプログラムを設計してください。さまざまな言語でプロジェクトをカウントするには、さまざまなパラメータを入力して、設計をより柔軟にしてください。たとえば、次のようになります。分析

これは単純に見えますが、解決するのが少し複雑な設計の問題です。ファイル内のコードの行数を正しく数えることができれば、ディレクトリを数えることはできます。最も複雑なのは複数行のコメントです。Python を例にとると、コメント コード行には次のような状況があります。

1. シャープ記号で始まる単一行のコメント

# 単一行のコメント

2. 同じ行に複数行のコメント

"" "これは複数行のコメントです"""'''これも複数行のコメントです'''3. """これらの 3 行はすべてコメント文字です

"""

私たちのアイデア 行ごとの解析を使用すると、複数行コメントには、現在の行が複数行コメント内にあるかどうかを識別する追加の識別子 in_multi_comment が必要ですデフォルトは False で、複数行のコメントが開始されると、次の複数行に遭遇すると True に設定されます。複数行コメントの開始記号と次の終了記号の間のコードは、コメント行に属している必要があります。

知識ポイント


正しい
ファイルの読み込み方

、読み込んだファイルを

文字列
として処理する場合の文字列の一般的な方法

簡易版

を繰り返していきますステップバイステップで、まず、Python コードの単一ファイルのみをカウントし、複数行のコメントを考慮しない簡易バージョンのプログラムを実装します。これは、Python を初めて使用する人でも実現できる機能です。重要な点は、各行を読み取った後に、strip() メソッドを使用して文字列の両側のスペースと改行を削除することです。実際のコード統計学者になるには、複数行のコメントの統計を解決する必要があります。

# type用于指定文件类型
python counter.py --type python
複数行のコメントを含む py ファイルをカウントできます

# -*- coding: utf-8 -*-
"""
只能统计单行注释的py文件
"""
def parse(path):
 comments = 0
 blanks = 0
 codes = 0
 with open(path, encoding='utf-8') as f:
 for line in f.readlines():
  line = line.strip()
  if line == "":
  blanks += 1
  elif line.startswith("#"):
  comments += 1
  else:
  codes += 1
 return {"comments": comments, "blanks": blanks, "codes": codes}
if name == 'main':
 print(parse("xxx.py"))

上の 4 番目のケースでは、複数行のコメント記号が発生した場合、in_multi_comment の重要な操作は、識別子を単に False または True に設定するのではなく、否定することです。初めて「"」に遭遇した場合、それは True です。2 回目に「"」に遭遇した場合、それは複数行コメントの終了文字であり、3 回目は否定となります。が始まり、否定は再び True になります。 では、他の言語で解析関数を書き直す必要があるかどうかを判断するには?よく観察すると、ほとんどの言語には単行コメントと複数行コメントがありますが、その記号が異なるため、複数行コメントの 4 つの状況は 4 つの判断条件を抽象化できます。

# -*- coding: utf-8 -*-
"""
cond1 から cond4 に対応する、すべての言語で単一行および複数行のコメントのシンボルをマークするために必要な設定定数は 1 つだけです。残りのタスクは複数のファイルを解析することです。これは os.walk メソッドを使用して実行できます。

"""
def parse(path):
 in_multi_comment = False # 多行注释符标识符号
 comments = 0
 blanks = 0
 codes = 0
 with open(path, encoding="utf-8") as f:
 for line in f.readlines():
  line = line.strip()
  # 多行注释中的空行当做注释处理
  if line == "" and not in_multi_comment:
  blanks += 1
  # 注释有4种
  # 1. # 井号开头的单行注释
  # 2. 多行注释符在同一行的情况
  # 3. 多行注释符之间的行
  elif line.startswith("#") or \
    (line.startswith('"""') and line.endswith('"""') and len(line)) > 3 or \
   (line.startswith("'''") and line.endswith("'''") and len(line) > 3) or \
   (in_multi_comment and not (line.startswith('"""') or line.startswith("'''"))):
  comments += 1
  # 4. 多行注释符的开始行和结束行
  elif line.startswith('"""') or line.startswith("'''"):
  in_multi_comment = not in_multi_comment
  comments += 1
  else:
  codes += 1
 return {"comments": comments, "blanks": blanks, "codes": codes}
if name == 'main':
 print(parse("xxx.py"))

もちろん、コマンド ラインの解析や、指定されたパラメーターに基づいて特定の言語のみを解析するなど、このプログラムを完成させるためにやるべきことはまだたくさんあります。 補足:

コード行数カウントツールのPython実装プロジェクト内のコードの行数をカウントしたいことがよくありますが、より完全なカウント機能が必要な場合は、それほど単純ではないかもしれません。今日は Python を使用してコードライン統計ツールを実装する方法について説明しましょう。

アイデア:

最初にすべてのファイルを取得し、次に各ファイルのコードの行数を数え、最後に行数を追加します。

実装された関数:

统计每个文件的行数;
统计总行数;
统计运行时间;
支持指定统计文件类型,排除不想统计的文件类型;
递归统计文件夹下包括子文件件下的文件的行数;

排除空行;

# coding=utf-8
import os
import time
basedir = '/root/script'
filelists = []
# 指定想要统计的文件类型
whitelist = ['php', 'py']
#遍历文件, 递归遍历文件夹中的所有
def getFile(basedir):
 global filelists
 for parent,dirnames,filenames in os.walk(basedir):
  #for dirname in dirnames:
  # getFile(os.path.join(parent,dirname)) #递归
  for filename in filenames:
   ext = filename.split('.')[-1]
   #只统计指定的文件类型,略过一些log和cache文件
   if ext in whitelist:
    filelists.append(os.path.join(parent,filename))
#统计一个文件的行数
def countLine(fname):
 count = 0
 for file_line in open(fname).xreadlines():
  if file_line != '' and file_line != '\n': #过滤掉空行
   count += 1
 print fname + '----' , count
 return count
if name == 'main' :
 startTime = time.clock()
 getFile(basedir)
 totalline = 0
 for filelist in filelists:
  totalline = totalline + countLine(filelist)
 print 'total lines:',totalline
 print 'Done! Cost Time: %0.2f second' % (time.clock() - startTime)

结果:

[root@pythontab script]# python countCodeLine.py
/root/script/test/gametest.php---- 16
/root/script/smtp.php---- 284
/root/script/gametest.php---- 16
/root/script/countCodeLine.py---- 33
/root/script/sendmail.php---- 17
/root/script/test/gametest.php---- 16
total lines: 382
Done! Cost Time: 0.00 second
[root@pythontab script]#

相信看了本文案例你已经掌握了方法,更多精彩请关注php中文网其它相关文章!

推荐阅读:

怎么对numpy里数组元素赋统一的值

numpy数组与矩阵的乘法怎么使用

以上がPython でコード統計ツールを実装する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。