ホームページ >バックエンド開発 >Python チュートリアル >Python はアップロードファイルの種類を決定します

Python はアップロードファイルの種類を決定します

高洛峰オリジナル: 2016-10-17 16:36:031700ブラウズ

アップロードサービスを開発する場合、多くの場合、アップロードされたファイルをフィルタリングする必要があります。

この記事では、ファイルヘッダーからファイルの種類を判断するための非常に実用的な Python メソッドを説明します。

コードは以下の通りです

import struct 
# 支持文件类型 
# 用16进制字符串的目的是可以知道文件头是多少字节 
# 各种文件头的长度不一样，少半2字符，长则8字符 
def typeList(): 
  return { 
    "52617221": EXT_RAR, 
    "504B0304": EXT_ZIP} 
  
# 字节码转16进制字符串 
def bytes2hex(bytes): 
  num = len(bytes) 
  hexstr = u"" 
  for i in range(num): 
    t = u"%x" % bytes[i] 
    if len(t) % 2: 
      hexstr += u"0" 
    hexstr += t 
  return hexstr.upper() 
  
# 获取文件类型 
def filetype(filename): 
  binfile = open(filename, &#39;rb&#39;) # 必需二制字读取 
  tl = typeList() 
  ftype = &#39;unknown&#39; 
  for hcode in tl.keys(): 
    numOfBytes = len(hcode) / 2 # 需要读多少字节 
    binfile.seek(0) # 每次读取都要回到文件头，不然会一直往后读取 
    hbytes = struct.unpack_from("B"*numOfBytes, binfile.read(numOfBytes)) # 一个 "B"表示一个字节 
    f_hcode = bytes2hex(hbytes) 
    if f_hcode == hcode: 
      ftype = tl[hcode] 
      break
  #不要忘记关闭打开的文件，避免出现异常
  binfile.close() 
  return ftype
  
if __name__ == &#39;__main__&#39;: 
  print filetype(&#39;pythontab.jpg&#39;)

一般的なファイル形式のファイルヘッダー

ファイル形式ファイルヘッダー(hex)

JPEG(jpg)FFD8FF

PNG(png)89504E47

GIF(gif)47494638

TIFF( tif) 49492A00

Windows ビットマップ (bmp) 424D

CAD (dwg) 41433130

Adobe Photoshop (psd) 38425053

リッチテキストフォーマット (rtf) 7B5C727466

XML (xml) 3C3F786D6C

HTML (html) 68746D6C3E

メール [完全のみ] (eml) 44656C69766572792D646174653A

Outlook Express (dbx) CFAD12FEC5FD746F

Outlook (pst) 2142444E

MS Word/Excel (xls.or.doc) D0CF11 0

MS アクセス (mdb) 5374616E64617264204A

声明：

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

前の記事：整数オブジェクトが Python で保存される場所を理解する次の記事：整数オブジェクトが Python で保存される場所を理解する

続きを見る

Python はアップロード ファイルの種類を決定します

関連記事

Python はアップロードファイルの種類を決定します