Rumah >pembangunan bahagian belakang >Tutorial Python >Adakah E-mel Pemasaran Anda Akan Berakhir dalam Spam? Kami Membina Alat untuk Mengetahui
Apabila menjalankan kempen pemasaran e-mel, salah satu cabaran terbesar ialah memastikan mesej anda sampai ke peti masuk dan bukannya folder spam.
Dalam siaran ini, kami akan membina alat yang boleh mengesahkan sama ada e-mel anda akan ditandakan sebagai spam dan sebab ia ditandakan sedemikian.
Alat ini akan berada dalam bentuk API dan digunakan dalam talian, supaya ia boleh disepadukan ke dalam aliran kerja anda.
Apache SpamAssassin ialah platform pengesanan spam sumber terbuka yang diselenggarakan oleh Apache Software Foundation, yang merupakan alat yang digunakan secara meluas untuk banyak klien e-mel dan alat penapisan e-mel untuk mengklasifikasikan mesej sebagai spam.
Ia menggunakan pelbagai peraturan, penapisan Bayesian dan ujian rangkaian untuk menetapkan "skor" spam kepada e-mel yang diberikan. Secara amnya, e-mel yang mendapat markah 5 atau ke atas berisiko tinggi dibenderakan sebagai spam.
Memandangkan Apache SpamAssassin ialah perisian pengesanan spam, ia juga boleh digunakan untuk mengetahui sama ada e-mel anda akan dibenderakan sebagai spam.
Pemarkahan SpamAssassin adalah telus dan didokumentasikan dengan baik, anda dengan yakin boleh menggunakannya untuk mengenal pasti dengan tepat aspek e-mel anda yang menyebabkan skor spam yang tinggi dan meningkatkan penulisan anda.
SpamAssassin direka untuk dijalankan pada sistem Linux. Anda memerlukan OS Linux atau mencipta bekas Docker untuk memasang dan menjalankannya.
Pada sistem Debian atau Ubuntu, pasang SpamAssassin dengan:
apt-get update && apt-get install -y spamassassin sa-update
Arahan sa-kemas kini memastikan bahawa peraturan SpamAssassin adalah terkini.
Setelah dipasang, anda boleh menghantar mesej e-mel ke alat baris arahan SpamAssassin. Outputnya termasuk versi e-mel beranotasi dengan skor spam dan menerangkan peraturan yang dicetuskan.
Penggunaan biasa mungkin kelihatan seperti ini:
spamassassin -t < input_email.txt > results.txt
results.txt kemudiannya akan mengandungi e-mel yang diproses dengan pengepala dan markah SpamAssassin, seperti di bawah:
X-Spam-Checker-Version: SpamAssassin 4.0.0 (2022-12-13) on 254.254.254.254 X-Spam-Level: X-Spam-Status: No, score=0.2 required=5.0 tests=HTML_MESSAGE, MIME_HTML_ONLY,MISSING_MID,NO_RECEIVED, NO_RELAYS autolearn=no autolearn_force=no version=4.0.0 // ... Content analysis details: (0.2 points, 5.0 required) pts rule name description ---- ---------------------- -------------------------------------------------- 0.1 MISSING_MID Missing Message-Id: header -0.0 NO_RECEIVED Informational: message has no Received headers -0.0 NO_RELAYS Informational: message was not relayed via SMTP 0.0 HTML_MESSAGE BODY: HTML included in message 0.1 MIME_HTML_ONLY BODY: Message only has text/html MIME parts
SpamAssassin mencapai potensi maksimumnya hanya apabila dikapsulkan sebagai API, kerana borang ini menjadikannya lebih fleksibel dan membolehkan penyepaduan ke dalam pelbagai aliran kerja.
Bayangkan ini: sebelum anda menekan "Hantar" pada e-mel anda, kandungan dihantar terlebih dahulu ke API SpamAssassin. Hanya jika ia menentukan bahawa e-mel tidak memenuhi kriteria spam, ia dibenarkan untuk diteruskan.
Mari buat API mudah yang menerima medan e-mel ini: subjek, html_body dan text_body. Ia akan menghantar medan kepada SpamAssassin dan mengembalikan hasil pengesahan.
from fastapi import FastAPI from datetime import datetime, timezone from email.utils import format_datetime from pydantic import BaseModel import subprocess def extract_analysis_details(text): lines = text.splitlines() start_index = None for i, line in enumerate(lines): if line.strip().startswith("pts rule"): start_index = i break if start_index is None: print("No content analysis details found.") return [] data_lines = lines[start_index+2:] parsed_lines = [] for line in data_lines: if line.strip() == "": break parsed_lines.append(line) results = [] current_entry = None split_line = lines[start_index+1] pts_split, rule_split, *rest = split_line.strip().split(" ") pts_start = 0 pts_end = pts_start + len(pts_split) rule_start = pts_end + 1 rule_end = rule_start + len(rule_split) desc_start = rule_end + 1 for line in parsed_lines: pts_str = line[pts_start:pts_end].strip() rule_name_str = line[rule_start:rule_end].strip() description_str = line[desc_start:].strip() if pts_str == "" and rule_name_str == "" and description_str: if current_entry: current_entry["description"] += " " + description_str else: current_entry = { "pts": pts_str, "rule_name": rule_name_str, "description": description_str } results.append(current_entry) return results app = FastAPI() class Email(BaseModel): subject: str html_body: str text_body: str @app.post("/spam_check") def spam_check(email: Email): # assemble the full email message = f"""From: example@example.com To: recipient@example.com Subject: {email.subject} Date: {format_datetime(datetime.now(timezone.utc))} MIME-Version: 1.0 Content-Type: multipart/alternative; boundary="__SPAM_ASSASSIN_BOUNDARY__" --__SPAM_ASSASSIN_BOUNDARY__ Content-Type: text/plain; charset="utf-8" {email.text_body} --__SPAM_ASSASSIN_BOUNDARY__ Content-Type: text/html; charset="utf-8" {email.html_body} --__SPAM_ASSASSIN_BOUNDARY__--""" # Run SpamAssassin and capture the output directly output = subprocess.run(["spamassassin", "-t"], input=message.encode('utf-8'), capture_output=True) output_str = output.stdout.decode('utf-8', errors='replace') details = extract_analysis_details(output_str) return {"result": details}
Dalam kod di atas, kami menentukan fungsi pembantu, extract_analysis_details, untuk mengekstrak hanya sebab pemarkahan daripada laporan hasil penuh. Anda boleh menambah baik lagi fungsi ini, contohnya, dengan menapis peraturan tertentu daripada hasilnya.
Respons akan mengandungi butiran analisis keputusan SpamAssassin.
Mari kita ambil input ini sebagai contoh:
subjek
apt-get update && apt-get install -y spamassassin sa-update
html_body
spamassassin -t < input_email.txt > results.txt
badan_teks
X-Spam-Checker-Version: SpamAssassin 4.0.0 (2022-12-13) on 254.254.254.254 X-Spam-Level: X-Spam-Status: No, score=0.2 required=5.0 tests=HTML_MESSAGE, MIME_HTML_ONLY,MISSING_MID,NO_RECEIVED, NO_RELAYS autolearn=no autolearn_force=no version=4.0.0 // ... Content analysis details: (0.2 points, 5.0 required) pts rule name description ---- ---------------------- -------------------------------------------------- 0.1 MISSING_MID Missing Message-Id: header -0.0 NO_RECEIVED Informational: message has no Received headers -0.0 NO_RELAYS Informational: message was not relayed via SMTP 0.0 HTML_MESSAGE BODY: HTML included in message 0.1 MIME_HTML_ONLY BODY: Message only has text/html MIME parts
Responsnya adalah seperti ini:
from fastapi import FastAPI from datetime import datetime, timezone from email.utils import format_datetime from pydantic import BaseModel import subprocess def extract_analysis_details(text): lines = text.splitlines() start_index = None for i, line in enumerate(lines): if line.strip().startswith("pts rule"): start_index = i break if start_index is None: print("No content analysis details found.") return [] data_lines = lines[start_index+2:] parsed_lines = [] for line in data_lines: if line.strip() == "": break parsed_lines.append(line) results = [] current_entry = None split_line = lines[start_index+1] pts_split, rule_split, *rest = split_line.strip().split(" ") pts_start = 0 pts_end = pts_start + len(pts_split) rule_start = pts_end + 1 rule_end = rule_start + len(rule_split) desc_start = rule_end + 1 for line in parsed_lines: pts_str = line[pts_start:pts_end].strip() rule_name_str = line[rule_start:rule_end].strip() description_str = line[desc_start:].strip() if pts_str == "" and rule_name_str == "" and description_str: if current_entry: current_entry["description"] += " " + description_str else: current_entry = { "pts": pts_str, "rule_name": rule_name_str, "description": description_str } results.append(current_entry) return results app = FastAPI() class Email(BaseModel): subject: str html_body: str text_body: str @app.post("/spam_check") def spam_check(email: Email): # assemble the full email message = f"""From: example@example.com To: recipient@example.com Subject: {email.subject} Date: {format_datetime(datetime.now(timezone.utc))} MIME-Version: 1.0 Content-Type: multipart/alternative; boundary="__SPAM_ASSASSIN_BOUNDARY__" --__SPAM_ASSASSIN_BOUNDARY__ Content-Type: text/plain; charset="utf-8" {email.text_body} --__SPAM_ASSASSIN_BOUNDARY__ Content-Type: text/html; charset="utf-8" {email.html_body} --__SPAM_ASSASSIN_BOUNDARY__--""" # Run SpamAssassin and capture the output directly output = subprocess.run(["spamassassin", "-t"], input=message.encode('utf-8'), capture_output=True) output_str = output.stdout.decode('utf-8', errors='replace') details = extract_analysis_details(output_str) return {"result": details}
Nampak? "Pemenang yang dihormati" dikesan kerana ia biasanya digunakan dalam e-mel spam.
Menjalankan SpamAssassin memerlukan persekitaran Linux dengan perisian dipasang. Secara tradisinya, anda mungkin memerlukan contoh EC2 atau titisan DigitalOcean untuk digunakan, yang boleh memakan kos dan membosankan, terutamanya jika penggunaan anda adalah volum rendah.
Bagi platform tanpa pelayan, mereka hanya tidak membenarkan anda memasang sebarang pakej sistem seperti SpamAssassin.
Leapcell boleh mengendalikan kerja ini dengan sempurna.
Dengan Leapcell, anda boleh menggunakan mana-mana pakej sistem seperti SpamAssassin, sementara itu mengekalkan perkhidmatan tanpa pelayan - anda hanya membayar untuk invokasi, yang biasanya lebih murah.
Menggunakan API pada Leapcell adalah sangat mudah. Anda tidak perlu menyediakan sebarang persekitaran. Hanya gunakan imej Python dan isi medan "Bina Perintah" dengan betul.
Setelah digunakan, anda akan mempunyai api untuk pengesahan spam. Setiap kali API digunakan, ia akan menjalankan SpamAssassin, menjaringkan e-mel dan mengembalikan skor.
Baca di blog kami
Atas ialah kandungan terperinci Adakah E-mel Pemasaran Anda Akan Berakhir dalam Spam? Kami Membina Alat untuk Mengetahui. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!