Maison >développement back-end >tutoriel php >PHP Master | Extraire des objets d'une base de données d'accès avec PHP, partie 2

PHP Master | Extraire des objets d'une base de données d'accès avec PHP, partie 2

William Shakespeare
William Shakespeareoriginal
2025-02-24 10:45:10303parcourir

Cet article montre comment extraire des fichiers PDF et d'image embarqués à partir de bases de données Microsoft Access héritées à l'aide de PHP. La partie 1 a couvert l'extraction d'objets emballés; Cette partie se concentre sur les PDF et les formats d'image communs (BMP, GIF, JPEG, PNG). Ces fichiers, bien que divers, partagent une structure de conteneur OLE commune: un en-tête et une bande-annonce de longueur variable. Nous tirons parti de cette structure pour l'extraction.

Concepts clés:

  • Extraction du PDF: Les fonctions de PHP strpos() et substr() ont identifié et extraire les PDF en identifiant les séquences hexadécimales %PDF (25504446) et %%EOF (2525454F46).
  • .
  • Extraction d'image (BMP, GIF, JPEG, PNG): Des techniques similaires sont utilisées, adaptant les délimiteurs de démarrage et de fin pour chaque type d'image.
  • Gestion des types OLE inconnus: Une nouvelle fonction, extractUnknown(), enregistre des objets OLE non identifiés pour une analyse ultérieure, améliorant la robustesse du script.
  • Instruction de commutation améliorée: L'instruction de commutation d'origine est améliorée pour gérer une gamme plus large de types d'objets OLE.

Extraction des documents Adobe Acrobat (PDFS)

La base de données de l'exemple contient un PDF dans l'enregistrement 13. L'inspection des octets initiaux du champ OLE révèle la présence du PDF mais manque de métadonnées comme le nom de fichier ou la taille. Cependant, les marqueurs cohérents %PDF et %%EOF dans tous les PDF permettent une extraction fiable. Le script PHP recherche ces séquences hexadécimales pour déterminer les points de début et de fin, permettant l'extraction en utilisant substr().

PHP Master | Extract Objects from an Access Database with PHP, Part 2

PHP Master | Extract Objects from an Access Database with PHP, Part 2

Gestion des autres types d'objets

Le script PHP amélioré comprend extractUnknown() pour gérer et enregistrer les types OLE inconnus (en utilisant l'ID enregistré comme nom de fichier) pour un examen ultérieur. Ceci est crucial pour identifier les images embarquées.

<code class="language-php"><?php
function extractUnknown($id, $data) {
    file_put_contents($id . ".txt", hex2bin($data));
}
?></code>

Extraction des types d'images populaires

L'identification du type d'image dans l'en-tête OLE varie en fonction des logiciels et associations de fichiers d'origine. La fonction extractUnknown() aide à cataloguer ces types. Nous nous concentrerons sur BMP, GIF, JPEG et PNG. GIF, JPEG et Extraction PNG reflètent la méthode PDF, ne changeant que les délimiteurs:

PHP Master | Extract Objects from an Access Database with PHP, Part 2

L'extraction BMP est légèrement différente. Le début est facilement trouvé (BM), mais l'extrémité nécessite de calculer la taille (de l'en-tête) et de la convertir au format Big-endian avant de l'utiliser pour extraire les données.

PHP Master | Extract Objects from an Access Database with PHP, Part 2

Script PHP complet (partiel)

Ce qui suit est un extrait du script PHP mis à jour. Les fonctions pour extraire GIF, JPEG et PNG sont omises par la concision mais suivent le même modèle que l'extraction PDF et BMP.

<code class="language-php"><?php
function extractUnknown($id, $data) {
    file_put_contents($id . ".txt", hex2bin($data));
}
?></code>

Le script complet et mis à jour (y compris les fonctions omises) est disponible sur GitHub (liens vers les branches de partie 1 et partie-2). Ce script amélioré offre une solution plus complète pour extraire divers types d'objets OLE à partir de bases de données d'accès. Cette série en deux parties fournit des outils précieux pour migrer loin des bases de données d'accès héritées.

(Section FAQS omise par la concision, mais pourrait être réécrite dans un style paraphrasé similaire au reste de la sortie.)

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn