XML, Java, penghuraian, pengaturcaraan, prestasi
1. Pilih penghurai yang betul
Pilih penghurai SAX, DOM atau StAX mengikut keperluan anda. Untuk penghuraian penstriman, SAX sesuai untuk akses rawak dan pengubahsuaian dokumen XML, DOM lebih sesuai dan StAX menyediakan api yang cekap dan berskala.
Kod sampel:
// 使用 SAX 解析器 XMLReader reader = XMLReaderFactory.createXMLReader(); reader.setContentHandler(new MySAXHandler()); reader.parse(new InputSource(new FileInputStream("file.xml"))); // 使用 DOM 解析器 DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); DocumentBuilder builder = factory.newDocumentBuilder(); Document document = builder.parse(new File("file.xml")); // 使用 StAX 解析器 XMLStreamReader reader = XMLInputFactory.newInstance().createXMLStreamReader(new FileInputStream("file.xml"));
2. Gunakan analisis penstriman untuk meningkatkan kecekapan
Untuk dokumen XML yang besar, penghuraian penstriman boleh meningkatkan kecekapan dengan ketara. Gunakan penghurai SAX untuk mengelakkan memuatkan keseluruhan dokumen ke dalam ingatan sekaligus.
3. Penilaian nod tertunda
Tangguhkan penilaian nod untuk optimumkanprestasi apabila menggunakan penghurai DOM. Elakkan memuatkan nod anak dengan serta-merta, aksesnya hanya apabila diperlukan.
4. Optimumkan perjalanan dokumen
Apabila melintasi dokumen menggunakan penghurai DOM, gunakan pertanyaan XPath atau DOMXPath untuk mengoptimumkan traversal. Ini lebih pantas daripada merentasi nod demi nod.
Kod sampel:
// 使用 XPath 查询 XPathFactory factory = XPathFactory.newInstance(); XPath xpath = factory.newXPath(); XPathExpression expr = xpath.compile("//books/book[@author="John Smith"]"); nodeList nodes = (NodeList) expr.evaluate(document, XPathConstants.NODESET); // 使用 DOMXPath 查询 NodeList nodes = document.getElementsByTagName("book"); for (int i = 0; i < nodes.getLength(); i++) { Node book = nodes.item(i); if (book.getAttributes().getNamedItem("author").getNodeValue().equals("John Smith")) { // ... } }
5. Hasil penghuraian cache
Jika anda perlu mengakses dokumen XML yang sama beberapa kali, sila cachehasil penghuraian untuk mengelakkan penghuraian berulang.
6. Sahkan dokumen XML
Gunakan Pengesah XML untuk mengesahkan dokumen XML bagi memastikan ia mematuhi skema atau DTD yang sepadan.
Kod sampel:
// 验证 XML 文档 SchemaFactory factory = SchemaFactory.newInstance(XMLConstants.W3C_XML_SCHEMA_NS_URI); Schema schema = factory.newSchema(new File("schema.xsd")); Validator validator = schema.newValidator(); validator.validate(new Source[]{new StreamSource(new File("file.xml"))});
7. Berurusan dengan ruang nama
Kendalikan ruang nama dalam dokumen XML dengan betul untuk mengelakkan konflik nama dan kehilangan data.
Kod sampel:
// 设置命名空间感知 XMLReader reader = XMLReaderFactory.createXMLReader(); reader.setFeature("Http://xml.org/sax/features/namespaces", true);
8. Memproses DTD
Jika dokumen XML menggunakan DTD, sila kendalikan pengisytiharan DTD dan resolusi entiti dengan betul.
Kod sampel:
// 设置 DTD 解析 XMLReader reader = XMLReaderFactory.createXMLReader(); reader.setFeature("http://xml.org/sax/features/validation", true); reader.setEntityResolver(new MyEntityResolver());
9. Menggunakan Java API untuk XML Binding (JAXB)
Untuk dokumen XML yang kompleks, gunakan JAXB untuk menjana kelas Java secara automatik dan memudahkan proses penghuraian dan pengikatan.
10. Optimumkan penggunaan memori
Apabila menghuraikan dokumen XML dalam Java, mengoptimumkan penggunaan memori adalah penting. Gunakan penghuraian penstriman, pemuatan nod malas dan caching untuk mengurangkan penggunaan memori.
Dengan mengikuti sepuluh prinsip ini, anda boleh menulis kod Java yang cekap, boleh diselenggara dan teguh yang berinteraksi dengan dokumen XML.
Atas ialah kandungan terperinci Sepuluh Perintah Pengaturcaraan Java untuk Menghuraikan Dokumen XML. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!