suchen
HeimBackend-EntwicklungPython-TutorialErste Schritte mit Python Web Crawler: Die Grundlagen von Webseiten verstehen

    1. Der Aufbau einer Webseite

    Eine Webseite besteht hauptsächlich aus drei Teilen – HTML, CSS und JavaScript. Wenn eine Webseite mit einem menschlichen Gesicht verglichen wird, sind diese drei Teile wie menschliche Augen, Nase und Mund. Im Folgenden stellen wir diese drei Funktionen vor.

    HTML

    HTML (HyperText Markup Language) ist eine Auszeichnungssprache, die auf der standardmäßigen universellen Auszeichnungssprache basiert. Sie ersetzt HTML1.0 als Standard für die Webseitenproduktion wurden einige neue Elemente hinzugefügt, um die Leistungsfähigkeit der Webseite zu verbessern.

    HTML-Syntax umfasst Tags und Tag-Syntax, die zur Definition der Struktur, des Inhalts und des Stils von Webseiten verwendet werden. Ein HTML-Dokument enthält normalerweise ein Root-Tag und ein oder mehrere Tags. Jedes Tag verfügt über eine Kopfzeile, die den Typ, die Attribute und die Werte des Tags kennzeichnet.

    Das Root-Tag von HTML ist das Start-Tag des Dokuments, das den Titel des Dokuments und andere grundlegende Informationen wie Dokumenttyp, Sprache, Datum, Version usw. enthält.

    Darüber hinaus verfügt HTML auch über einige andere Elemente und Attribute, wie z. B. Titel, Absätze, Tabellen, Listen, Bilder, Links usw. Diese Elemente und Attribute können verwendet werden, um das Erscheinungsbild und Verhalten von Webseiten zu definieren.

    Zu den Vorteilen von HTML gehören Portabilität, plattformübergreifende und umfangreiche Inhalte. Es ist zur Standardsprache für die Webseitenerstellung geworden und wird häufig in Websites, E-Mails, Nachrichtenartikeln, Online-Chats und anderen Bereichen verwendet.

    CSS

    HTML definiert die Struktur einer Webseite, aber mit nur dem HTML-Seitenlayout sieht die Webseite nicht gut aus. Um die Webseite besser aussehen zu lassen, können Sie CSS verwenden, um dies zu erreichen.

    CSS (Cascading Style Sheets) ist eine Sprache zur Definition des Stils von Webseiten. Es handelt sich um eine Obermenge von HTML. CSS bietet mehr Stiloptionen und Definitionen, wodurch das Webdesign flexibler und einfacher zu warten ist.

    CSS-Syntax umfasst Selektoren, Attribute, Werte, Pseudoklassenselektoren usw. Der Selektor wird verwendet, um die zu formatierenden Elemente auszuwählen. Er kann basierend auf Klasse, ID, Platzhalter usw. ausgewählt werden. Attribute werden zum Definieren von Elementstilen verwendet, die basierend auf Klasse, ID, Platzhalter usw. definiert werden können. Der Wert kann ein einzelner Wert oder eine Zeichenfolge, eine Zahl oder ein anderer Werttyp sein. Pseudoklassenselektoren werden zur Definition von Klassenselektoren und ID-Selektoren verwendet. Sie können zur Definition von Pseudoklassenelementen und Pseudoklassenselektoren verwendet werden.

    Zu den Vorteilen von CSS gehören Wartbarkeit, Skalierbarkeit und Anpassbarkeit usw. Es macht das Webdesign flexibler und einfacher zu warten. Durch die Verwendung von CSS können Sie das Layout, den Stil und die Animationseffekte von Webseiten besser steuern und diese schöner und attraktiver gestalten.

    CSS3 ist die neueste Version von CSS, die einige neue Selektoren, Eigenschaften und Werte hinzufügt, um das Webdesign flexibler und umfangreicher zu machen. CSS3 fügt beispielsweise neue Pseudoklassenselektoren, Animationsselektoren, Übergangsselektoren usw. hinzu, wodurch das Webdesign lebendiger und interessanter wird.

    Wie sieht also CSS aus?

    #head {
        position: relative;
        height: 100%;
        width: 100%;
        min-height: 768px;
        cursor: default;
    }

    Dieser Code definiert ein Element mit dem Namen #head, dessen Stilattribute sind: Position: relative; Breite: 100 %; Cursor: Standard;

    Die Bedeutung dieser Attribute ist wie folgt:

    Position: relativ: Gibt an, dass die Positionierungsmethode des Elements eine relative Positionierung ist, dh das Element wird relativ zu seinem übergeordneten Element positioniert.
    height: 100 %: Gibt an, dass die Höhe des Elements 100 % der Höhe seines übergeordneten Elements beträgt.
    width: 100 %: Gibt an, dass die Breite des Elements 100 % der Breite seines übergeordneten Elements beträgt.
    min-height: 768px: Gibt an, dass die Mindesthöhe des Elements 768 Pixel beträgt, d. h. die Mindesthöhe des übergeordneten Elements beträgt 768 Pixel.
    cursor: Standard: Zeigt an, dass der Cursorstil des Elements der Standardwert ist, dh der Cursorstil ist nicht festgelegt.
    Mit der Kombination dieser Eigenschaften ist es möglich, ein Element mit relativer Positionierung, Höhe 100 %, Breite 100 % und einem Standard-Cursorstil zu definieren.

    JavaScript

    JavaScript (kurz „JS“) ist eine leichtgewichtige, interpretierte oder Just-in-Time-kompilierte Programmiersprache mit Funktionspriorität. Es wurde erstmals 1995 von Brendan Eich von Netscape entworfen und implementiert und wird häufig in Webbrowsern verwendet.

    Die Syntax von JavaScript basiert auf Prototypprogrammierung, einer dynamischen Skriptsprache mit mehreren Paradigmen, und unterstützt objektorientierte, imperative, deklarative und funktionale Programmierparadigmen. Sein Standard ist ECMAScript. Seit 2012 unterstützen alle Browser vollständig ECMAScript 5.1, und ältere Browser unterstützen mindestens den ECMAScript 3-Standard.

    Die grundlegende Syntax von JavaScript umfasst Variablen, Funktionen, Objekte, Arrays, Abschlüsse usw. Variablen werden zum Speichern von Daten, Funktionen zum Implementieren von Logik, Objekte zum Kapseln von Daten und Methoden, Arrays zum Speichern von Daten oder Objekten und Abschlüsse zum Überschreiben von Funktionen oder Methoden und zum Verwenden von Variablen darin verwendet.

    Zu den integrierten Objekten von JavaScript gehören Funktionen, Arrays, Objekte, Zeichenfolgen, reguläre Ausdrücke, Funktionen usw. Es unterstützt auch class und const in ES6 sowie die neuen let und const`. ES7 führte Syntax wie let, const und rest/spread ein.

    Der Bereichskettenmechanismus von JavaScript ermöglicht die sichere Ausführung von Code in verschiedenen Bereichen. Es unterstützt auch Ereignisverarbeitung, DOM-Operationen, Modularisierung und andere Funktionen. JavaScript wird häufig in Webbrowsern, mobilen Anwendungen, der Spieleentwicklung und anderen Bereichen verwendet.

    JavaScript通常是以单独文件加载的,后缀是.js。

    综上所述,HTML定义了网页的内容和结构,CSS描述了网页的样式,JavaScript定义了网页的行为。

    2.网页的结构

    下面我们看一个示例代码。

    <!DOCTYPE html>  
    <html>  
    <head>  
    <title>网页标题</title>  
    <meta charset="UTF-8">  
    <meta name="viewport" content="width=device-width, initial-scale=1.0">  
    <link rel="stylesheet" href="styles.css" rel="external nofollow" >  
    </head>  
    <body>  
    <header>  
    <nav>  
    <ul>  
    <li><a href="#" rel="external nofollow"  rel="external nofollow"  rel="external nofollow" >导航链接1</a></li>  
    <li><a href="#" rel="external nofollow"  rel="external nofollow"  rel="external nofollow" >导航链接2</a></li>  
    <li><a href="#" rel="external nofollow"  rel="external nofollow"  rel="external nofollow" >导航链接3</a></li>  
    </ul>  
    </nav>  
    </header>  
    <main>  
    <h2 id="网页标题">网页标题</h2>  
    <p>这是一个段落。</p>  
    <ul>  
    <li>列表项1</li>  
    <li>列表项2</li>  
    <li>列表项3</li>  
    </ul>  
    </main>  
    <footer>  
    <p>版权信息</p>  
    </footer>  
    </body>  
    </html>

    这个示例中, 声明了这是一个 HTML5 文档, 标签定义了文档的根元素,

    标签包含了文档的元数据,如标题、字符集、视口等。 标签定义了文档的标题,<meta charset="UTF-8"> 和 <meta name="viewport"> 标签定义了文档的字符集和视口。<link> 标签定义了文档的样式表,<nav> 标签定义了文档的导航链接,<ul> 标签定义了文档的列表项,<li> 标签定义了文档的列表项。<h2 id="标签定义了文档的标题"> 标签定义了文档的标题,</h2> <p> 标签定义了文档的段落。<footer> 标签定义了文档的版权信息。</footer></p> <p>这只是一个简单的示例,实际的HTML结构可能更加复杂。在编写网页时,需要根据具体的需求和目标,选择合适的HTML标签和样式表,并进行适当的排版和布局。</p> </li> </ul></nav>

    3.节点树和节点间的关系

    节点树(Node Tree)是一个树形数据结构,它通过节点的组合来表示数据,节点通过节点之间的关系来表示数据之间的层次结构。节点树可以用来实现各种数据的组织和管理,例如数据库中的表,文件系统中的文件,以及各种应用程序中的数据模型。

    节点间的关系通常通过以下方式表示:

    1. 树形结构:节点之间通过树形结构连接,节点的父节点通过右子节点连接,左子节点连接到根节点。

    2. 节点的层次结构:节点根据其父节点的层次结构来确定其位置。例如,一个节点的父节点是其子节点的父节点,其子节点是其左右子节点。

    3. 节点的继承关系:节点之间存在继承关系,即子节点继承其父节点的属性和关系。

    4. 节点的属性和关系:节点可以有属性和关系,属性用于描述节点的基本信息,例如名称、类型、值等。关系用于描述节点之间的关系,例如父子关系、层级关系等。

    5. 节点的遍历:节点树可以通过遍历来访问和修改节点的属性和关系。例如,可以通过递归遍历来查找节点的子节点和父节点,可以通过深度优先搜索遍历整个树。

    下面我们一个示意图,一目了然。

    Erste Schritte mit Python Web Crawler: Die Grundlagen von Webseiten verstehen

    4.选择器

    我们知道网页由一个个节点组成,CSs 选择器会根据不同的节点设置不同的样式规则,那么怎样来定位节点呢?

    在 Css 中,我们使用 CSS 选择器来定位节点。

    CSS选择器是用于在HTML文档中选择元素的语言。CSS选择器是一种用于选择HTML元素的语言,它可以用于创建样式表,并将样式应用于HTML元素。

    CSS选择器通常由一个或多个关键字组成,这些关键字用于指定选择器的类型。例如,div选择器用于选择所有具有div类的元素,a选择器用于选择所有具有a类的元素,img选择器用于选择所有具有img类的元素等。

    CSS选择器可以使用通配符来匹配多个类型的元素。例如,div, a, img可以匹配所有具有这些类型的元素。

    CSS选择器还可以使用伪类来创建更复杂的选择器。例如,:hover伪类用于在鼠标悬停在元素上时应用样式,:focus伪类用于在元素上聚焦时应用样式等。

    CSS选择器可以嵌套使用,以创建更复杂的选择器。例如,div:hover a可以选择所有具有a类的元素,div:focus a可以选择所有具有a类的元素,并在鼠标悬停和聚焦时应用样式。

    总之,CSS选择器是一种用于在HTML文档中选择元素的语言,它可以用于创建样式表,并将样式应用于HTML元素。

    Das obige ist der detaillierte Inhalt vonErste Schritte mit Python Web Crawler: Die Grundlagen von Webseiten verstehen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

    Stellungnahme
    Dieser Artikel ist reproduziert unter:亿速云. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen
    Python lernen: Ist 2 Stunden tägliches Studium ausreichend?Python lernen: Ist 2 Stunden tägliches Studium ausreichend?Apr 18, 2025 am 12:22 AM

    Ist es genug, um Python für zwei Stunden am Tag zu lernen? Es hängt von Ihren Zielen und Lernmethoden ab. 1) Entwickeln Sie einen klaren Lernplan, 2) Wählen Sie geeignete Lernressourcen und -methoden aus, 3) praktizieren und prüfen und konsolidieren Sie praktische Praxis und Überprüfung und konsolidieren Sie und Sie können die Grundkenntnisse und die erweiterten Funktionen von Python während dieser Zeit nach und nach beherrschen.

    Python für die Webentwicklung: SchlüsselanwendungenPython für die Webentwicklung: SchlüsselanwendungenApr 18, 2025 am 12:20 AM

    Zu den wichtigsten Anwendungen von Python in der Webentwicklung gehören die Verwendung von Django- und Flask -Frameworks, API -Entwicklung, Datenanalyse und Visualisierung, maschinelles Lernen und KI sowie Leistungsoptimierung. 1. Django und Flask Framework: Django eignet sich für die schnelle Entwicklung komplexer Anwendungen, und Flask eignet sich für kleine oder hochmobile Projekte. 2. API -Entwicklung: Verwenden Sie Flask oder Djangorestframework, um RESTFUFFUPI zu erstellen. 3. Datenanalyse und Visualisierung: Verwenden Sie Python, um Daten zu verarbeiten und über die Webschnittstelle anzuzeigen. 4. Maschinelles Lernen und KI: Python wird verwendet, um intelligente Webanwendungen zu erstellen. 5. Leistungsoptimierung: optimiert durch asynchrones Programmieren, Caching und Code

    Python vs. C: Erforschung von Leistung und Effizienz erforschenPython vs. C: Erforschung von Leistung und Effizienz erforschenApr 18, 2025 am 12:20 AM

    Python ist in der Entwicklungseffizienz besser als C, aber C ist in der Ausführungsleistung höher. 1. Pythons prägnante Syntax und reiche Bibliotheken verbessern die Entwicklungseffizienz. 2. Die Kompilierungsmerkmale von Compilation und die Hardwarekontrolle verbessern die Ausführungsleistung. Bei einer Auswahl müssen Sie die Entwicklungsgeschwindigkeit und die Ausführungseffizienz basierend auf den Projektanforderungen abwägen.

    Python in Aktion: Beispiele in realer WeltPython in Aktion: Beispiele in realer WeltApr 18, 2025 am 12:18 AM

    Zu den realen Anwendungen von Python gehören Datenanalysen, Webentwicklung, künstliche Intelligenz und Automatisierung. 1) In der Datenanalyse verwendet Python Pandas und Matplotlib, um Daten zu verarbeiten und zu visualisieren. 2) In der Webentwicklung vereinfachen Django und Flask Frameworks die Erstellung von Webanwendungen. 3) Auf dem Gebiet der künstlichen Intelligenz werden Tensorflow und Pytorch verwendet, um Modelle zu bauen und zu trainieren. 4) In Bezug auf die Automatisierung können Python -Skripte für Aufgaben wie das Kopieren von Dateien verwendet werden.

    Pythons Hauptnutzung: ein umfassender ÜberblickPythons Hauptnutzung: ein umfassender ÜberblickApr 18, 2025 am 12:18 AM

    Python wird häufig in den Bereichen Data Science, Web Development und Automation Scripting verwendet. 1) In der Datenwissenschaft vereinfacht Python die Datenverarbeitung und -analyse durch Bibliotheken wie Numpy und Pandas. 2) In der Webentwicklung ermöglichen die Django- und Flask -Frameworks Entwicklern, Anwendungen schnell zu erstellen. 3) In automatisierten Skripten machen Pythons Einfachheit und Standardbibliothek es ideal.

    Der Hauptzweck von Python: Flexibilität und BenutzerfreundlichkeitDer Hauptzweck von Python: Flexibilität und BenutzerfreundlichkeitApr 17, 2025 am 12:14 AM

    Die Flexibilität von Python spiegelt sich in Multi-Paradigm-Unterstützung und dynamischen Typsystemen wider, während eine einfache Syntax und eine reichhaltige Standardbibliothek stammt. 1. Flexibilität: Unterstützt objektorientierte, funktionale und prozedurale Programmierung und dynamische Typsysteme verbessern die Entwicklungseffizienz. 2. Benutzerfreundlichkeit: Die Grammatik liegt nahe an der natürlichen Sprache, die Standardbibliothek deckt eine breite Palette von Funktionen ab und vereinfacht den Entwicklungsprozess.

    Python: Die Kraft der vielseitigen ProgrammierungPython: Die Kraft der vielseitigen ProgrammierungApr 17, 2025 am 12:09 AM

    Python ist für seine Einfachheit und Kraft sehr beliebt, geeignet für alle Anforderungen von Anfängern bis hin zu fortgeschrittenen Entwicklern. Seine Vielseitigkeit spiegelt sich in: 1) leicht zu erlernen und benutzten, einfachen Syntax; 2) Reiche Bibliotheken und Frameworks wie Numpy, Pandas usw.; 3) plattformübergreifende Unterstützung, die auf einer Vielzahl von Betriebssystemen betrieben werden kann; 4) Geeignet für Skript- und Automatisierungsaufgaben zur Verbesserung der Arbeitseffizienz.

    Python in 2 Stunden am Tag lernen: Ein praktischer LeitfadenPython in 2 Stunden am Tag lernen: Ein praktischer LeitfadenApr 17, 2025 am 12:05 AM

    Ja, lernen Sie Python in zwei Stunden am Tag. 1. Entwickeln Sie einen angemessenen Studienplan, 2. Wählen Sie die richtigen Lernressourcen aus, 3. Konsolidieren Sie das durch die Praxis erlernte Wissen. Diese Schritte können Ihnen helfen, Python in kurzer Zeit zu meistern.

    See all articles

    Heiße KI -Werkzeuge

    Undresser.AI Undress

    Undresser.AI Undress

    KI-gestützte App zum Erstellen realistischer Aktfotos

    AI Clothes Remover

    AI Clothes Remover

    Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

    Undress AI Tool

    Undress AI Tool

    Ausziehbilder kostenlos

    Clothoff.io

    Clothoff.io

    KI-Kleiderentferner

    AI Hentai Generator

    AI Hentai Generator

    Erstellen Sie kostenlos Ai Hentai.

    Heißer Artikel

    R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
    1 Monate vorBy尊渡假赌尊渡假赌尊渡假赌
    R.E.P.O. Beste grafische Einstellungen
    1 Monate vorBy尊渡假赌尊渡假赌尊渡假赌
    Will R.E.P.O. Crossplay haben?
    1 Monate vorBy尊渡假赌尊渡假赌尊渡假赌

    Heiße Werkzeuge

    MinGW – Minimalistisches GNU für Windows

    MinGW – Minimalistisches GNU für Windows

    Dieses Projekt wird derzeit auf osdn.net/projects/mingw migriert. Sie können uns dort weiterhin folgen. MinGW: Eine native Windows-Portierung der GNU Compiler Collection (GCC), frei verteilbare Importbibliotheken und Header-Dateien zum Erstellen nativer Windows-Anwendungen, einschließlich Erweiterungen der MSVC-Laufzeit zur Unterstützung der C99-Funktionalität. Die gesamte MinGW-Software kann auf 64-Bit-Windows-Plattformen ausgeführt werden.

    DVWA

    DVWA

    Damn Vulnerable Web App (DVWA) ist eine PHP/MySQL-Webanwendung, die sehr anfällig ist. Seine Hauptziele bestehen darin, Sicherheitsexperten dabei zu helfen, ihre Fähigkeiten und Tools in einem rechtlichen Umfeld zu testen, Webentwicklern dabei zu helfen, den Prozess der Sicherung von Webanwendungen besser zu verstehen, und Lehrern/Schülern dabei zu helfen, in einer Unterrichtsumgebung Webanwendungen zu lehren/lernen Sicherheit. Das Ziel von DVWA besteht darin, einige der häufigsten Web-Schwachstellen über eine einfache und unkomplizierte Benutzeroberfläche mit unterschiedlichen Schwierigkeitsgraden zu üben. Bitte beachten Sie, dass diese Software

    SecLists

    SecLists

    SecLists ist der ultimative Begleiter für Sicherheitstester. Dabei handelt es sich um eine Sammlung verschiedener Arten von Listen, die häufig bei Sicherheitsbewertungen verwendet werden, an einem Ort. SecLists trägt dazu bei, Sicherheitstests effizienter und produktiver zu gestalten, indem es bequem alle Listen bereitstellt, die ein Sicherheitstester benötigen könnte. Zu den Listentypen gehören Benutzernamen, Passwörter, URLs, Fuzzing-Payloads, Muster für vertrauliche Daten, Web-Shells und mehr. Der Tester kann dieses Repository einfach auf einen neuen Testcomputer übertragen und hat dann Zugriff auf alle Arten von Listen, die er benötigt.

    SublimeText3 Mac-Version

    SublimeText3 Mac-Version

    Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

    Notepad++7.3.1

    Notepad++7.3.1

    Einfach zu bedienender und kostenloser Code-Editor