기초 없이 자바 작성하고 바이두 홈페이지에서 먼저 Zhihu 크롤러 연습하기 (2)-java지도 시간-php.cn

집

Java

java지도 시간

기초 없이 자바 작성하고 바이두 홈페이지에서 먼저 Zhihu 크롤러 연습하기 (2)

黄舟

Dec 24, 2016 am 11:14 AM

아, 틀렸어요. 작은 예입니다.

  // 定义一个样式模板，此中使用正则表达式，括号中是要抓的内容
  // 相当于埋好了陷阱匹配的地方就会掉下去
  Pattern pattern = Pattern.compile("href=\"(.+?)\"");
  // 定义一个matcher用来做匹配
  Matcher matcher = pattern.matcher("＜a href=\"index.html\"＞我的主页＜/a＞");
  // 如果找到了
  if (matcher.find()) {
   // 打印出结果
   System.out.println(matcher.group(1));
  }

실행 결과:

index.html

예, 첫 번째 일반 코드입니다.

그러한 애플리케이션에서 사진을 가져오는 링크는 여러분의 손끝에 있어야 합니다.

정규 매칭을 함수로 캡슐화한 후 다음과 같이 코드를 수정합니다.

import java.io.*;
import java.net.*;
import java.util.regex.*;
public class Main {
 static String SendGet(String url) {
  // 定义一个字符串用来存储网页内容
  String result = "";
  // 定义一个缓冲字符输入流
  BufferedReader in = null;
  try {
   // 将string转成url对象
   URL realUrl = new URL(url);
   // 初始化一个链接到那个url的连接
   URLConnection connection = realUrl.openConnection();
   // 开始实际的连接
   connection.connect();
   // 初始化 BufferedReader输入流来读取URL的响应
   in = new BufferedReader(new InputStreamReader(
     connection.getInputStream()));
   // 用来临时存储抓取到的每一行的数据
   String line;
   while ((line = in.readLine()) != null) {
    // 遍历抓取到的每一行并将其存储到result里面
    result += line;
   }
  } catch (Exception e) {
   System.out.println("发送GET请求出现异常！" + e);
   e.printStackTrace();
  }
  // 使用finally来关闭输入流
  finally {
   try {
    if (in != null) {
     in.close();
    }
   } catch (Exception e2) {
    e2.printStackTrace();
   }
  }
  return result;
 }
 static String RegexString(String targetStr, String patternStr) {
  // 定义一个样式模板，此中使用正则表达式，括号中是要抓的内容
  // 相当于埋好了陷阱匹配的地方就会掉下去
  Pattern pattern = Pattern.compile(patternStr);
  // 定义一个matcher用来做匹配
  Matcher matcher = pattern.matcher(targetStr);
  // 如果找到了
  if (matcher.find()) {
   // 打印出结果
   return matcher.group(1);
  }
  return "";
 }
 public static void main(String[] args) {
  // 定义即将访问的链接
  String url = "http://www.baidu.com";
  // 访问链接并获取页面内容
  String result = SendGet(url);
  // 使用正则匹配图片的src内容
  String imgSrc = RegexString(result, "即将的正则语法");
  // 打印结果
  System.out.println(imgSrc);
 }
}

자, 이제 모든 것이 준비되었습니다. 정규 문법 하나만 남았습니다!

그럼 어떤 정규 진술이 더 적절할까요?

src="xxxxxx" 문자열만 잡으면 전체 src 링크를 잡을 수 있다는 사실을 발견했습니다.

간단한 일반 문: src="(.+?) "

위 내용은 기본 지식이 전혀 없는 상태에서 Java Zhihu 크롤러를 작성하고 바이두 홈페이지에서 실습해 본 내용입니다(2). 더 많은 관련 내용은 주의하시기 바랍니다. PHP 중국어 홈페이지(www.php .cn)!

성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

관련 기사

플랫폼 독립성을 위해 기본 코드를 통해 바이트 코드를 사용하는 장점은 무엇입니까?Apr 30, 2025 am 12:24 AM

Bytecodeachievesplatformincendence는 executedbirtualmachine (vm)을 beenecutedbyavirtmachine (vm)을 허용합니다

Java는 진정으로 100% 플랫폼 독립적입니까? 왜 또는 왜 그렇지 않습니까?Apr 30, 2025 am 12:18 AM

Java는 100% 플랫폼 독립성을 달성 할 수 없지만 플랫폼 독립성은 JVM 및 바이트 코드를 통해 구현되어 코드가 다른 플랫폼에서 실행되도록합니다. 특정 구현에는 다음이 포함됩니다. 1. 바이트 코드로의 컴파일; 2. JVM의 해석 및 실행; 3. 표준 라이브러리의 일관성. 그러나 JVM 구현 차이, 운영 체제 및 하드웨어 차이, 타사 라이브러리의 호환성은 플랫폼 독립성에 영향을 줄 수 있습니다.

Java의 플랫폼 독립성은 코드 유지 가능성을 어떻게 지원합니까?Apr 30, 2025 am 12:15 AM

Java는 "Writ 2. 유지 보수 비용이 낮 으면 하나의 수정 만 필요합니다. 3. 높은 팀 협업 효율성은 높고 지식 공유에 편리합니다.

새로운 플랫폼을 위해 JVM을 만드는 데 어떤 어려움이 있습니까?Apr 30, 2025 am 12:15 AM

새로운 플랫폼에서 JVM을 만드는 주요 과제에는 하드웨어 호환성, 운영 체제 호환성 및 성능 최적화가 포함됩니다. 1. 하드웨어 호환성 : JVM이 RISC-V와 같은 새로운 플랫폼의 프로세서 명령어 세트를 올바르게 사용할 수 있도록해야합니다. 2. 운영 체제 호환성 : JVM은 Linux와 같은 새로운 플랫폼의 시스템 API를 올바르게 호출해야합니다. 3. 성능 최적화 : 성능 테스트 및 튜닝이 필요하며 쓰레기 수집 전략은 새로운 플랫폼의 메모리 특성에 적응하도록 조정됩니다.

Javafx 라이브러리는 GUI 개발에서 플랫폼 불일치를 어떻게 해결하려고 시도합니까?Apr 30, 2025 am 12:01 AM

javafxeffecticallydressessplatforminconsistenciesinguedevelopment는 aplatform-agnosticscenegraphandcsstyling을 사용하여 development.1) itabstractsplatformspecificsthroughascenegraph, csstyling allowsforfine-tunin을 보장합니다

JVM이 Java 코드와 기본 운영 체제 사이의 중개자 역할을하는 방법을 설명하십시오.Apr 29, 2025 am 12:23 AM

JVM은 Java 코드를 기계 코드로 변환하고 리소스를 관리하여 작동합니다. 1) 클래스로드 : .class 파일을 메모리에로드하십시오. 2) 런타임 데이터 영역 : 메모리 영역 관리. 3) 실행 엔진 : 해석 또는 컴파일 바이트 코드. 4) 로컬 메소드 인터페이스 : JNI를 통해 운영 체제와 상호 작용합니다.

Java의 플랫폼 독립성에서 JVM (Java Virtual Machine)의 역할을 설명하십시오.Apr 29, 2025 am 12:21 AM

JVM을 통해 Java는 플랫폼을 가로 질러 실행할 수 있습니다. 1) JVM 하중, 검증 및 바이트 코드를 실행합니다. 2) JVM의 작업에는 클래스 로딩, 바이트 코드 검증, 해석 실행 및 메모리 관리가 포함됩니다. 3) JVM은 동적 클래스 로딩 및 반사와 같은 고급 기능을 지원합니다.

Java 응용 프로그램이 다른 운영 체제에서 올바르게 실행되도록하는 데 어떤 조치를 취 하시겠습니까?Apr 29, 2025 am 12:11 AM

Java 응용 프로그램은 다음 단계를 통해 다른 운영 체제에서 실행할 수 있습니다. 1) 파일 또는 경로 클래스를 사용하여 파일 경로를 처리합니다. 2) system.getenv ()를 통해 환경 변수를 설정하고 얻습니다. 3) Maven 또는 Gradle을 사용하여 종속성 및 테스트를 관리하십시오. Java의 크로스 플랫폼 기능은 JVM의 추상화 계층에 의존하지만 여전히 특정 운영 체제 별 기능의 수동 처리가 필요합니다.

See all articles