찾다

 >  Q&A  >  본문

전환하다. 중첩된 테이블이 있는 html 로그. CSV 파일

<p>하나를 변환하려고 합니다. 중첩된 테이블이 있는 테이블 형식의 로그가 포함된 HTML 파일입니다. 으로 변환하고 있습니다. csv 파일. 열 중 하나에 오류 보고서가 있고 해당 열에 새 테이블이 있습니다. 전체 표를 일반 텍스트로 변환하고 싶습니다. 이를 달성하기 위해 Python에서 beautifulsoup를 사용해 보았지만 아직 운이 없습니다. 중첩 테이블의 데이터는 원래 열에 고정되지 않고 상위 테이블의 모든 열에 분산됩니다. 제가 할 수 있는 일이 있나요?<br /><br />Beautifulsoup 라이브러리와 함께 Python을 사용하면 원하는 결과가 나오지 않습니다</p><p><br /></ p>
P粉190883225P粉190883225529일 전539

모든 응답(1)나는 대답할 것이다

  • P粉662614213

    P粉6626142132023-08-02 10:42:21

    구조를 유지하면서 중첩된 테이블이 있는 HTML 파일을 CSV로 변환하는 것은 다소 어려울 수 있습니다. BeautifulSoup은 HTML 구문 분석을 위한 훌륭한 라이브러리이지만 중첩된 테이블을 적절하게 처리하려면 추가 작업이 필요할 수 있습니다.

    원하는 출력을 얻으려면 BeautifulSoup를 일부 사용자 정의 Python 코드와 함께 사용하여 HTML을 구문 분석하고 데이터를 추출한 후 CSV 형식으로 올바르게 구성할 수 있습니다. 이를 달성하는 데 도움이 되는 단계별 방법은 다음과 같습니다.

    BeautifulSoup을 사용하여 HTML 파일을 구문 분석하세요.


    1. 상위 테이블을 찾아 헤더를 추출합니다.
    2. 상위 테이블에서 모든 행을 찾습니다.
    3. 각 행에 대해 관련 열(존재하는 경우)에서 중첩 테이블을 찾습니다.
    4. 중첩 테이블에서 데이터를 추출하여 상위 테이블의 해당 셀에 추가합니다.

    다음은 시작하는 데 도움이 되는 Python 코드 조각입니다.

    으아악

    이 코드는 중첩된 테이블 데이터가 쉼표로 구분되어 있다고 가정합니다. 그렇지 않은 경우 그에 따라 구분 기호를 조정해야 할 수도 있습니다. 또한 중첩된 테이블에 쉼표가 포함된 경우 다른 구분 기호를 고려하세요.

    복잡한 HTML 구조를 처리하려면 추가 작업이 필요할 수 있습니다. 그럼에도 불구하고 데이터의 세부 사항에 따라 이 코드를 조정하면 작업을 처리하기 위한 좋은 출발점이 될 것입니다.


    회신하다
    0
  • 취소회신하다