찾다
백엔드 개발파이썬 튜토리얼Mobike 크롤러 분석 - API 찾기

Mobike 크롤러 분석 - API 찾기

Apr 04, 2017 am 10:37 AM
api모바이크

경고: 이 글은 학습 및 연구 참고용으로만 작성되었으므로 불법적인 목적으로 사용하지 마시기 바랍니다.

이전 기사 "Mobike 비공식 빅데이터 분석"에서 봄 축제 기간 동안 Mobike에 대한 데이터 분석을 언급한 바 있으며, 다음 기사 시리즈에서 이에 대해 자세히 설명하겠습니다. 이 데이터를 효율적으로?

모바이크 데이터를 크롤링하는 이유

모바이크는 청두에 입성한 최초의 공유자전거입니다. 매일 지하철역에서 내리면 수많은 자전거가 APP으로 보이는데, 걸어가다 보면 도착해서 보니 차가 없었습니다. 일부 차량은 어딘가에 숨겨져 있고, 일부 차량은 GPS 오류로 인해 찾을 수 없으며, 일부 차량은 자전거 이용자가 접근할 수 없도록 벽으로 분리된 주거 지역에 배치됩니다.

그렇다면 이 자전거들의 데이터를 얻어서 이 자전거들이 좀비 자전거가 되었는지 분석할 수 있는 방법이 있을까요? 누군가가 고의로 아무도 접근할 수 없도록 커뮤니티에 넣었나요?

이러한 질문을 계기로 저는 이 데이터를 어떻게 얻을 수 있는지 연구하기 시작했습니다.

데이터를 얻을 수 있는 곳

데이터를 볼 수 있다면 항상 자동으로 데이터를 얻을 수 있는 방법이 있습니다. 단지 데이터를 얻는 방법에 따라 데이터 획득의 효율성이 결정될 뿐입니다. Mobike의 데이터 분석 작업에서는 크롤러가 짧은 시간(보통 10분 정도)에 더 많은 데이터를 얻을 수 있어야 합니다. 그렇다면 데이터는 어디서 오는 걸까요?

가장 직접적인 소스는 Mobike APP입니다. 현대 소프트웨어 설계는 프런트엔드와 백엔드 분리에 중점을 두고 있으며 서버는 APP, 웹 페이지 등을 동시에 서비스합니다. 이러한 추세 속에서 우리는 소프트웨어의 HTTP 요청만 파악하면 됩니다. 일반적으로 다음 도구가 도움이 될 수 있습니다.

직접 패킷 캡처:

프록시를 사용하여 HTTP 요청 패킷을 캡처하고 디버그 :

  • Fiddler 4

  • Charles

  • 패킷 캡쳐(안드로이드)

내 폰이 루팅이 안되어 있어서 공유기에서 패킷 캡쳐에 간섭이 너무 심하고 https 사용도 쉽지 않네요. 따라서 Fiddler 또는 Charles를 먼저 사용해 볼 수 있습니다. Fiddler의 프록시를 끊은 다음 휴대폰에서 위치를 계속 이동하여 새로운 요청이 있는지 확인합니다. 그런데 아쉽게도 요청은 모두 에이맵 지도를 얻기 위한 것 뿐이고, 모바이크와 관련된 데이터는 없는 것 같습니다.

무슨 일이에요? 모바일 버전을 사용해 보세요. 패킷 캡처로 전환한 후 실제로 트래픽이 발생했으며 요청에서 가장 우려되는 항목을 발견했습니다:

Mobike 크롤러 분석 - API 찾기

4372317-de272f8395d2106f.png

API 요청은 언뜻 보기에 Postman에서 시도한 후에는 정보를 올바르게 반환할 수 있는 것 같습니다.

너무 이르다

며칠 연속으로 데이터를 올라와서 분석해보니 모바이크의 GPS가 계속 뛰는 것 같더라고요. 때때로 구타는 수 킬로미터의 거리를 초과하며 이는 분명히 정상적인 값이 아닙니다.

인터페이스가 조작되어 잘못된 데이터를 반환하는 것은 아닐까? APP에서도 자전거가 반환하는 데이터가 점프하는 것을 관찰했습니다. 어느 이른 아침부터 다음 날 아침까지, 나는 이것이 정말 사실인지 확인하기 위해 집 근처의 차들을 주기적으로 교체했습니다.

사진 찾을 수 없는데 관찰한 결과, APP에서 반환된 위치에 확실히 뭔가 문제가 있다는 결론을 내렸습니다. 아주 먼 곳에 자동차 한 대가 놓여 있었는데, 잠시 사라졌다가 나중에 다시 찾아왔는데, 제가 캡쳐한 데이터와 일치하더군요. 게다가 이 바운스는 휴대폰, 휴대폰 번호, 심지어 이동통신사와도 아무런 관련이 없습니다. 이는 이 바운스가 Mobike의 인터페이스에 문제가 있음을 보여줍니다. 이는 우리가 가끔 자동차를 보지만 실제로는 자동차가 없는 이유를 또 다른 측면에서 설명할 수도 있습니다. 거기 차.

이전 모먼츠에 올렸던 영상의 스크린샷입니다. 캠핑장 입구 근처에 뾰족한 곳이 보이는데 실제로는 거기에 GPS가 멈췄습니다. 트랙은 짧은 시간 동안 내부 신체가 가까이 이동하고 심지어 멀리 이동한 다음 해당 위치로 돌아오는 것을 보여줍니다.

Mobike 크롤러 분석 - API 찾기


이러한 데이터는 단순히 데이터 분석에 사용할 수 없어 포기할 뻔했습니다.

전환

위챗 미니 프로그램의 인기에 힘입어 모바이크도 곧바로 미니 프로그램을 출시했다. 나는 그것을 보고 웃었습니다. 예, 시도해 볼 만한 또 다른 데이터 소스를 제공했습니다. Packet Capture로 데이터를 한 번 캡처한 후에는 API를 쉽게 결정할 수 있습니다. 여기서는 구체적인 프로세스를 설명하지 않습니다. 크롤링을 한 후 2~3일간의 데이터를 크롤링해 보니 반전이 있었고, 그 데이터는 일반적인 자전거 궤적과 일치했습니다.

크롤러의 효율성을 높이는 일만 남았습니다.

다른 시도

가끔 API 입구를 찾기 위해 앱의 소스코드를 직접 분석하는 것이 매우 편리할 때가 있는데, 모바이크 안드로이드 앱을 디컴파일했는데 일부 리소스 파일을 제외하면, 유용했습니다. 다른 파일은 Qihoo 360의 obfuscator를 사용하여 압축했습니다. 포격 수행 방법을 분석한 기사가 인터넷에 있지만 공부할 시간이 많지 않으므로 잊어 버리십시오.

API 디자인에 대해서도 이야기하세요

Mobike의 API가 크롤링 및 분석하기 쉬운 이유는 주로 API 디자인이 너무 단순하기 때문입니다:

  • http 요청만 사용하므로 패킷 캡처 분석이 쉽습니다

  • 이러한 API는 요청을 암호화하지 않으므로 서비스 사용이 쉽습니다.

  • 그리고 위챗 미니프로그램도 유출된 API의 중요한 소스이기 때문에 결국 APP에서의 요청은 네이티브 코드를 통해 암호화된 후 전송될 수 있는 것 같습니다. 미니 프로그램에서는 그런 것이 없습니다.

관심이 있으시면 Xiaolan Bicycle APP의 요청을 살펴보세요. 그들은 https 요청을 사용하고 데이터 요청을 암호화하기가 어렵습니다. 많이 늘어날 것입니다.

물론, Mobike 관계자들이 데이터에 관심이 없다면 이런 API 설계도 괜찮을 것입니다.


위 내용은 Mobike 크롤러 분석 - API 찾기의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
파이썬 : 게임, Guis 등파이썬 : 게임, Guis 등Apr 13, 2025 am 12:14 AM

Python은 게임 및 GUI 개발에서 탁월합니다. 1) 게임 개발은 Pygame을 사용하여 드로잉, 오디오 및 기타 기능을 제공하며 2D 게임을 만드는 데 적합합니다. 2) GUI 개발은 Tkinter 또는 PYQT를 선택할 수 있습니다. Tkinter는 간단하고 사용하기 쉽고 PYQT는 풍부한 기능을 가지고 있으며 전문 개발에 적합합니다.

Python vs. C : 응용 및 사용 사례가 비교되었습니다Python vs. C : 응용 및 사용 사례가 비교되었습니다Apr 12, 2025 am 12:01 AM

Python은 데이터 과학, 웹 개발 및 자동화 작업에 적합한 반면 C는 시스템 프로그래밍, 게임 개발 및 임베디드 시스템에 적합합니다. Python은 단순성과 강력한 생태계로 유명하며 C는 고성능 및 기본 제어 기능으로 유명합니다.

2 시간의 파이썬 계획 : 현실적인 접근2 시간의 파이썬 계획 : 현실적인 접근Apr 11, 2025 am 12:04 AM

2 시간 이내에 Python의 기본 프로그래밍 개념과 기술을 배울 수 있습니다. 1. 변수 및 데이터 유형을 배우기, 2. 마스터 제어 흐름 (조건부 명세서 및 루프), 3. 기능의 정의 및 사용을 이해하십시오. 4. 간단한 예제 및 코드 스 니펫을 통해 Python 프로그래밍을 신속하게 시작하십시오.

파이썬 : 기본 응용 프로그램 탐색파이썬 : 기본 응용 프로그램 탐색Apr 10, 2025 am 09:41 AM

Python은 웹 개발, 데이터 과학, 기계 학습, 자동화 및 스크립팅 분야에서 널리 사용됩니다. 1) 웹 개발에서 Django 및 Flask 프레임 워크는 개발 프로세스를 단순화합니다. 2) 데이터 과학 및 기계 학습 분야에서 Numpy, Pandas, Scikit-Learn 및 Tensorflow 라이브러리는 강력한 지원을 제공합니다. 3) 자동화 및 스크립팅 측면에서 Python은 자동화 된 테스트 및 시스템 관리와 ​​같은 작업에 적합합니다.

2 시간 안에 얼마나 많은 파이썬을 배울 수 있습니까?2 시간 안에 얼마나 많은 파이썬을 배울 수 있습니까?Apr 09, 2025 pm 04:33 PM

2 시간 이내에 파이썬의 기본 사항을 배울 수 있습니다. 1. 변수 및 데이터 유형을 배우십시오. 이를 통해 간단한 파이썬 프로그램 작성을 시작하는 데 도움이됩니다.

10 시간 이내에 프로젝트 및 문제 중심 방법에서 컴퓨터 초보자 프로그래밍 기본 사항을 가르치는 방법?10 시간 이내에 프로젝트 및 문제 중심 방법에서 컴퓨터 초보자 프로그래밍 기본 사항을 가르치는 방법?Apr 02, 2025 am 07:18 AM

10 시간 이내에 컴퓨터 초보자 프로그래밍 기본 사항을 가르치는 방법은 무엇입니까? 컴퓨터 초보자에게 프로그래밍 지식을 가르치는 데 10 시간 밖에 걸리지 않는다면 무엇을 가르치기로 선택 하시겠습니까?

중간 독서를 위해 Fiddler를 사용할 때 브라우저에서 감지되는 것을 피하는 방법은 무엇입니까?중간 독서를 위해 Fiddler를 사용할 때 브라우저에서 감지되는 것을 피하는 방법은 무엇입니까?Apr 02, 2025 am 07:15 AM

Fiddlerevery Where를 사용할 때 Man-in-the-Middle Reading에 Fiddlereverywhere를 사용할 때 감지되는 방법 ...

Python 3.6에 피클 파일을로드 할 때 '__builtin__'모듈을 찾을 수없는 경우 어떻게해야합니까?Python 3.6에 피클 파일을로드 할 때 '__builtin__'모듈을 찾을 수없는 경우 어떻게해야합니까?Apr 02, 2025 am 07:12 AM

Python 3.6에 피클 파일로드 3.6 환경 보고서 오류 : modulenotfounderror : nomodulename ...

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
3 몇 주 전By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
3 몇 주 전By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
3 몇 주 전By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25 : Myrise에서 모든 것을 잠금 해제하는 방법
4 몇 주 전By尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

Atom Editor Mac 버전 다운로드

Atom Editor Mac 버전 다운로드

가장 인기 있는 오픈 소스 편집기

Eclipse용 SAP NetWeaver 서버 어댑터

Eclipse용 SAP NetWeaver 서버 어댑터

Eclipse를 SAP NetWeaver 애플리케이션 서버와 통합합니다.

PhpStorm 맥 버전

PhpStorm 맥 버전

최신(2018.2.1) 전문 PHP 통합 개발 도구

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

mPDF

mPDF

mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.