node.js - Python有了asyncio和aiohttp在爬虫这类型IO任务中多线程/多进程还有存在的必要吗？

Question

最近正在学习Python中的异步编程，看了一些博客后做了一些小测验：对比asyncio+aiohttp的爬虫和asyncio+aiohttp+concurrent.futures(线程池/进程池)在效率中的差异，注释：在爬虫中我几乎没有使用任何计算性任务...

伊谢尔伦 · Answer

Python 크롤러에 대해 잘 모르지만 일반적으로 Scrapy는 뒤틀린 비동기 프레임워크를 기반으로 사용됩니다.

여러 프로세스는 다중 코어를 최대한 활용할 수 있습니다. 현재 이상적인 것은 다중 프로세스 + 코루틴입니다.

요청에는 여전히 동기 방식이 사용되기 때문에 스레드를 차단하게 됩니다. 이 경우에는 asyncio.sleep 메서드 대신 time.sleep 메서드를 사용하는 것으로 이해할 수 있습니다. 비동기.

伊谢尔伦 · Answer

이 기사를 확인하세요: http://aosabook.org/en/500L/a...

PHP中文网 · Answer

asyncio은 하나의 스레드에서 여러 비동기 작업을 처리하는 코루틴 아이디어를 채택했습니다. 타이밍, 비동기 IO 등 비동기 작업에는 무엇이 있나요?

그런데 작업이 비동기식을 지원하지 않으면 어떻게 되나요?

예를 들어 차단 IO를 읽고 쓰거나 시간이 많이 걸리는 많은 양의 계산을 수행합니다. 코루틴은 작업 차단 문제를 해결하고 멀티 프로세스와 멀티 스레드의 장점을 반영합니다.

둘의 사용 시나리오는 다릅니다. 다양한 시나리오, 다양한 계획.

PHP中文网 · Answer

asyncio에는 관련 타사 라이브러리 지원이 필요하므로 기본적으로 요청 및 http를 포함한 직렬 포트, 네트워크 프로토콜 등 모든 타사 라이브러리를 별도로 작성해야 하지만 좋은 경우에는 이후에 수행됩니다. 두 버전에서 사용된 많은 라이브러리는 비동기식이었습니다. 요청이 포함됩니다.

PHPz · Answer

asyncio를 지원하려면 비동기 API가 필요합니다(동기 비차단 API도 사용 가능하지만 Python에는 그런 기능이 없습니다 setInterval. 해킹해야 할 수도 있습니다).

동기식 차단 API의 경우 하나의 콜백이 중단되면 다른 콜백을 실행할 수 없습니다. 지금까지 본 IO API는 기본적으로 차단되어 있습니다.

黄舟 · Answer

Python 멀티스레딩은 GIL의 존재로 인해 실용적이지 않지만, 멀티프로세스는 여전히 매우 유용합니다

node.js - Python有了asyncio和aiohttp在爬虫这类型IO任务中多线程/多进程还有存在的必要吗？

代码

补充

모든 응답(6)나는 대답할 것이다