非同期コルーチン開発の実践: 大きなファイルのアップロードおよびダウンロードの速度の最適化-PHPチュートリアル-php.cn

ホームページ

バックエンド開発

PHPチュートリアル

非同期コルーチン開発の実践: 大きなファイルのアップロードおよびダウンロードの速度の最適化

PHPz

Dec 17, 2023 pm 12:50 PM

コルーチン非同期プログラミングアップロードとダウンロードの最適化

非同期コルーチン開発の実践: 大きなファイルのアップロードおよびダウンロードの速度の最適化

インターネットの発展と普及に伴い、ファイルの送信が標準になりました。しかし、転送されるファイルがますます大きくなると、従来のファイルのアップロードおよびダウンロード方法では多くの困難に直面するようになります。大きなファイルの転送速度を最適化し、ユーザーエクスペリエンスを向上させるために、非同期コルーチンを通じて実装できます。この記事では、非同期コルーチンテクノロジを使用して大きなファイルのアップロードおよびダウンロードの速度を最適化する方法を共有し、具体的なコード例を示します。

1. 非同期コルーチンテクノロジの概要

非同期コルーチンは本質的にプログラミングモデルです。その特徴は、ブロッキングが発生した場合、現在のスレッドの制御を即座に解放し、他のタスクに制御を渡して実行を継続し、ブロッキングが終了するまで待ってから実行に戻ることで、より良い結果を得るために複数のタスク間の切り替えを実現することです。 . 効率的な処理効果。

一般的な非同期コルーチンテクノロジには、Python の asyncio、Node.js の Callback および Promise などが含まれます。言語やテクノロジが異なれば実装方法も異なりますが、基本的にはすべて、コンピュータリソースをより有効に活用して同時実行性と処理効率を向上させるように設計されています。

2. 大きなファイルのアップロード速度を最適化する

チャンクアップロードを使用する

大きなファイルをアップロードする場合は、ファイル全体を一度にサーバーに転送しますこれにより、必然的にネットワークの混雑と通信速度の低下が発生します。この問題を回避するには、大きなファイルを複数のチャンクに分けてアップロードすることができます。各チャンクは独立したデータパケットであり、並行してアップロードすることでアップロードを高速化できます。

非同期コルーチンテクノロジを使用すると、ブロックアップロードを簡単に実装し、複数のデータブロックを並行して送信して、より効率的なアップロード操作を実現できます。以下は具体的なコードの実装です。

import aiohttp
import asyncio

async def upload_chunk(session, url, file, offset, size):
    headers = {'Content-Length': str(size), 'Content-Range': f'bytes {offset}-{offset+size-1}/{file_size}'}
    data = file.read(size)
    async with session.put(url, headers=headers, data=data) as resp:
        return await resp.json()

async def upload_file_with_chunks(session, url, file):
    file_size = os.path.getsize(file.name)
    chunk_size = 1024 * 1024 * 5 #每块数据的大小为5MB
    offset = 0
    tasks = []
    while offset < file_size:
        size = chunk_size if offset+chunk_size < file_size else file_size-offset
        tasks.append(upload_chunk(session, url, file, offset, size))
        offset += size
    return await asyncio.gather(*tasks)

async def main():
    async with aiohttp.ClientSession() as session:
        url = 'http://example.com/upload'
        file = open('large_file.mp4', 'rb')
        result = await upload_file_with_chunks(session, url, file)
        print(result)

asyncio.run(main())

このコードでは、ファイル全体をサイズ 5MB のデータブロックに分割し、asyncio.gather() メソッドを使用して各データをアップロードするタスクを同時に実行します。ブロックしてアップロードを高速化します。チャンクアップロードの考え方はファイルのダウンロードにも当てはまりますので、詳しくは次のセクションをご覧ください。

マルチスレッドアップロード

マルチスレッドアップロードの使用に加えて、マルチスレッドを使用して大きなファイルをアップロードすることもできます。マルチスレッドを使用すると、コンピュータのマルチコアリソースを最大限に活用できるため、ファイルのアップロードが高速化されます。以下は具体的なコードの実装です。

import threading
import requests

class MultiPartUpload(object):
    def __init__(self, url, file_path, num_thread=4):
        self.url = url
        self.file_path = file_path
        self.num_thread = num_thread
        self.file_size = os.path.getsize(self.file_path)
        self.chunk_size = self.file_size//num_thread
        self.threads = []
        self.lock = threading.Lock()

    def upload(self, i):
        start = i * self.chunk_size
        end = start + self.chunk_size - 1
        headers = {"Content-Range": "bytes %s-%s/%s" % (start, end, self.file_size),
                   "Content-Length": str(self.chunk_size)}
        data = open(self.file_path, 'rb')
        data.seek(start)
        resp = requests.put(self.url, headers=headers, data=data.read(self.chunk_size))
        self.lock.acquire()
        print("Part %d status: %s" % (i, resp.status_code))
        self.lock.release()

    def run(self):
        for i in range(self.num_thread):
            t = threading.Thread(target=self.upload, args=(i,))
            self.threads.append(t)
        for t in self.threads:
            t.start()

        for t in self.threads:
            t.join()

if __name__ == '__main__':
    url = 'http://example.com/upload'
    file = 'large_file.mp4'
    uploader = MultiPartUpload(url, file)
    uploader.run()

このコードでは、Python 標準ライブラリの threading モジュールを使用してマルチスレッドアップロードを実装します。ファイル全体を複数のデータブロックに分割し、各スレッドがブロックの 1 つをアップロードする責任を負うため、同時アップロードが実現します。ロックメカニズムを使用して、同時アップロード中のスレッドの安全性を保護します。

3. 大きなファイルのダウンロード速度の最適化

アップロードに加えて、大きなファイルのダウンロードも非常に一般的な要件であり、最適化は非同期コルーチンによっても実現できます。

一括ダウンロード

チャンクアップロードと同様、チャンクダウンロードではファイル全体がいくつかのチャンクに分割され、各チャンクが個別にダウンロードされ、複数のデータチャンクが並行して送信されます。 . これによりダウンロードが高速化されます。具体的なコードの実装は次のとおりです。

import aiohttp
import asyncio
import os

async def download_chunk(session, url, file, offset, size):
    headers = {'Range': f'bytes={offset}-{offset+size-1}'}
    async with session.get(url, headers=headers) as resp:
        data = await resp.read()
        file.seek(offset)
        file.write(data)
        return len(data)

async def download_file_with_chunks(session, url, file):
    async with session.head(url) as resp:
        file_size = int(resp.headers.get('Content-Length'))
        chunk_size = 1024 * 1024 * 5 #每块数据的大小为5MB
        offset = 0
        tasks = []
        while offset < file_size:
            size = chunk_size if offset+chunk_size < file_size else file_size-offset
            tasks.append(download_chunk(session, url, file, offset, size))
            offset += size
        return await asyncio.gather(*tasks)

async def main():
    async with aiohttp.ClientSession() as session:
        url = 'http://example.com/download/large_file.mp4'
        file = open('large_file.mp4', 'wb+')
        await download_file_with_chunks(session, url, file)

asyncio.run(main())

このコードでは、aiohttp ライブラリを使用して、非同期コルーチンの並列ダウンロードを実行します。同様に、ファイル全体を 5MB のデータブロックに分割し、asyncio.gather() メソッドを使用して各データブロックを同時にダウンロードするタスクを実行し、ファイルのダウンロードを高速化します。

マルチスレッドダウンロード

チャンクでダウンロードするだけでなく、マルチスレッドダウンロードを使用して大きなファイルをダウンロードすることもできます。具体的なコード実装は次のとおりです。

import threading
import requests

class MultiPartDownload(object):
    def __init__(self, url, file_path, num_thread=4):
        self.url = url
        self.file_path = file_path
        self.num_thread = num_thread
        self.file_size = requests.get(self.url, stream=True).headers.get('Content-Length')
        self.chunk_size = int(self.file_size) // self.num_thread
        self.threads = []
        self.lock = threading.Lock()

    def download(self, i):
        start = i * self.chunk_size
        end = start + self.chunk_size - 1 if i != self.num_thread - 1 else ''
        headers = {"Range": "bytes=%s-%s" % (start, end)}
        data = requests.get(self.url, headers=headers, stream=True)
        with open(self.file_path, 'rb+') as f:
            f.seek(start)
            f.write(data.content)
        self.lock.acquire()
        print("Part %d Downloaded." % i)
        self.lock.release()

    def run(self):
        for i in range(self.num_thread):
            t = threading.Thread(target=self.download, args=(i,))
            self.threads.append(t)
        for t in self.threads:
            t.start()

        for t in self.threads:
            t.join()

if __name__ == '__main__':
    url = 'http://example.com/download/large_file.mp4'
    file = 'large_file.mp4'
    downloader = MultiPartDownload(url, file)
    downloader.run()

このコードでは、Python 標準ライブラリの threading モジュールも使用して、マルチスレッドダウンロードを実装します。ファイル全体が複数のデータブロックに分割され、各スレッドがブロックの 1 つをダウンロードする責任を負うため、同時ダウンロードが実現されます。ロックメカニズムは、同時ダウンロード中のスレッドの安全性を保護するためにも使用されます。

4. 概要

この記事では、非同期コルーチンテクノロジを使用して、大きなファイルのアップロードおよびダウンロードの速度を最適化する方法を紹介します。アップロードとダウンロードの処理をブロック化して並列処理することで、ファイル転送の効率を大幅に向上します。非同期コルーチン、マルチスレッド、分散システムなどの分野に幅広く応用できます。この記事がお役に立てば幸いです!

以上が非同期コルーチン開発の実践: 大きなファイルのアップロードおよびダウンロードの速度の最適化の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

スカラータイプ、リターンタイプ、ユニオンタイプ、ヌル可能なタイプなど、PHPタイプのヒントはどのように機能しますか？Apr 17, 2025 am 12:25 AM

PHPタイプは、コードの品質と読みやすさを向上させるためのプロンプトがあります。 1）スカラータイプのヒント：php7.0であるため、基本データ型は、int、floatなどの関数パラメーターで指定できます。 3）ユニオンタイプのプロンプト：PHP8.0であるため、関数パラメーターまたは戻り値で複数のタイプを指定することができます。 4）Nullable Typeプロンプト：null値を含めることができ、null値を返す可能性のある機能を処理できます。

PHPは、オブジェクトのクローニング（クローンキーワード）と__Clone Magicメソッドをどのように処理しますか？Apr 17, 2025 am 12:24 AM

PHPでは、クローンキーワードを使用してオブジェクトのコピーを作成し、\ _ \ _クローンマジックメソッドを使用してクローン動作をカスタマイズします。 1.クローンキーワードを使用して浅いコピーを作成し、オブジェクトのプロパティをクローン化しますが、オブジェクトのプロパティはクローニングしません。 2。\ _ \ _クローン法は、浅いコピーの問題を避けるために、ネストされたオブジェクトを深くコピーできます。 3.クローニングにおける円形の参照とパフォーマンスの問題を避けるために注意し、クローニング操作を最適化して効率を向上させます。

PHP対Python：ユースケースとアプリケーションApr 17, 2025 am 12:23 AM

PHPはWeb開発およびコンテンツ管理システムに適しており、Pythonはデータサイエンス、機械学習、自動化スクリプトに適しています。 1.PHPは、高速でスケーラブルなWebサイトとアプリケーションの構築においてうまく機能し、WordPressなどのCMSで一般的に使用されます。 2。Pythonは、NumpyやTensorflowなどの豊富なライブラリを使用して、データサイエンスと機械学習の分野で驚くほどパフォーマンスを発揮しています。

さまざまなHTTPキャッシングヘッダー（例：キャッシュコントロール、ETAG、ラスト変更）を説明してください。Apr 17, 2025 am 12:22 AM

HTTPキャッシュヘッダーの主要なプレーヤーには、キャッシュコントロール、ETAG、およびラスト修飾が含まれます。 1.Cache-Controlは、キャッシュポリシーを制御するために使用されます。例：キャッシュコントロール：Max-Age = 3600、public。 2。ETAGは、一意の識別子を介してリソースの変更を検証します。例：ETAG： "686897696A7C876B7E"。 3. Last-Modifiedは、リソースの最後の変更時間を示しています。

PHPでの安全なパスワードハッシュ（例：Password_hash、password_verify）を説明します。 MD5またはSHA1を使用してみませんか？Apr 17, 2025 am 12:06 AM

PHPでは、Password_hashとpassword_verify関数を使用して安全なパスワードハッシュを実装する必要があり、MD5またはSHA1を使用しないでください。 1）password_hashセキュリティを強化するために、塩値を含むハッシュを生成します。 2）password_verifyハッシュ値を比較して、パスワードを確認し、セキュリティを確保します。 3）MD5とSHA1は脆弱であり、塩の値が不足しており、最新のパスワードセキュリティには適していません。

PHP：サーバー側のスクリプト言語の紹介Apr 16, 2025 am 12:18 AM

PHPは、動的なWeb開発およびサーバー側のアプリケーションに使用されるサーバー側のスクリプト言語です。 1.PHPは、編集を必要とせず、迅速な発展に適した解釈言語です。 2。PHPコードはHTMLに組み込まれているため、Webページの開発が簡単になりました。 3。PHPプロセスサーバー側のロジック、HTML出力を生成し、ユーザーの相互作用とデータ処理をサポートします。 4。PHPは、データベースと対話し、プロセスフォームの送信、サーバー側のタスクを実行できます。

PHPとWeb：その長期的な影響を調査しますApr 16, 2025 am 12:17 AM

PHPは過去数十年にわたってネットワークを形成しており、Web開発において重要な役割を果たし続けます。 1）PHPは1994年に発信され、MySQLとのシームレスな統合により、開発者にとって最初の選択肢となっています。 2）コア関数には、動的なコンテンツの生成とデータベースとの統合が含まれ、ウェブサイトをリアルタイムで更新し、パーソナライズされた方法で表示できるようにします。 3）PHPの幅広いアプリケーションとエコシステムは、長期的な影響を促進していますが、バージョンの更新とセキュリティの課題にも直面しています。 4）PHP7のリリースなど、近年のパフォーマンスの改善により、現代の言語と競合できるようになりました。 5）将来的には、PHPはコンテナ化やマイクロサービスなどの新しい課題に対処する必要がありますが、その柔軟性とアクティブなコミュニティにより適応性があります。

なぜPHPを使用するのですか？利点と利点が説明されましたApr 16, 2025 am 12:16 AM

PHPの中心的な利点には、学習の容易さ、強力なWeb開発サポート、豊富なライブラリとフレームワーク、高性能とスケーラビリティ、クロスプラットフォームの互換性、費用対効果が含まれます。 1）初心者に適した学習と使用が簡単。 2）Webサーバーとの適切な統合および複数のデータベースをサポートします。 3）Laravelなどの強力なフレームワークを持っています。 4）最適化を通じて高性能を達成できます。 5）複数のオペレーティングシステムをサポートします。 6）開発コストを削減するためのオープンソース。

See all articles