あなたは淘宝網で衣服を購入したところです - 技術プロセス (淘宝網のホームページにページを表示するプロセス) の詳細な分析_html/css

ホームページ

ウェブフロントエンド

htmlチュートリアル

あなたは淘宝網で衣服を購入したところです - 技術プロセス (淘宝網のホームページにページを表示するプロセス) の詳細な分析_html/css_WEB-ITnose

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 24, 2016 am 11:48 AM

免責事項: この記事はインターネットで閲覧し、私のコンピューターに保存した文書です。元のアドレスは見つかりません。ここでの声明。インターネットエンジニアに敬意を表します！

もうすぐ旧正月が近づいていることに気づき、ガールフレンドにセーターを買おうと思い、www.taobao.com を開きます。このとき、ブラウザはまず DNS サーバーにクエリを実行し、www.taobao.com を IP アドレスに変換します。ただし、異なる地域または異なるネットワーク (テレコム、チャイナユニコム、チャイナモバイル) にいる場合、変換された IP アドレスは異なる可能性が高いことがわかります。これには、DNS によるドメイン解決による負荷分散の最初のステップが含まれます。名前を指定すると、アクセスを異なる入り口に割り当て、同時に、訪問する入り口がすべての入り口の中で可能な限り最速であることを保証しようとします（これは後述の CDN とは異なります）。

この入口を通じて www.taobao.com の実際の入口 IP アドレスに正常にアクセスしました。このとき、PV、つまりページビュー、ページ訪問が発生します。各 Web サイトの 1 日の合計 PV 量は、Web サイトの規模を表す重要な指標です。タオバオネットワーク全体の平日（非プロモーション期間）のPVは16億～25億。同時に、独立ユーザーとして、今回タオバオで訪問したすべてのページは UV (ユニークビジターユーザー訪問) としてカウントされます。最近悪名高い 12306.cn の 1 日あたりの PV 量はピーク時に約 10 億でしたが、その UV 量はタオバオの 10 倍にも満たなかったのは、誰もがその理由を知っていると思います。

同時に www.taobao.com を訪問する人の数が多すぎるため、Taobao ホームページを生成するサーバーも 1 つだけにすることはできません。 www.taobao.com のホームページを生成するためだけに使用されるサーバーが数百、さらには数千も存在する場合があるため、訪問中にページを生成するタスクはサーバーの 1 つに割り当てられます。このプロセスは公平、公平、均等である必要があります (これらの数百または数千のサーバーのそれぞれのユーザー数はほぼ同じである必要があります)。この非常に複雑なプロセスは複数のシステムによって実行されますが、その中で最も重要なものは LVS (Linux Virtual) です。 Server) は、世界で最も人気のある負荷分散システムの 1 つであり、現在 Taobao で働く Zhang Wensong 博士によって開発されました。

一連の複雑な論理演算とデータ処理を経て、今回お見せしたタオバオホームページのHTMLコンテンツが正常に生成されました。 Web フロントエンドについて少しの知識がある人なら、次のステップでブラウザがページで使用される CSS、JS、画像、スクリプト、リソースファイルを読み込むことを知っているはずです。ただし、同じドメイン名でブラウザが同時に読み込めるリソースの数に制限があることを知っている学生は比較的少ないかもしれません。たとえば、IE6 ～ 7 には 2 つのリソースがあり、IE8 には 6 つのリソースがあり、Chrome の各バージョンは次のようになります。通常は4〜6です。タオバオのホームページにアクセスすると、126 個のリソースを読み込む必要があるため、同時接続数が少ないと、当然ながら読み込みに時間がかかります。したがって、フロントエンド開発者は多くの場合、上記のリソースファイルを複数のドメイン名で配布し、ブラウザのこの制限を回避して、次の CDN 作業の準備も行います。

信頼性の低いニュースによると、ダブルイレブンのピーク時には、タオバオのアクセストラフィックは 871GB/S に達しました。この数字は、手頃な価格にするには 178 万の 4Mb 帯域幅のホームブロードバンドが必要であり、中小規模の都市のインターネット帯域幅全体を圧倒できる能力があることを意味します。したがって、これらのアクセストラフィックを同時に集中させることはできません。また、異なる地域の異なるネットワーク (テレコム、チャイナユニコムなど) 間の相互アクセスが非常に遅いことは誰もが知っていますが、タオバオへのアクセスが遅いことに気づくことはほとんどありません。それがコンテンツ配信ネットワークであるCDN（Content Delivery Network）の役割です。タオバオは全国に数十、数百の CDN ノードを確立しており、何らかの手段を使って、あなたが訪問する場所 (ここでは主に js、css、写真などを指します) があなたに最も近い CDN ノードであることを確認します。大量のトラフィックがあらゆる場所に分散されているため、アクセラレーションノードにアクセスします。

問題が発生します。つまり、販売者が新生児をリリースし、いくつかの新しい赤ちゃんの写真をアップロードした場合、淘宝網はこれらの写真が全国の CDN ノードで同期されていることをどのように保証するのでしょうか? ユーザーの使用についてはどうすればよいでしょうか?これには、コンテンツ配信と同期関連のテクノロジーが多数含まれます。タオバオは、この種の問題に対処するために、分散ファイルシステム TFS (タオバオファイルシステム) を開発しました。

さて、いよいよ淘宝網のホームページをロードしました。その後、習慣的にホームページの検索ボックスに「セーター」という単語を入力して Enter キーを押し、この時点で別の PV を生成すると、淘宝網のメイン検索システムが表示されます。あなたに仕え始めます。まず、単語分割データベースに基づいて、入力されたコンテンツに対して 単語分割操作 を実行します。ご存知のとおり、英語は単語に基づいており、単語はスペースで区切られていますが、中国語は単語に基づいており、文内のすべての単語を接続して意味を説明できます。たとえば、「私は学生です」という英語の文は、中国語では「私は学生です」となります。コンピュータは、スペースを介して「student」が単語であることを簡単に認識できますが、「learn」と「生」の 2 つの単語が組み合わされて 1 つの単語を表すことは簡単には理解できません。中国語の文字シーケンスを意味のある単語に分割することは中国語の単語の分割であり、これを 単語の分割 とも呼ぶ人もいます。私は学生です。分詞の結果は次のようになります。私は学生です。

単語の分割後、入力した検索語に基づいてショッピングの意図を分析する必要もあります。ユーザーが検索する際の意図は次のとおりです。 (1) 閲覧型: 明確な買い物の対象や意図はなく、見ながら購入する場合はよりカジュアルで感情的になります。クエリ例：「2010 年の香水トップ 10 ランキング」、「2010 年に人気のセーター」、「zippo の種類は何種類ありますか?」 (2) クエリの種類: 特定の購買意図が反映されています。属性の要件にあります。例：「高齢者に適した携帯電話」、「500元の時計」 (3) 比較タイプ：買い物の意図は特定の商品に絞り込まれています。クエリ、例: "Nokia E71 E63"、"akg k450 px200"; (4) 決定されたタイプ: 基本的な決定が行われ、特定のオブジェクトに焦点が当てられます。クエリの例: 「Nokia N97」、「IBM T60」。ショッピングの意図を分析することで、メインの検索ではまったく異なる結果が表示されます。

いくつかの手順を経た後、メインの検索システムは、上記およびより複雑な条件に基づいて検索結果をリストします。これらの検索はすべて、1,000 を超える検索サーバーによって完了されます。次に、クリックを開始して、検索された製品を 1 つずつ参照します。赤ちゃんの詳細ページの表示が開始されます。オンラインショッピングを頻繁に行う友人は、商品を購入した後、販売者が商品詳細ページを何度も変更したとしても、「購入した商品」からその時点のスナップショットを表示できることに気づくでしょう。これは、販売者が商品の詳細で約束した内容を反故にするのを防ぐためです。明らかに、毎年数百億件のトランザクションの製品詳細スナップショットを保存し、すぐに呼び出すのは簡単な問題ではありません。これには、いくつかのシステムの連携も必要ですが、その中でより重要なのは、淘宝網が独自に開発した分散型 KV ストレージソリューションである Tair です。

その後、実際にトランザクションを実行するかどうかに関係なく、その後のビジネスロジックとデータ分析のために、アクセス動作がシステムによって忠実に記録されます。これらの記録の中で、アクセスログレコードは最も重要な記録の 1 つですが、これらのアクセスはさまざまな地域のさまざまなサーバーに分散されており、ユーザー数が多いため、これらのログレコードは非常に大きくなることが以前にわかりました。、結核レベルに達することは非常に正常です。これらのログデータを迅速かつタイムリーに送信および同期するために、タオバオはリアルタイムデータを送信し、レポートやその他の操作の計算のためにバックエンドシステムに渡すために使用される TimeTunnel を開発しました。あなたの閲覧データ、トランザクションデータ、その他多くのデータ記録は保持されます。その結果、タオバオに保存されている履歴データは簡単に 10 PB 以上 (1PB=1024TB=1048576GB) に達する可能性があります。このような膨大な量のデータは、タオバオシステムによって 1:120 という極度の圧縮を通じてタオバオのデータウェアハウスに保存されます。そして、2,000 台以上のサーバーで構成される Yunlai と呼ばれる非常に大規模なデータシステムを通じて、継続的に分析とマイニングが行われます。

このデータから、淘宝網はあなたが誰なのか、何が好きなのか、子供の年齢は何歳か、恋人関係にあるかどうか、World of Warcraft をプレイするのが好きな人はどんな飲み物が好きかなどを知ることができます。小売事情、さまざまな商品の盛衰など、膨大な量の情報があります。

ここまで多くのことを述べてきましたが、私は淘宝網で実行されている何千ものシステムのうちのほんの数例を説明しただけです。タオバオのホームページに一度アクセスしただけでも、そこに含まれるテクノロジーとシステムの規模は想像を超えています。これらは長江奨学生や国家科学技術最高賞受賞者を含む 2,000 人以上のトップタオバオエンジニアの発案によるものです。名前。同様に、Baidu や Tencent などのビジネスシステムも、タオバオよりも決して単純ではありません。知っておくべきことは、あなたが毎日使っているインターネット製品はシンプルで使いやすいように見えますが、その裏側には想像を絶する知恵と労力があるということです。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

Web開発にとってHTMLタグが重要なのはなぜですか？May 02, 2025 am 12:03 AM

htmltagsareSterenceforwebdevelovementasyStheStructureanhandhancewebpages.1）theydefineLayout、semantics、and-interactivity.2）semanticagsimprovecessibility.3）opeusofusofagscanoptimizeperformanceandensurecross-brows-compativeation。

HTMLタグと属性に一貫したコーディングスタイルを使用することの重要性を説明します。May 01, 2025 am 12:01 AM

コードの読みやすさ、保守性、効率を向上させるため、一貫したHTMLエンコーディングスタイルは重要です。 1）低ケースタグと属性を使用します。2）一貫したインデントを保持し、3）シングルまたはダブルの引用符を選択して固執する、4）プロジェクトのさまざまなスタイルの混合を避け、5）きれいなスタイルやEslintなどの自動化ツールを使用して、スタイルの一貫性を確保します。

ブートストラップ4にマルチプロジェクトカルーセルを実装する方法は？Apr 30, 2025 pm 03:24 PM

Bootstrap4にマルチプロジェクトカルーセルを実装するソリューションBootstrap4にマルチプロジェクトカルーセルを実装するのは簡単な作業ではありません。ブートストラップですが...

DeepSeekの公式Webサイトは、マウススクロールイベントの浸透の影響をどのように達成していますか？Apr 30, 2025 pm 03:21 PM

マウススクロールイベントの浸透の効果を実現する方法は？ Webを閲覧すると、いくつかの特別なインタラクションデザインに遭遇することがよくあります。たとえば、DeepSeekの公式ウェブサイトでは、...

HTMLビデオの再生コントロールスタイルを変更する方法Apr 30, 2025 pm 03:18 PM

HTMLビデオのデフォルトの再生コントロールスタイルは、CSSを介して直接変更することはできません。 1. JavaScriptを使用してカスタムコントロールを作成します。 2。CSSを介してこれらのコントロールを美化します。 3. video.jsやPLYRなどのライブラリを使用すると、互換性、ユーザーエクスペリエンス、パフォーマンスを検討してください。プロセスを簡素化できます。

お使いの携帯電話でネイティブセレクトを使用することにより、どのような問題が発生しますか？Apr 30, 2025 pm 03:15 PM

携帯電話でネイティブセレクトを使用する際の潜在的な問題は、モバイルアプリケーションを開発するときに、ボックスを選択する必要があることがよくあります。通常、開発者...

お使いの携帯電話でネイティブ選択を使用することの欠点は何ですか？Apr 30, 2025 pm 03:12 PM

お使いの携帯電話でネイティブ選択を使用することの欠点は何ですか？モバイルデバイスでアプリケーションを開発する場合、適切なUIコンポーネントを選択することが非常に重要です。多くの開発者...

Three.jsとOctreeを使用して部屋で3人のローミングの衝突処理を最適化する方法は？Apr 30, 2025 pm 03:09 PM

Three.JSとOctreeを使用して、部屋でのサードパーソンローミングの衝突処理を最適化します。 3つのjsでoctreeを使用して、部屋でサードパーソンローミングを実装し、衝突を追加してください...

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポートライブラリとヘッダーファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。