Cara menggunakan Apache Hadoop untuk pengkomputeran teragih dan penyimpanan data dalam pembangunan PHP-tutorial php-php.cn

Rumah

pembangunan bahagian belakang

tutorial php

Cara menggunakan Apache Hadoop untuk pengkomputeran teragih dan penyimpanan data dalam pembangunan PHP

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 25, 2023 am 09:15 AM

phppengkomputeran teragihapache hadoop

Dengan pengembangan berterusan skala Internet dan jumlah data, pengkomputeran dan storan mesin tunggal tidak lagi dapat memenuhi keperluan pemprosesan data berskala besar. Pada masa ini, pengkomputeran teragih dan penyimpanan data menjadi penyelesaian yang diperlukan. Sebagai rangka kerja pengkomputeran teragih sumber terbuka, Apache Hadoop telah menjadi pilihan pertama untuk banyak projek pemprosesan data besar.

Bagaimana untuk menggunakan Apache Hadoop untuk pengkomputeran teragih dan penyimpanan data dalam pembangunan PHP? Artikel ini akan memperkenalkannya secara terperinci dari tiga aspek: pemasangan, konfigurasi dan amalan.

1. Pemasangan

Memasang Apache Hadoop memerlukan langkah berikut:

Muat turun pakej fail binari Apache Hadoop

Anda boleh memuat turunnya dari laman web rasmi Apache Hadoop (http://hadoop.apache.org /releases.html ) untuk memuat turun versi terkini.

Pasang Java

Apache Hadoop ditulis berdasarkan Java, jadi anda perlu memasang Java terlebih dahulu.

Konfigurasikan pembolehubah persekitaran

Selepas memasang Java dan Hadoop, anda perlu mengkonfigurasi pembolehubah persekitaran. Dalam sistem Windows, tambahkan laluan direktori bin Java dan Hadoop kepada pembolehubah persekitaran sistem. Dalam sistem Linux, anda perlu menambah laluan PATH Java dan Hadoop dalam .bashrc atau .bash_profile.

2. Konfigurasi

Selepas memasang Hadoop, beberapa konfigurasi diperlukan untuk menggunakannya seperti biasa. Berikut ialah beberapa konfigurasi penting:

core-site.xml

Laluan fail konfigurasi: $HADOOP_HOME/etc/hadoop/core-site.xml

Dalam fail ini, anda perlu menentukan URI sistem fail lalai dan HDFS Laluan storan fail sementara yang dijana semasa Hadoop sedang berjalan.

Contoh konfigurasi (untuk rujukan sahaja):

<configuration>
  <property>
    <name>fs.defaultFS</name>
    <value>hdfs://localhost:9000</value>
  </property>
  <property>
    <name>hadoop.tmp.dir</name>
    <value>/usr/local/hadoop/tmp</value>
  </property>
</configuration>

hdfs-site.xml

Laluan fail konfigurasi: $HADOOP_HOME/etc/hadoop/hdfs-site.xml

Dalam fail ini, salinan HDD perlu ditakrifkan maklumat seperti nombor dan saiz blok.

Konfigurasi sampel (untuk rujukan sahaja):

<configuration>
  <property>
    <name>dfs.replication</name>
    <value>3</value>
  </property>
  <property>
    <name>dfs.blocksize</name>
    <value>128M</value>
  </property>
</configuration>

yarn-site.xml

Laluan fail konfigurasi: $HADOOP_HOME/etc/hadoop/yarn-site.xml

Dalam fail ini, anda perlu mentakrifkan YARN yang berkaitan Maklumat konfigurasi, seperti alamat pengurus sumber, bilangan pengurus nod, dsb.

Konfigurasi sampel (untuk rujukan sahaja):

<configuration>
  <property>
    <name>yarn.resourcemanager.address</name>
    <value>localhost:8032</value>
  </property>
  <property>
    <name>yarn.nodemanager.resource.memory-mb</name>
    <value>8192</value>
  </property>
  <property>
    <name>yarn.nodemanager.resource.cpu-vcores</name>
    <value>4</value>
  </property>
</configuration>

mapred-site.xml

Laluan fail konfigurasi: $HADOOP_HOME/etc/hadoop/mapred-site.xml

Konfigurasikan maklumat yang berkaitan bagi Mapred ini fail.

Contoh konfigurasi (untuk rujukan sahaja):

<configuration>
  <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
  </property>
  <property>
    <name>yarn.app.mapreduce.am.env</name>
    <value>HADOOP_MAPRED_HOME=/usr/local/hadoop</value>
  </property>
</configuration>

3. Amalkan

Selepas menyelesaikan kerja pemasangan dan konfigurasi di atas, anda boleh mula menggunakan Apache Hadoop untuk pengkomputeran teragih dan penyimpanan data dalam pembangunan PHP.

Menyimpan Data

Dalam Hadoop, data disimpan dalam HDFS. Anda boleh menggunakan kelas Hdfs (https://github.com/vladko/Hdfs) yang disediakan oleh PHP untuk mengendalikan HDFS.

Kod Contoh:

require_once '/path/to/hdfs/vendor/autoload.php';

use AliyunHdfsHdfsClient;

$client = new HdfsClient(['host' => 'localhost', 'port' => 9000]);

// 上传本地文件到HDFS
$client->copyFromLocal('/path/to/local/file', '/path/to/hdfs/file');

// 下载HDFS文件到本地
$client->copyToLocal('/path/to/hdfs/file', '/path/to/local/file');

Pengkomputeran Teragih

Hadoop biasanya menggunakan model MapReduce untuk pengkomputeran teragih. Pengiraan MapReduce boleh dilaksanakan menggunakan kelas HadoopStreaming yang disediakan oleh PHP (https://github.com/andreas-glaser/php-hadoop-streaming).

Kod sampel:

(Nota: Kod berikut mensimulasikan operasi pengiraan perkataan dalam Hadoop.)

Kod PHP Mapper:

#!/usr/bin/php
<?php

while (($line = fgets(STDIN)) !== false) {
    // 对每一行数据进行处理操作
    $words = explode(' ', strtolower($line));
    foreach ($words as $word) {
        echo $word."    1
";  // 将每个单词按照‘单词    1’的格式输出
    }
}

Kod PHP Reducer:

#!/usr/bin/php
<?php

$counts = [];
while (($line = fgets(STDIN)) !== false) {
    list($word, $count) = explode("    ", trim($line));
    if (isset($counts[$word])) {
        $counts[$word] += $count;
    } else {
        $counts[$word] = $count;
    }
}

// 将结果输出
foreach ($counts as $word => $count) {
    echo "$word: $count
";
}

Perintah pelaksanaan di atas

Arahan pelaksanaan di atas:

Data input.txt disalurkan ke dalam mapper.php untuk diproses, kemudian diisih, dan akhirnya hasil output disalurkan ke reducer.php untuk diproses, dan akhirnya bilangan kemunculan setiap perkataan adalah output.

Kelas HadoopStreaming melaksanakan logik asas model MapReduce, menukar data kepada pasangan nilai kunci, memanggil fungsi peta untuk pemetaan, menjana pasangan nilai kunci baharu dan memanggil fungsi pengurangan untuk pemprosesan gabungan.

Kod contoh:

$ cat input.txt | ./mapper.php | sort | ./reducer.php

Memandangkan Apache Hadoop ialah rangka kerja pengkomputeran teragih sumber terbuka, ia juga menyediakan banyak API dan alatan lain, seperti HBase, Hive, Pig, dll., yang boleh dipilih mengikut keperluan dalam aplikasi tertentu.

Ringkasan:

Artikel ini memperkenalkan cara menggunakan Apache Hadoop untuk pengkomputeran teragih dan storan data dalam pembangunan PHP. Ia mula-mula menerangkan langkah terperinci pemasangan dan konfigurasi Apache Hadoop, kemudian memperkenalkan cara menggunakan PHP untuk mengendalikan HDFS untuk melaksanakan operasi penyimpanan data, dan akhirnya menggunakan contoh kelas HadoopStreaming untuk menerangkan cara melaksanakan pengkomputeran teragih MapReduce dalam pembangunan PHP.

Atas ialah kandungan terperinci Cara menggunakan Apache Hadoop untuk pengkomputeran teragih dan penyimpanan data dalam pembangunan PHP. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel Berkaitan

Status Semasa PHP: Lihat trend pembangunan webApr 13, 2025 am 12:20 AM

PHP tetap penting dalam pembangunan web moden, terutamanya dalam pengurusan kandungan dan platform e-dagang. 1) PHP mempunyai ekosistem yang kaya dan sokongan rangka kerja yang kuat, seperti Laravel dan Symfony. 2) Pengoptimuman prestasi boleh dicapai melalui OPCACHE dan NGINX. 3) Php8.0 memperkenalkan pengkompil JIT untuk meningkatkan prestasi. 4) Aplikasi awan asli dikerahkan melalui Docker dan Kubernet untuk meningkatkan fleksibiliti dan skalabiliti.

PHP vs Bahasa Lain: PerbandinganApr 13, 2025 am 12:19 AM

PHP sesuai untuk pembangunan web, terutamanya dalam pembangunan pesat dan memproses kandungan dinamik, tetapi tidak baik pada sains data dan aplikasi peringkat perusahaan. Berbanding dengan Python, PHP mempunyai lebih banyak kelebihan dalam pembangunan web, tetapi tidak sebaik python dalam bidang sains data; Berbanding dengan Java, PHP melakukan lebih buruk dalam aplikasi peringkat perusahaan, tetapi lebih fleksibel dalam pembangunan web; Berbanding dengan JavaScript, PHP lebih ringkas dalam pembangunan back-end, tetapi tidak sebaik JavaScript dalam pembangunan front-end.

PHP vs Python: Ciri dan Fungsi TerasApr 13, 2025 am 12:16 AM

PHP dan Python masing -masing mempunyai kelebihan sendiri dan sesuai untuk senario yang berbeza. 1.PHP sesuai untuk pembangunan web dan menyediakan pelayan web terbina dalam dan perpustakaan fungsi yang kaya. 2. Python sesuai untuk sains data dan pembelajaran mesin, dengan sintaks ringkas dan perpustakaan standard yang kuat. Apabila memilih, ia harus diputuskan berdasarkan keperluan projek.

PHP: Bahasa utama untuk pembangunan webApr 13, 2025 am 12:08 AM

PHP adalah bahasa skrip yang digunakan secara meluas di sisi pelayan, terutamanya sesuai untuk pembangunan web. 1.PHP boleh membenamkan HTML, memproses permintaan dan respons HTTP, dan menyokong pelbagai pangkalan data. 2.PHP digunakan untuk menjana kandungan web dinamik, data borang proses, pangkalan data akses, dan lain -lain, dengan sokongan komuniti yang kuat dan sumber sumber terbuka. 3. PHP adalah bahasa yang ditafsirkan, dan proses pelaksanaan termasuk analisis leksikal, analisis tatabahasa, penyusunan dan pelaksanaan. 4.Php boleh digabungkan dengan MySQL untuk aplikasi lanjutan seperti sistem pendaftaran pengguna. 5. Apabila debugging php, anda boleh menggunakan fungsi seperti error_reporting () dan var_dump (). 6. Mengoptimumkan kod PHP untuk menggunakan mekanisme caching, mengoptimumkan pertanyaan pangkalan data dan menggunakan fungsi terbina dalam. 7

PHP: asas banyak laman webApr 13, 2025 am 12:07 AM

Sebab mengapa PHP adalah timbunan teknologi pilihan untuk banyak laman web termasuk kemudahan penggunaannya, sokongan komuniti yang kuat, dan penggunaan yang meluas. 1) Mudah dipelajari dan digunakan, sesuai untuk pemula. 2) Mempunyai komuniti pemaju yang besar dan sumber yang kaya. 3) Digunakan secara meluas dalam platform WordPress, Drupal dan lain -lain. 4) Mengintegrasikan dengan ketat dengan pelayan web untuk memudahkan penggunaan pembangunan.

Di luar gembar -gembur: Menilai peranan PHP hari iniApr 12, 2025 am 12:17 AM

PHP kekal sebagai alat yang kuat dan digunakan secara meluas dalam pengaturcaraan moden, terutamanya dalam bidang pembangunan web. 1) PHP mudah digunakan dan diintegrasikan dengan lancar dengan pangkalan data, dan merupakan pilihan pertama bagi banyak pemaju. 2) Ia menyokong penjanaan kandungan dinamik dan pengaturcaraan berorientasikan objek, sesuai untuk membuat dan mengekalkan laman web dengan cepat. 3) Prestasi PHP dapat ditingkatkan dengan caching dan mengoptimumkan pertanyaan pangkalan data, dan komuniti yang luas dan ekosistem yang kaya menjadikannya masih penting dalam timbunan teknologi hari ini.

Apakah rujukan yang lemah dalam PHP dan bilakah mereka berguna?Apr 12, 2025 am 12:13 AM

Dalam PHP, rujukan lemah dilaksanakan melalui kelas lemah dan tidak akan menghalang pemungut sampah daripada menebus objek. Rujukan lemah sesuai untuk senario seperti sistem caching dan pendengar acara. Harus diingat bahawa ia tidak dapat menjamin kelangsungan hidup objek dan pengumpulan sampah mungkin ditangguhkan.

Terangkan kaedah sihir __invoke dalam PHP.Apr 12, 2025 am 12:07 AM

Kaedah \ _ \ _ membolehkan objek dipanggil seperti fungsi. 1. Tentukan kaedah \ _ \ _ supaya objek boleh dipanggil. 2. Apabila menggunakan sintaks $ OBJ (...), PHP akan melaksanakan kaedah \ _ \ _ invoke. 3. Sesuai untuk senario seperti pembalakan dan kalkulator, meningkatkan fleksibiliti kod dan kebolehbacaan.

See all articles

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

2 minggu yang laluByDDD

R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa

3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Cara Membuka Segala -galanya Di Myrise

4 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Dreamweaver Mac版

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

SublimeText3 Linux versi baharu

SublimeText3 Linux versi terkini

Versi Mac WebStorm

Alat pembangunan JavaScript yang berguna

SecLists

SecLists ialah rakan penguji keselamatan muktamad. Ia ialah koleksi pelbagai jenis senarai yang kerap digunakan semasa penilaian keselamatan, semuanya di satu tempat. SecLists membantu menjadikan ujian keselamatan lebih cekap dan produktif dengan menyediakan semua senarai yang mungkin diperlukan oleh penguji keselamatan dengan mudah. Jenis senarai termasuk nama pengguna, kata laluan, URL, muatan kabur, corak data sensitif, cangkerang web dan banyak lagi. Penguji hanya boleh menarik repositori ini ke mesin ujian baharu dan dia akan mempunyai akses kepada setiap jenis senarai yang dia perlukan.

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7488

Tutorial CakePHP

1377

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi