cari
Rumahhujung hadapan webSoal Jawab bahagian hadapanCara nodejs berinteraksi dengan data besar

Dengan perkembangan pesat Internet dan teknologi data, data besar secara beransur-ansur menjadi salah satu teras strategi pembangunan korporat. Dalam era dipacu data ini, cara memproses dan mengurus data besar-besaran dengan cekap telah menjadi isu penting yang dihadapi oleh perusahaan. Sebagai persekitaran berjalan JavaScript yang ringan, Nodejs juga telah mula digunakan secara meluas dalam bidang data besar, meningkatkan kecekapan pemprosesan data dan fleksibiliti perusahaan.

Bagaimana Nodejs berinteraksi dengan data besar?

Nodejs, sebagai persekitaran berjalan bahasa JavaScript, boleh berinteraksi dengan pelbagai sistem storan data melalui mekanisme modulnya yang berkuasa. Dalam bidang data besar, storan teragih, pengkomputeran teragih dan teknologi lain biasanya digunakan, seperti Hadoop, Spark, dll. Di bawah, kami akan menggunakan Hadoop sebagai contoh untuk memperkenalkan cara Nodejs berinteraksi dengan data besar.

  1. Gunakan API HDFS untuk operasi fail

Sistem Fail Teragih Hadoop (HDFS) ialah salah satu komponen teras Hadoop, yang boleh menyimpan sejumlah besar data dalam pengedaran persekitaran , dan memprosesnya melalui model pengkomputeran MapReduce. Nodejs boleh berinteraksi secara langsung dengan HDFS melalui API HDFS untuk melaksanakan muat naik fail, muat turun fail, pemadaman fail dan operasi lain.

Berikut ialah contoh menggunakan API HDFS untuk memuat naik fail dalam Nodejs:

const WebHDFS = require('webhdfs');
const fs = require('fs');

const hdfs = WebHDFS.createClient({
  user: 'hadoop',
  host: 'hadoop-cluster',
  port: 50070,
  path: '/webhdfs/v1'
});

const localFile = 'test.txt';
const remoteFile = '/user/hadoop/test.txt';

fs.createReadStream(localFile)
  .pipe(hdfs.createWriteStream(remoteFile))
  .on('error', (err) => {
    console.error(`Error uploading file: ${err.message}`);
  })
  .on('finish', () => {
    console.log('File uploaded successfully');
  });

Dalam contoh ini, modul webhdfs digunakan untuk mencipta klien HDFS melalui URL dan port HDFS nombor, dan kemudian Gunakan modul fs yang disertakan dengan Nodejs untuk membaca fail daripada tempatan dan akhirnya memuat naiknya ke HDFS.

  1. Menggunakan Penstriman Hadoop untuk pengkomputeran MapReduce

MapReduce ialah model pengkomputeran teragih untuk memproses set data yang besar dalam storan teragih. Rangka kerja MapReduce yang disertakan dalam Hadoop boleh membangunkan tugasan MapReduce menggunakan bahasa Java. Walau bagaimanapun, menggunakan rangka kerja MapReduce dalam Nodejs memerlukan perpustakaan kelas penyesuai, yang jelas mengurangkan kecekapan pembangunan. Oleh itu, menggunakan Hadoop Streaming boleh mengelakkan masalah ini.

Penstriman Hadoop ialah alat untuk memulakan tugasan MapReduce Ia boleh berinteraksi dengan tugasan MapReduce melalui input standard dan output standard. Nodejs boleh menggunakan modul child_process untuk mencipta proses anak dan lulus program MapReduce untuk dilaksanakan sebagai parameter baris arahan ke dalam proses anak. Untuk kaedah pelaksanaan khusus, sila rujuk kod contoh berikut:

// mapper.js
const readline = require('readline');

const rl = readline.createInterface({
  input: process.stdin,
  output: process.stdout,
  terminal: false
});

rl.on('line', (line) => {
  line
    .toLowerCase()
    .replace(/[.,?!]/g, '')
    .split(' ')
    .filter((word) => word.length > 0)
    .forEach((word) => console.log(`${word}\t1`));
});

// reducer.js
let count = 0;

process.stdin.resume();
process.stdin.setEncoding('utf-8');

process.stdin.on('data', (chunk) => {
  const lines = chunk.split('\n');
  lines.forEach((line) => {
    if (line.trim().length) {
      const [word, num] = line.split('\t');
      count += parseInt(num);
    }
  });
});

process.stdin.on('end', () => {
  console.log(`Total count: ${count}`);
});

Kod sampel di atas ialah program MapReduce yang ringkas. mapper.js memotong dan menapis teks dalam aliran input, dan akhirnya mengeluarkan hasil statistik kepada aliran output standard. reducer.js membaca data daripada aliran input standard, mengira nilai kunci yang sama secara kumulatif, dan akhirnya mengeluarkan hasilnya.

Program MapReduce ini boleh dilaksanakan melalui kod Nodejs berikut:

const { spawn } = require('child_process');

const mapper = spawn('/path/to/mapper.js');
const reducer = spawn('/path/to/reducer.js');

mapper.stdout.pipe(reducer.stdin);

reducer.stdout.on('data', (data) => {
  console.log(`Result: ${data}`);
});

mapper.stderr.on('data', (err) => {
  console.error(`Mapper error: ${err}`);
});

reducer.stderr.on('data', (err) => {
  console.error(`Reducer error: ${err}`);
});

reducer.on('exit', (code) => {
  console.log(`Reducer process exited with code ${code}`);
});

Dalam contoh ini, modul child_process digunakan untuk mencipta dua proses anak, satu untuk melaksanakan mapper.js dan satu untuk melaksanakan pengurang .js. Input dan output standard pemeta dan pengurang disambungkan untuk membentuk tugas MapReduce, dan hasil pengiraan akhirnya dikeluarkan kepada aliran keluaran standard.

Selain menggunakan API HDFS dan Penstriman Hadoop, Nodejs juga boleh berinteraksi dengan data besar dalam pelbagai cara lain, seperti melalui API RESTful, menggunakan pengumpul data, dsb. Sudah tentu, dalam aplikasi praktikal, kita perlu memilih kaedah interaksi yang paling sesuai mengikut senario tertentu.

Ringkasan

Artikel ini memperkenalkan cara Nodejs berinteraksi dengan data besar. Dengan menggunakan API HDFS dan Hadoop Streaming, operasi seperti membaca dan menulis data besar serta pengiraan MapReduce boleh dilaksanakan. Nodejs mempunyai kelebihan kecekapan yang ringan dan tinggi dalam bidang data besar, dan boleh membantu perusahaan mengurus dan memproses data besar-besaran dengan lebih baik.

Atas ialah kandungan terperinci Cara nodejs berinteraksi dengan data besar. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Apakah jenis fail audio yang boleh dimainkan menggunakan HTML5?Apakah jenis fail audio yang boleh dimainkan menggunakan HTML5?Apr 30, 2025 pm 02:59 PM

Artikel ini membincangkan format audio HTML5 dan keserasian silang pelayar. Ia meliputi MP3, WAV, OGG, AAC, dan WEBM, dan mencadangkan menggunakan pelbagai sumber dan sandaran untuk akses yang lebih luas.

Perbezaan antara elemen SVG dan kanvas HTML5?Perbezaan antara elemen SVG dan kanvas HTML5?Apr 30, 2025 pm 02:58 PM

SVG dan kanvas adalah elemen HTML5 untuk grafik web. SVG, yang berasaskan vektor, cemerlang dalam skalabiliti dan interaktiviti, manakala kanvas, berasaskan piksel, lebih baik untuk aplikasi intensif prestasi seperti permainan.

Adakah seret dan drop mungkin menggunakan html5 dan bagaimana?Adakah seret dan drop mungkin menggunakan html5 dan bagaimana?Apr 30, 2025 pm 02:57 PM

HTML5 membolehkan seretan dan jatuhkan dengan peristiwa dan atribut tertentu, yang membolehkan penyesuaian tetapi menghadapi masalah keserasian penyemak imbas pada versi lama dan peranti mudah alih.

Apakah perbezaan antara & lt; meter & gt; tag dan & lt; kemajuan & gt; Tag?Apakah perbezaan antara & lt; meter & gt; tag dan & lt; kemajuan & gt; Tag?Apr 30, 2025 pm 02:56 PM

Artikel ini membincangkan perbezaan antara html & lt; meter & gt; dan & lt; kemajuan & gt; Tags, digunakan untuk memaparkan nilai skalar dan kemajuan tugas, masing -masing.

Tukar data di bawah ke dalam format tabular dalam HTML5?Tukar data di bawah ke dalam format tabular dalam HTML5?Apr 30, 2025 pm 02:54 PM

Berikut adalah data yang ditukar ke dalam format tabular menggunakan HTML5, termasuk contoh dan strategi untuk reka bentuk responsif, amalan terbaik untuk gaya, dan tag HTML5 semantik yang digunakan dalam struktur meja: & lt ;! Doctype HTML & GT; & lt; html lang = &

Tentukan peta gambar?Tentukan peta gambar?Apr 30, 2025 pm 02:53 PM

Artikel ini membincangkan peta imej dalam reka bentuk web, manfaatnya seperti navigasi dan pertunangan yang dipertingkatkan, dan alat untuk penciptaan mereka.

Adalah & lt; datalist & gt; tag dan & lt; pilih & gt; Tag Sama?Adalah & lt; datalist & gt; tag dan & lt; pilih & gt; Tag Sama?Apr 30, 2025 pm 02:52 PM

Artikel ini membincangkan perbezaan antara & lt; DATALIST & GT; dan & lt; pilih & gt; Tags, memberi tumpuan kepada fungsi, interaksi pengguna, dan kesesuaian untuk senario pembangunan web yang berbeza.

Apakah perbezaan antara & lt; angka & gt; tag dan & lt; img & gt; Tag?Apakah perbezaan antara & lt; angka & gt; tag dan & lt; img & gt; Tag?Apr 30, 2025 pm 02:50 PM

Artikel ini membincangkan perbezaan antara html & lt; angka & gt; dan & lt; img & gt; Tags, memberi tumpuan kepada tujuan, penggunaan, dan faedah semantik mereka. Hujah utama ialah & lt; angka & gt; memberikan struktur dan akses yang lebih baik

See all articles

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

PhpStorm versi Mac

PhpStorm versi Mac

Alat pembangunan bersepadu PHP profesional terkini (2018.2.1).

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

Persekitaran pembangunan bersepadu PHP yang berkuasa

mPDF

mPDF

mPDF ialah perpustakaan PHP yang boleh menjana fail PDF daripada HTML yang dikodkan UTF-8. Pengarang asal, Ian Back, menulis mPDF untuk mengeluarkan fail PDF "dengan cepat" dari tapak webnya dan mengendalikan bahasa yang berbeza. Ia lebih perlahan dan menghasilkan fail yang lebih besar apabila menggunakan fon Unicode daripada skrip asal seperti HTML2FPDF, tetapi menyokong gaya CSS dsb. dan mempunyai banyak peningkatan. Menyokong hampir semua bahasa, termasuk RTL (Arab dan Ibrani) dan CJK (Cina, Jepun dan Korea). Menyokong elemen peringkat blok bersarang (seperti P, DIV),

EditPlus versi Cina retak

EditPlus versi Cina retak

Saiz kecil, penyerlahan sintaks, tidak menyokong fungsi gesaan kod