Rumah >Operasi dan penyelenggaraan >Docker >Analisis ringkas tentang cara membuat sistem fail HDFS dalam Docker
Dengan peningkatan data berskala besar, semakin banyak syarikat beralih kepada Hadoop Distributed File System (HDFS) sebagai penyelesaian penyimpanan data mereka. HDFS ialah sistem fail teragih berskala tinggi berdasarkan Java dengan ciri seperti ketersediaan tinggi dan toleransi kesalahan. Walau bagaimanapun, untuk pentadbir sistem dan pembangun yang ingin menjalankan HDFS dalam bekas Docker, mencipta sistem fail HDFS bukanlah tugas yang mudah. Artikel ini akan memperkenalkan cara mencipta sistem fail HDFS dalam Docker.
Langkah 1: Pasang Docker
Mula-mula, pasang Docker pada komputer anda. Langkah pemasangan mungkin berbeza untuk sistem pengendalian yang berbeza. Anda boleh melawati laman web rasmi Docker untuk mendapatkan maklumat lanjut dan sokongan.
Langkah 2: Pasang dan konfigurasi Hadoop dan HDFS
Seterusnya, anda perlu memasang dan mengkonfigurasi Hadoop dan HDFS. Di sini kami mengesyorkan menggunakan Apache Ambari untuk memasang dan mengurus kelompok Hadoop dan HDFS. Ambari ialah perisian sumber terbuka untuk mengurus kluster Hadoop Ia menyediakan antara muka pengguna web yang mudah digunakan, menjadikannya sangat mudah untuk memasang, mengkonfigurasi dan memantau kluster Hadoop.
Pertama, anda perlu memasang Pelayan Ambari dan Ejen Ambari. Anda boleh mengikuti dokumentasi rasmi untuk pemasangan dan konfigurasi.
Seterusnya, dalam UI web Ambari, cipta kluster Hadoop baharu dan pilih untuk memasang komponen HDFS. Semasa proses pemasangan, anda perlu menyediakan nod NameNode dan DataNode HDFS dan membuat konfigurasi lain seperti saiz blok dan bilangan replika. Anda boleh mengkonfigurasinya mengikut keperluan sebenar anda. Setelah kluster Hadoop dan HDFS anda dipasang dan dikonfigurasikan, anda boleh menguji sama ada kluster berfungsi dengan betul.
Langkah 3: Buat bekas Docker dan sambungkan ke gugusan HDFS
Seterusnya, anda perlu mencipta bekas Docker dan menyambung ke gugusan HDFS. Anda boleh menggunakan Dockerfile atau Docker Compose untuk mencipta bekas Docker. Di sini kami menggunakan Docker Compose untuk mencipta bekas.
Mula-mula, buat direktori baharu pada komputer anda (cth. /docker), dan kemudian buat fail yang dipanggil docker-compose.yaml dalam direktori itu. Dalam fail ini, anda perlu mentakrifkan bekas klien Hadoop yang akan bersambung ke gugusan Hadoop dan HDFS melalui rangkaian. Berikut ialah contoh fail docker-compose.yaml:
version: '3' services: hadoop-client: image: bde2020/hadoop-base container_name: hadoop-client environment: - HADOOP_USER_NAME=hdfs volumes: - ./conf/hadoop:/usr/local/hadoop/etc/hadoop - ./data:/data networks: - hadoop-network networks: hadoop-network:
Dalam fail di atas, kami mentakrifkan perkhidmatan yang dipanggil hadoop-client, yang mencipta bekas Docker menggunakan imej bde2020/hadoop-base. Kemudian kami menentukan pembolehubah persekitaran HADOOP_USER_NAME untuk menetapkan nama pengguna yang digunakan semasa menyambung ke HDFS. Seterusnya, kami mengikat fail konfigurasi Hadoop dan volum data dengan bekas Docker untuk mengakses HDFS dalam bekas klien Hadoop. Akhir sekali, kami menyambungkan bekas ke dalam rangkaian Docker yang dipanggil hadoop-network untuk membolehkannya berkomunikasi dengan bekas lain.
Seterusnya, anda boleh memulakan bekas klien Hadoop dalam Docker menggunakan arahan berikut:
docker-compose up -d
Langkah 4: Buat sistem fail HDFS dalam Docker
Sekarang, kami bersedia untuk mencipta sistem fail HDFS dalam bekas Docker. Dapatkan terminal bekas klien Hadoop menggunakan arahan berikut:
docker exec -it hadoop-client /bin/bash
Seterusnya, anda boleh mencipta direktori baharu pada HDFS menggunakan arahan berikut:
hdfs dfs -mkdir path/to/new/dir
Sila ikuti laluan direktori perlu diubah.
Akhir sekali, anda boleh menyenaraikan fail yang dibuat dalam direktori menggunakan arahan berikut:
hdfs dfs -ls path/to/new/dir
Anda sepatutnya dapat melihat fail yang dibuat dalam bekas Docker.
Kesimpulan
Dengan menggunakan Docker untuk mencipta sistem fail HDFS, pentadbir dan pembangun sistem boleh membuat dan menguji gugusan Hadoop dan HDFS dengan cepat dan mudah untuk memenuhi keperluan khusus mereka. Dalam persekitaran pengeluaran sebenar, anda perlu mengetahui lebih lanjut tentang konfigurasi dan butiran Hadoop dan HDFS untuk memastikan prestasi dan kebolehpercayaan yang optimum.
Atas ialah kandungan terperinci Analisis ringkas tentang cara membuat sistem fail HDFS dalam Docker. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!