検索
ホームページ運用・保守ApacheApache Avro データを解析する方法について話しましょう (例付きで説明)

Apache Avro データを解析するにはどうすればよいですか?この記事では、シリアル化して Avro データを生成する方法、デシリアライズして Avro データを解析する方法、FlinkSQL を使用して Avro データを解析する方法を紹介します。

Apache Avro データを解析する方法について話しましょう (例付きで説明)

インターネットの急速な発展に伴い、クラウド コンピューティング、ビッグデータ、人工知能 AI、モノのインターネットなどの最先端テクノロジーがハイテクの主流になりました。電子商取引ウェブサイト、顔認識、無人運転、スマートホーム、スマートシティなどの今日の時代のテクノロジーは、人々の日用品、食料、住居、交通手段を容易にするだけでなく、その舞台裏では常に大きな問題が存在します。さまざまなシステム プラットフォームによって収集、消去、分析されるデータの量が多く、低遅延、高スループット、データのセキュリティを確保することが特に重要です。Apache Avro 自体は、バイナリ送信のためにスキーマを通じてシリアル化されています。データの高速伝送を保証する一方で、データのセキュリティも確保します。avro は現在、さまざまな業界でますます広く使用されています。avro データをどのように処理および解析するかが特に重要です。この記事では、avro データを生成する方法を説明します。 avro データをシリアル化して分析に FlinkSQL を使用します。

この記事は avro 解析のデモです。現在、FlinkSQL は単純な avro データ解析にのみ適しています。複雑なネストされた avro データは当面サポートされていません。

シーンの紹介

この記事では主に次の 3 つの主要な内容を紹介します。

  • Avro データをシリアル化して生成する方法

  • Avro データを逆シリアル化して解析する方法

  • FlinkSQL を使用して Avro データを解析する方法

##前提条件

  • avro とは何かを理解するには、Apache avro 公式 Web サイトのクイック スタート ガイドを参照してください。

  • avro アプリケーション シナリオを理解する

操作手順

1. 新しい avro maven プロジェクトを作成し、pom 依存関係を構成します

Apache Avro データを解析する方法について話しましょう (例付きで説明)

pom ファイルの内容は次のとおりです:

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>

    <groupId>com.huawei.bigdata</groupId>
    <artifactId>avrodemo</artifactId>
    <version>1.0-SNAPSHOT</version>
    <dependencies>
        <dependency>
            <groupId>org.apache.avro</groupId>
            <artifactId>avro</artifactId>
            <version>1.8.1</version>
        </dependency>
        <dependency>
            <groupId>junit</groupId>
            <artifactId>junit</artifactId>
            <version>4.12</version>
        </dependency>
    </dependencies>

    <build>
        <plugins>
            <plugin>
                <groupId>org.apache.avro</groupId>
                <artifactId>avro-maven-plugin</artifactId>
                <version>1.8.1</version>
                <executions>
                    <execution>
                        <phase>generate-sources</phase>
                        <goals>
                            <goal>schema</goal>
                        </goals>
                        <configuration>
                            <sourceDirectory>${project.basedir}/src/main/avro/</sourceDirectory>
                            <outputDirectory>${project.basedir}/src/main/java/</outputDirectory>
                        </configuration>
                    </execution>
                </executions>
            </plugin>
            <plugin>
                <groupId>org.apache.maven.plugins</groupId>
                <artifactId>maven-compiler-plugin</artifactId>
                <configuration>
                    <source>1.6</source>
                    <target>1.6</target>
                </configuration>
            </plugin>
        </plugins>
    </build>

</project>

注: 上記の pom ファイルは、クラスへのパス、つまり

##p## が自動的に生成されるように構成されています。 #ro ject. basedir/s#rc/ma#in/avro/ and{project.basedir}/src/main/avro/and ##プロジェクト######。#

点击maven projects项目的compile进行编译,会自动在创建namespace路径和User类代码

Apache Avro データを解析する方法について話しましょう (例付きで説明)

4、序列化

创建TestUser类,用于序列化生成数据

User user1 = new User();
user1.setName("Alyssa");
user1.setFavoriteNumber(256);
// Leave favorite col or null

// Alternate constructor
User user2 = new User("Ben", 7, "red");

// Construct via builder
User user3 = User.newBuilder()
        .setName("Charlie")
        .setFavoriteColor("blue")
        .setFavoriteNumber(null)
        .build();

// Serialize user1, user2 and user3 to disk
DatumWriter<User> userDatumWriter = new SpecificDatumWriter<User>(User.class);
DataFileWriter<User> dataFileWriter = new DataFileWriter<User>(userDatumWriter);
dataFileWriter.create(user1.getSchema(), new File("user_generic.avro"));
dataFileWriter.append(user1);
dataFileWriter.append(user2);
dataFileWriter.append(user3);
dataFileWriter.close();

执行序列化程序后,会在项目的同级目录下生成avro数据

Apache Avro データを解析する方法について話しましょう (例付きで説明)

user_generic.avro内容如下:

Objavro.schema�{"type":"record","name":"User","namespace":"lancoo.ecbdc.pre","fields":[{"name":"name","type":"string"},{"name":"favorite_number","type":["int","null"]},{"name":"favorite_color","type":["string","null"]}]}

至此avro数据已经生成。

5、反序列化

通过反序列化代码解析avro数据

// Deserialize Users from disk
DatumReader<User> userDatumReader = new SpecificDatumReader<User>(User.class);
DataFileReader<User> dataFileReader = new DataFileReader<User>(new File("user_generic.avro"), userDatumReader);
User user = null;
while (dataFileReader.hasNext()) {
    // Reuse user object by passing it to next(). This saves us from
    // allocating and garbage collecting many objects for files with
    // many items.
    user = dataFileReader.next(user);
    System.out.println(user);
}

执行反序列化代码解析user_generic.avro

Apache Avro データを解析する方法について話しましょう (例付きで説明)

avro数据解析成功。

6、将user_generic.avro上传至hdfs路径

hdfs dfs -mkdir -p /tmp/lztest/

hdfs dfs -put user_generic.avro /tmp/lztest/

Apache Avro データを解析する方法について話しましょう (例付きで説明)

7、配置flinkserver

  • 准备avro jar包

将flink-sql-avro-*.jar、flink-sql-avro-confluent-registry-*.jar放入flinkserver lib,将下面的命令在所有flinkserver节点执行

cp /opt/huawei/Bigdata/FusionInsight_Flink_8.1.2/install/FusionInsight-Flink-1.12.2/flink/opt/flink-sql-avro*.jar /opt/huawei/Bigdata/FusionInsight_Flink_8.1.3/install/FusionInsight-Flink-1.12.2/flink/lib

chmod 500 flink-sql-avro*.jar

chown omm:wheel flink-sql-avro*.jar

Apache Avro データを解析する方法について話しましょう (例付きで説明)

  • 同时重启FlinkServer实例,重启完成后查看avro包是否被上传

    hdfs dfs -ls /FusionInsight_FlinkServer/8.1.2-312005/lib

Apache Avro データを解析する方法について話しましょう (例付きで説明)

8、编写FlinkSQL

CREATE TABLE testHdfs(
  name String,
  favorite_number int,
  favorite_color String
) WITH(
  &#39;connector&#39; = &#39;filesystem&#39;,
  &#39;path&#39; = &#39;hdfs:///tmp/lztest/user_generic.avro&#39;,
  &#39;format&#39; = &#39;avro&#39;
);CREATE TABLE KafkaTable (
  name String,
  favorite_number int,
  favorite_color String
) WITH (
  &#39;connector&#39; = &#39;kafka&#39;,
  &#39;topic&#39; = &#39;testavro&#39;,
  &#39;properties.bootstrap.servers&#39; = &#39;96.10.2.1:21005&#39;,
  &#39;properties.group.id&#39; = &#39;testGroup&#39;,
  &#39;scan.startup.mode&#39; = &#39;latest-offset&#39;,
  &#39;format&#39; = &#39;avro&#39;
);
insert into
  KafkaTable
select
  *
from
  testHdfs;

Apache Avro データを解析する方法について話しましょう (例付きで説明)

保存提交任务

9、查看对应topic中是否有数据

Apache Avro データを解析する方法について話しましょう (例付きで説明)

FlinkSQL解析avro数据成功。

【推荐:Apache使用教程

以上がApache Avro データを解析する方法について話しましょう (例付きで説明)の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は掘金社区で複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
Apacheを定義したものは何ですか?そのコア機能Apacheを定義したものは何ですか?そのコア機能May 09, 2025 am 12:21 AM

Apacheのコア機能はモジュラー設計と高いカスタマイズであり、さまざまなWebサービスのニーズを満たすことができます。 1。モジュラー設計により、さまざまなモジュールをロードすることにより、拡張機能が可能になります。 2。複数のオペレーティングシステムをサポートし、さまざまな環境に適しています。 3.マルチプロセス、マルチスレッド、イベント駆動型モデルはパフォーマンスを改善します。 4.基本的な使用法には、仮想ホストとドキュメントルートディレクトリの構成が含まれます。 5.高度な使用には、URLの書き換え、負荷分散、逆プロキシが含まれます。 6.一般的なエラーは、構文チェックとログ分析を介してデバッグできます。 7.パフォーマンスの最適化には、MPM設定の調整とキャッシュの有効化が含まれます。

Apacheの継続的な使用:Webホスティングおよびそれ以降Apacheの継続的な使用:Webホスティングおよびそれ以降May 08, 2025 am 12:15 AM

Apacheを最新のWeb環境でまだ人気があるのは、その強力な機能と柔軟性です。 1)モジュラー設計により、セキュリティ認証や負荷分散などのカスタム関数が可能になります。 2)複数のオペレーティングシステムをサポートして、人気を高めます。 3)さまざまなアプリケーションシナリオに適した、同時リクエストを効率的に処理します。

Apache:オープンソースから業界標準までApache:オープンソースから業界標準までMay 07, 2025 am 12:05 AM

Apacheがオープンソースプロジェクトから業界標準に発展した理由には、次のものがあります。1)コミュニティ主導のグローバル開発者が参加するように誘導します。 2)インターネット標準に準拠した標準化と互換性。 3)ビジネスサポートとエコシステム、およびエンタープライズレベルの市場サポートの取得。

Apacheの遺産:Webホスティングへの影響Apacheの遺産:Webホスティングへの影響May 06, 2025 am 12:03 AM

ApacheのWebHostingへの影響は、主にオープンソースの機能、強力な機能、柔軟性に反映されています。 1)オープンソースの機能WebHostingのしきい値が低い。 2)強力な機能と柔軟性により、大規模なWebサイトや企業にとって最初の選択肢になります。 3)仮想ホスト関数はコストを節約します。パフォーマンスは高い並行性条件で低下する可能性がありますが、Apacheは継続的な最適化を通じて競争力を維持し続けています。

Apache:Webへの歴史と貢献Apache:Webへの歴史と貢献May 05, 2025 am 12:14 AM

もともと1995年に生まれたApacheは、NCSAHTTPDサーバーを改善し、世界で最も広く使用されているWebサーバーになるために開発者グループによって作成されました。 1。1995年に発信され、NCSAHTTPDサーバーの改善を目指しています。 2。Webサーバーの標準を定義し、オープンソースの動きの開発を促進します。 3. TomcatやKafkaなどの重要なサブプロジェクトを育てました。 4.クラウドコンピューティングとコンテナテクノロジーの課題に直面して、将来のクラウドネイティブテクノロジーとの統合に焦点を当てます。

Apacheの影響:インターネットの形成Apacheの影響:インターネットの形成May 04, 2025 am 12:05 AM

Apacheは、安定したWebサーバーインフラストラクチャを提供し、オープンソース文化を促進し、重要なプロジェクトをインキュベートすることにより、インターネットを形作りました。 1)Apacheは、安定したWebサーバーインフラストラクチャを提供し、Webテクノロジーのイノベーションを促進します。 2)Apacheはオープンソース文化の開発を促進し、ASFはHadoopやKafkaなどの重要なプロジェクトをインキュベートしました。 3)パフォーマンスの課題にもかかわらず、Apacheの将来はまだ希望に満ちており、ASFは新しいテクノロジーを立ち上げ続けています。

Apacheの遺産:Webサーバーへの影響を見るApacheの遺産:Webサーバーへの影響を見るMay 03, 2025 am 12:03 AM

1995年にボランティアによる作成以来、ApachehttpserverはWebサーバーフィールドに大きな影響を与えてきました。 1. NCSAHTTPDへの不満から生じ、より安定した信頼性の高いサービスを提供します。 2。Apache Software Foundationの設立は、その変革を生態系に示します。 3.そのモジュラー設計とセキュリティは、Webサーバーの柔軟性とセキュリティを強化します。 4.市場シェアの減少にもかかわらず、Apacheは依然として最新のWebテクノロジーと密接に関連しています。 5。構成の最適化とキャッシュを通じて、Apacheはパフォーマンスを向上させます。 6.エラーログとデバッグモードは、一般的な問題を解決するのに役立ちます。

Apacheの目的:Webコンテンツの提供Apacheの目的:Webコンテンツの提供May 02, 2025 am 12:23 AM

Apachehttpserverは、モジュラー設計、仮想ホスティング機能、パフォーマンスの最適化を通じて、最新のインターネット環境でWebコンテンツを効率的に提供し続けています。 1)モジュラー設計により、URL書き換えなどの関数を追加してWebサイトSEOのパフォーマンスを改善できます。 2)仮想ホスティング機能は、1つのサーバーで複数のWebサイトをホストし、コストを節約し、管理を簡素化します。 3)マルチスレッドとキャッシュの最適化により、Apacheは多数の同時接続を処理し、応答速度とユーザーエクスペリエンスを改善できます。

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

Dreamweaver Mac版

Dreamweaver Mac版

ビジュアル Web 開発ツール

DVWA

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール