ホームページ  >  記事  >  バックエンド開発  >  Go での AWS Glue の使用: 完全ガイド

Go での AWS Glue の使用: 完全ガイド

王林
王林オリジナル
2023-06-17 19:31:381625ブラウズ

AWS Glue は、データ統合と ETL (抽出、変換、読み込み) パイプラインを簡単に管理できるフルマネージドのクラウド データ統合サービスです。スケーラブルで弾力性があり、可用性が高く、ローカル データだけでなく他の AWS サービスとも連携します。この記事では、Go 言語で AWS Glue を使用する方法を紹介します。

  1. 環境セットアップ

AWS Glue の使用を開始する前に、いくつかの環境をセットアップする必要があります。まず、AWS CLI をインストールする必要があります。 AWS CLI は公式ウェブサイトからダウンロードしてインストールするか、次のコマンドを使用してコマンドラインからインストールできます:

pip install awscli

次に、AWS アカウントを作成し、アクセス キーとシークレット アクセス キーを取得する必要があります。 。この情報は、AWS との通信に使用されます。次の手順で AWS アカウントを作成できます。

  • AWS の公式 Web サイトにアクセスし、[AWS アカウントの作成] ボタンをクリックし、画面の指示に従って関連情報を入力します。
  • 自分に合ったプランを選択し、支払いを完了してください。
  • IAM (Identity and Access Management) コンソールで、新しいユーザーを作成し、Glue へのアクセス許可を付与します。キー ID とアクセス キーを必ず書き留めてください。

最後に、Go 言語開発環境をセットアップする必要があります。公式 Web サイトから Go 言語をダウンロードしてインストールすることも、次のコマンドを使用してコマンド ラインからインストールすることもできます:

brew install go
  1. データ リポジトリとテーブルの作成

AWS Before Glue を使用するには、データ リポジトリとデータ テーブルを作成する必要があります。これを行うには、次の手順に従います。

  • AWS マネジメント コンソールにログインし、AWS Glue コンソールに移動します。
  • [データ リポジトリ] タブをクリックし、[新しいデータ リポジトリ] ボタンをクリックします。
  • データ リポジトリの名前と説明を入力し、[作成]ボタンをクリックします。
  • [テーブル]タブをクリックし、[新しいテーブル]ボタンをクリックします。
  • 名前、説明、データ ソース、スキーマなどのテーブルの詳細を入力します。
  • [次へ]をクリックして、入出力データ形式を必要な形式に設定します。
  • [次へ] をクリックして、ETL スクリプトとその他の詳細設定をセットアップします。
  • [完了]ボタンをクリックしてテーブルを作成します。

注: AWS Glue Crawler を使用してスキーマと構造を推論し、データ間の関係を発見するのに役立ちます。これにより、AWS Glue の使用をより迅速に開始できるようになります。

  1. AWS Glue API クライアントの設定

Go 言語を使用して AWS Glue と通信する前に、AWS Glue API クライアントを使用する必要があります。次のコマンドを使用して、AWS SDK for Go をプロジェクトにインストールできます:

go get github.com/aws/aws-sdk-go/aws
go get github.com/aws/aws-sdk-go/aws/session
go get github.com/aws/aws-sdk-go/service/glue

次に、AWS セッションを作成する必要があります。次のコードを使用してセッションを作成できます:

sess := session.Must(session.NewSessionWithOptions(session.Options{
    SharedConfigState: session.SharedConfigEnable,
}))

次に、AWS Glue サービス クライアントを作成する必要があります。次のコードを使用してサービス クライアントを作成できます:

svc := glue.New(sess)

これで、AWS Glue サービスを使用する準備が整いました。

  1. AWS Glue API の使用

AWS Glue API を使用すると、データテーブルの作成、更新、削除、ETL ジョブの実行などのさまざまな操作を実行できます。一般的なタスクの例をいくつか示します。

  • データ リポジトリの一覧表示

次のコードを使用して、すべてのデータ リポジトリを一覧表示できます。

params := &glue.GetDatabasesInput{}
resp, err := svc.GetDatabases(params)
if err != nil {
    fmt.Println(err.Error())
} else {
    fmt.Println(resp)
}
  • テーブルのデータ構造を取得する

次のコードを使用して、データ テーブルのデータ構造を取得できます:

params := &glue.GetTableInput{
    DatabaseName: aws.String("my_database"),
    Name:         aws.String("my_table"),
}
resp, err := svc.GetTable(params)
if err != nil {
    fmt.Println(err.Error())
} else {
    fmt.Println(resp)
}
  • ETL ジョブを実行します

次のコードを使用して ETL ジョブを実行できます:

params := &glue.StartJobRunInput{
    JobName: aws.String("my_job"),
}
resp, err := svc.StartJobRun(params)
if err != nil {
    fmt.Println(err.Error())
} else {
    fmt.Println(resp)
}
  • データ テーブルの削除

次のコードを使用してデータ テーブルを削除できます:

params := &glue.DeleteTableInput{
    DatabaseName: aws.String("my_database"),
    Name:         aws.String("my_table"),
}
_, err := svc.DeleteTable(params)
if err != nil {
    fmt.Println(err.Error())
} else {
    fmt.Println("Table deleted")
}
  1. 概要

AWS Glue は、データ統合と ETL パイプラインを簡単に管理できる強力なクラウド データ統合サービスです。 Go 言語を使用すると、AWS Glue API を使用したさまざまな操作を簡単に実装できます。このガイドの手順を実行すると、データ リポジトリとテーブルを作成し、AWS Glue API を使用してさまざまなタスクを実行できるようになります。

以上がGo での AWS Glue の使用: 完全ガイドの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。