元の言葉を書き直しました: 予期せぬ発見は、当初バグとみなされていたものが、実際には Protobuf の設計上の機能であるということです。-Python チュートリアル-php.cn

ホームページ

バックエンド開発

Python チュートリアル

元の言葉を書き直しました: 予期せぬ発見は、当初バグとみなされていたものが、実際には Protobuf の設計上の機能であるということです。

PHPz

May 09, 2023 pm 04:22 PM

分割protobuffeature

みなさんこんにちは、私はすごいです。

最近、私たちのプロジェクトでは、データを保存するためのキャリアとして protobuf 形式を使用しています。うっかり大きな穴を自分で埋めてしまいましたが、発見するまでに時間がかかりました。

protobuf の概要

protobuf の正式名は Protocol Buffers で、Google によって開発され、クロス言語、クロスプラットフォーム、スケーラブルなシリアル化データメカニズムです。 XML に似ていますが、XML よりも小さく、高速で、シンプルです。データの構造を一度定義するだけで、その生成ツールを使用して、シリアル化および逆シリアル化操作を含むソースコードを生成できます。構造化データは、さまざまなプログラミング言語を使用して、さまざまなデータストリームに対して簡単に書き込みおよび読み取りを行うことができます。

proto2 バージョンは、Java、Python、Objective-C、および C でのコード生成をサポートしています。新しい proto3 言語バージョンでは、Kotlin、Dart、Go、Ruby、PHP、C# など多くの言語も使用できます。＃＃＃＃＃＃＃＃＃どうやって分かったの？

新しいプロジェクトでは、protobuf 形式を使用して実行されたプロジェクトのデータを保存します。このようにして、デバッグプロセス中に、現場で記録されたデータに基づいてローカルデバッグを実行することがあります。

message ImageData {
// ms
int64 timestamp = 1;
int32 id = 2;
Data mat = 3;
}

message PointCloud {
// ms
int64 timestamp = 1;
int32 id = 2;
PointData pointcloud = 3;
}

message State {
// ms
int64 timestamp = 1;
string direction = 2;
}

message Sensor {
repeated PointCloud point_data = 1;
repeated ImageData image_data = 2;
repeated State vehicle_data = 3;
}

このようなデータセットを定義し、保存する際、Sensor の 3 つのデータソースのフレームレートが異なるため、実際には 1 つの Sensor には 1 セットのデータしか含まれません。 , 2種類のデータは付属しておりません。

単一パックのみを録音した場合には問題は発生しませんでした。単一のパケットを長時間記録できないと感じるまでは、パケットを分割する解決策を見つける必要があります。

その時は「これは簡単だろう」と思い、パッケージが 500M に達したら、それ以降のデータを新しいパッケージに保存するように設定しました。とてもスムーズに書き終えて、データ記録のために現場に置きました。しばらく録音した後、パッケージを持ち帰り、新しいプログラムのテストをシミュレートしました。一部のパッケージのデータ解析に問題があることが判明しました。プログラムが実行途中で停止してしまいます。多くのテストを行った結果、一部のパッケージにこの問題があることが判明しました。

当初私たちが疑ったのは、ファイルサイズの判断方法が間違っており、外注先に影響を及ぼしたのではないかということでした。ファイルサイズを判断する際にファイルが開かれるためです。しかし、ファイルを開けない他の方法がいくつかあると判断した結果、分割が実行されました。記録されたパッケージの一部で依然として問題が発生しました。

そのとき初めて、protobuf にはデータを保存するための特別な要件があるのではないかと思いました。その後、いくつかの記事を読んで、protobuf では複数のデータセットを 1 つのファイルに保存するために識別子が必要であることを知りました。そうしないと、ファイルから解析を戻すときに、protobuf は単一データのストップキャラクタがどこにあるのか認識できず、データ解析エラーが発生します。

ここで、この穴が現れます。

一連のデータを区切り操作を行わずに 1 つのパッケージに保存します。 protobuf が解析すると、ファイル内のすべての内容が 1 つのセンサーに解析されます。センサーにはすべてのデータが含まれており、protobuf は保存されているすべてのデータをアクティブにマージします。

このとき、過去にシングルパケットを記録したときはすべて正しいデータだったことがわかり、本当に幸運でした。 protobuf はたまたま正常に解析されました。

どうすれば解決できますか?

protobuf がこのように動作することがわかったので、あとは protobuf を分割する方法を知る必要があるだけです。この方法を使用する私たちのような人が少なすぎるため、この方法を見つけるのは本当に困難です。中国語の検索ではこのコンテンツがまったく見つかりません。おそらく誰もがデータの保存に protobuf を使用していないでしょう。誰もが使用する方法は、複数のサービス間の対話のシナリオであるはずです。

stackoverflow のいくつかの回答を通じて最終的に答えを見つけました。回答から、このソリューションは protobuf 3.3 に正式にマージされただけであることがわかりました。この機能は実際にはあまり使われないようです。

bool SerializeDelimitedToOstream(const MessageLite& message,
 std::ostream* output);
bool ParseDelimitedFromZeroCopyStream(
MessageLite* message, io::ZeroCopyInputStream* input, bool* clean_eof);

この 2 つのメソッドにより、データフローに従ってファイルを 1 つずつ保存し、読み取ることができます。データのマージや読み取りについて心配する必要はもうありません。

もちろん、この方法で保存されたデータは、元の解析方法では解析できず、ストレージの形式は完全に変更されています。このメソッドは、最初にバイナリデータのサイズを保存し、次にバイナリデータを保存します。

結論

何度も試行錯誤した結果、最終的にこのセグメンテーションの落とし穴を解決することができました。利用シーンが比較的ニッチなため、まったく見つからない情報が多くなる可能性があります。私はソースコードを自分で調べてこれらの問題を発見しました。 C のソースコードは非常に読みにくく、テンプレートメソッドやテンプレートクラスが多数あるため、細部を見落としがちです。最後にC#のコードを見て最終的に確認しました。

以上が元の言葉を書き直しました: 予期せぬ発見は、当初バグとみなされていたものが、実際には Protobuf の設計上の機能であるということです。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

Pythonの学習：2時間の毎日の研究で十分ですか？Apr 18, 2025 am 12:22 AM

Pythonを1日2時間学ぶだけで十分ですか？それはあなたの目標と学習方法に依存します。 1）明確な学習計画を策定し、2）適切な学習リソースと方法を選択します。3）実践的な実践とレビューとレビューと統合を練習および統合し、統合すると、この期間中にPythonの基本的な知識と高度な機能を徐々に習得できます。

Web開発用のPython：主要なアプリケーションApr 18, 2025 am 12:20 AM

Web開発におけるPythonの主要なアプリケーションには、DjangoおよびFlaskフレームワークの使用、API開発、データ分析と視覚化、機械学習とAI、およびパフォーマンスの最適化が含まれます。 1。DjangoandFlask Framework：Djangoは、複雑な用途の迅速な発展に適しており、Flaskは小規模または高度にカスタマイズされたプロジェクトに適しています。 2。API開発：フラスコまたはdjangorestFrameworkを使用して、Restfulapiを構築します。 3。データ分析と視覚化：Pythonを使用してデータを処理し、Webインターフェイスを介して表示します。 4。機械学習とAI：Pythonは、インテリジェントWebアプリケーションを構築するために使用されます。 5。パフォーマンスの最適化：非同期プログラミング、キャッシュ、コードを通じて最適化

Python vs. C：パフォーマンスと効率の探索Apr 18, 2025 am 12:20 AM

Pythonは開発効率でCよりも優れていますが、Cは実行パフォーマンスが高くなっています。 1。Pythonの簡潔な構文とリッチライブラリは、開発効率を向上させます。 2.Cのコンピレーションタイプの特性とハードウェア制御により、実行パフォーマンスが向上します。選択を行うときは、プロジェクトのニーズに基づいて開発速度と実行効率を比較検討する必要があります。

Python in Action：実世界の例Apr 18, 2025 am 12:18 AM

Pythonの実際のアプリケーションには、データ分析、Web開発、人工知能、自動化が含まれます。 1）データ分析では、PythonはPandasとMatplotlibを使用してデータを処理および視覚化します。 2）Web開発では、DjangoおよびFlask FrameworksがWebアプリケーションの作成を簡素化します。 3）人工知能の分野では、TensorflowとPytorchがモデルの構築と訓練に使用されます。 4）自動化に関しては、ファイルのコピーなどのタスクにPythonスクリプトを使用できます。

Pythonの主な用途：包括的な概要Apr 18, 2025 am 12:18 AM

Pythonは、データサイエンス、Web開発、自動化スクリプトフィールドで広く使用されています。 1）データサイエンスでは、PythonはNumpyやPandasなどのライブラリを介してデータ処理と分析を簡素化します。 2）Web開発では、DjangoおよびFlask Frameworksにより、開発者はアプリケーションを迅速に構築できます。 3）自動化されたスクリプトでは、Pythonのシンプルさと標準ライブラリが理想的になります。

Pythonの主な目的：柔軟性と使いやすさApr 17, 2025 am 12:14 AM

Pythonの柔軟性は、マルチパラダイムサポートと動的タイプシステムに反映されていますが、使いやすさはシンプルな構文とリッチ標準ライブラリに由来しています。 1。柔軟性：オブジェクト指向、機能的および手続き的プログラミングをサポートし、動的タイプシステムは開発効率を向上させます。 2。使いやすさ：文法は自然言語に近く、標準的なライブラリは幅広い機能をカバーし、開発プロセスを簡素化します。

Python：汎用性の高いプログラミングの力Apr 17, 2025 am 12:09 AM

Pythonは、初心者から上級開発者までのすべてのニーズに適した、そのシンプルさとパワーに非常に好まれています。その汎用性は、次のことに反映されています。1）学習と使用が簡単、シンプルな構文。 2）Numpy、Pandasなどの豊富なライブラリとフレームワーク。 3）さまざまなオペレーティングシステムで実行できるクロスプラットフォームサポート。 4）作業効率を向上させるためのスクリプトおよび自動化タスクに適しています。

1日2時間でPythonを学ぶ：実用的なガイドApr 17, 2025 am 12:05 AM

はい、1日2時間でPythonを学びます。 1.合理的な学習計画を作成します。2。適切な学習リソースを選択します。3。実践を通じて学んだ知識を統合します。これらの手順は、短時間でPythonをマスターするのに役立ちます。

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

ドリームウィーバー CS6

ビジュアル Web 開発ツール

AtomエディタMac版ダウンロード

最も人気のあるオープンソースエディター

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、