ホームページ  >  記事  >  画像のデジタル化中に使用されるエンコード方法によって、結果として得られるデジタル画像が決まります。

画像のデジタル化中に使用されるエンコード方法によって、結果として得られるデジタル画像が決まります。

青灯夜游
青灯夜游オリジナル
2022-08-12 16:38:237871ブラウズ

は、結果として得られるデジタル画像の「ファイル形式」を決定します。デジタル化された画像データは非常に量が多く、その情報量を圧縮するためには符号化技術が必要であり、画像の伝送や保存においてはある意味符号化・圧縮技術が鍵となります。画像圧縮を標準化するために、国際電気通信連合、国際標準化機構 ISO、および国際電気標準会議 IEC は、静止画および動画の符号化に関する一連の国際標準を策定し、今後も策定し続けています。承認された標準には、主に JPEG 規格、 MPEG規格、H.261待ち。

画像のデジタル化中に使用されるエンコード方法によって、結果として得られるデジタル画像が決まります。

このチュートリアルの動作環境: Windows 7 システム、Dell G3 コンピューター。

画像デジタル化プロセスで使用されるエンコード方法によって、結果として得られるデジタル画像の「ファイル形式」が決まります。

画像デジタル化は、空間分布と輝度値が連続的に分布するアナログ画像を、サンプリングと定量化を通じてコン​​ピュータで処理できるデジタル画像に変換するプロセスです。

写真をコンピュータで処理できる形式、つまりデジタル画像に変換するプロセス。

画像デジタル化の具体的なプロセス

コンピューターで画像を処理するには、まず実際の画像 (写真、図鑑、本、図面など)は、コンピュータが受け入れられる表示および保存形式にデジタル変換され、コンピュータによって分析および処理されます。画像のデジタル化プロセスは、主にサンプリング、量子化、符号化の 3 つのステップに分かれています。

サンプリング

サンプリングの本質は、画像を記述するために使用されるポイントの数です。サンプリング結果の品質は、前述の画像解像度によって測定されます。簡単に言うと、二次元空間の連続した画像を縦横に等間隔に長方形の網目構造に分割し、形成された小さな正方形をピクセルと呼びます。画像は有限ピクセルのセットにサンプリングされます。たとえば、解像度が 640*480 の画像は、画像が 640*480=307200 ピクセルで構成されていることを意味します。

下の図に示すように、左の画像がサンプリング対象のオブジェクト、右の画像がサンプリングされた画像であり、それぞれの小さなグリッドがピクセルです。

画像のデジタル化中に使用されるエンコード方法によって、結果として得られるデジタル画像が決まります。

サンプリング周波数とは、1 秒間のサンプル数を指し、サンプリング ポイント間の間隔の大きさを反映します。サンプリング周波数が高いほど、取得される画像サンプルはより現実的になり、画像の品質は高くなりますが、必要なストレージの量は増加します。

サンプリングの際、サンプリング ポイント間隔サイズの選択は非常に重要であり、サンプリングされた画像が元の画像をどの程度忠実に反映できるかが決まります。一般に、画像が複雑になり、元の画像の色が豊かになるほど、サンプリング間隔は小さくする必要があります。 2 次元画像のサンプリングは 1 次元の一般化であるため、信号サンプリング定理によれば、サンプリング サンプルから画像を正確に復元するには、画像サンプリングのナイキスト定理を得ることができます。画像サンプリングの周波数は、ソース画像の最高周波数成分の 2 倍以上。

サンプリング周波数とは、1 秒あたりのサンプル数を指し、サンプリング ポイント間の間隔を反映します。サンプリング周波数が高いほど、取得される画像サンプルはより現実的になり、画像の品質は高くなりますが、必要なストレージの量は増加します。

サンプリングの際、サンプリング ポイント間隔サイズの選択は非常に重要であり、サンプリングされた画像が元の画像をどの程度忠実に反映できるかが決まります。一般に、画像が複雑になり、元の画像の色が豊かになるほど、サンプリング間隔は小さくする必要があります。 2 次元画像のサンプリングは 1 次元の一般化であるため、信号のサンプリング原理によれば、サンプリング サンプルから画像を正確に復元するには、画像サンプリングのナイキスト定理が得られます。つまり、画像サンプリングの周波数が高くなければなりません。ソース画像の最高周波数成分の 2 倍以上。 [3]

量子化

量子化とは、画像サンプリング後の各点を表すために使用される値の範囲を指します。定量化の結果は、画像が対応できる色の総数であり、サンプリングの品質を反映します。

例: ポイントが 4 ビットで保存されている場合、画像は 16 色しか持てないことを意味します。ポイントが 16 ビットで保存されている場合、216=65536 色があります。したがって、量子化ビット数はますます大きくなり、画像の色数が増加し、自然により詳細な画像効果を生み出すことができます。ただし、より多くのストレージスペースも必要になります。どちらの場合も基本的な問題は、視覚効果とストレージ スペースのトレードオフです。

白黒のグレースケール写真があるとします。そのグレースケールの水平方向と垂直方向の変化は連続的であるため、無数のピクセルがあると考えられ、任意の点でのグレースケール値は無限に存在します。黒から白までの値。このシミュレートされた画像は、水平方向と垂直方向に沿って等間隔でサンプリングすることにより、ほぼ有限数のピクセルに分解でき、各ピクセルの値はピクセルのグレースケール (明るさ) を表します。グレースケールを量子化して、その値が可能な値の制限された数になるようにします。

このようなサンプリングと量子化を通じて得られる画像は、空間に離散的に分布する限られた数のピクセルと、グレー値で離散的に取り得る限られた数の離散的な値であり、これをデジタル画像と呼びます。十分な水平および垂直サンプリング ポイントがあり、量子化ビットの数が十分に大きい限り、デジタル画像の品質は元のアナログ画像と同等になります。

量子化中に決定される離散値の数を量子化系列と呼びます。量子化された色値 (または輝度値) を表現するために必要な 2 進数の桁数を量子化語長と呼び、一般に 8 ビット、16 ビット、24 ビット以上の量子化語長を使用して色を表現できます。量子化語長が長いほど、元の画像の色をより正確に反映できますが、得られるデジタル画像の容量も大きくなります。

例: 下の図では、線分 AB (左の図) に沿った連続画像のグレー値の曲線 (右の図) は、最大の白値と最小の黒値をとります。

画像のデジタル化中に使用されるエンコード方法によって、結果として得られるデジタル画像が決まります。

最初にサンプリング: 線分 AB に沿って等間隔でサンプリングが実行されます。下の左の図に示すように、サンプリングされた値はグレー値で連続的に分布します。

画像のデジタル化中に使用されるエンコード方法によって、結果として得られるデジタル画像が決まります。

##再量子化: 上の右の図に示すように、連続グレー値がデジタル化されます (グレー スケールの 8 レベル)。

圧縮符号化

デジタル化された画像データは膨大な量となるため、情報量を圧縮するには符号化技術が必要です。ある意味、符号化と圧縮の技術は画像の送信と保存の鍵となります。画像圧縮に適用される成熟したコーディング アルゴリズムが多数あります。一般的なものには、画像予測符号化、変換符号化、フラクタル符号化、ウェーブレット変換画像圧縮符号化などが含まれます。

送信または保存される画像情報に高速圧縮が必要な場合、複雑な画像符号化技術を採用する必要があります。しかし、基礎となる共通の規格がなければ、異なるシステム間の互換性は得られず、各符号化方式の内容が全く同じでなければ、システム間の接続は非常に困難になります。

画像圧縮を標準化するために、1990 年代以降、国際電気通信連合 (ITU)、国際標準化機構 ISO、および国際電気標準会議 IEC は、画像圧縮に関する一連の国際標準を策定し、策定し続けています。承認されている規格には主にJPEG規格、MPEG規格、H.261などが含まれます。

#エンコーディングの比較

BMP 画像ファイル形式

BMP はハードウェア デバイスに依存しない画像です。非常に広く使用されているファイル形式。ビットマップ形式の保存形式を使用し、オプションの画像深度を除いて他の圧縮を使用しないため、BMP ファイルは多くのスペースを占有します。

BMP ファイルの画像深度は、lbit、4bit、8bit、24bit から選択できます。 BMP ファイルにデータが保存される場合、画像は左から右、下から上にスキャンされます。 BMP ファイル形式は、Windows 環境でグラフ関連のデータを交換するための標準であるため、Windows 環境で実行されるすべてのグラフィックおよび画像ソフトウェアは BMP 画像形式をサポートしています。

一般的な BMP 画像ファイルは、BMP 画像ファイルの種類、表示内容、その他の情報が含まれるビットマップ ファイル ヘッダー データ構造、幅、 BMP画像の表示内容等、高圧縮方式、色等の情報を定義します。

PCX イメージ ファイル形式

PCX イメージ ファイルの形成には開発プロセスがあります。 PCX の最初のプロトタイプは、ZSOFT が発売した PC PAINBRUSH と呼ばれる商用ペイント ソフトウェア パッケージに登場しました。その後、Microsoft によって Windows 環境に移植され、Windows システムのサブ機能になりました。

は、Microsoft Windows 3.1 で初めて広く使用されました。Windows の人気とアップグレードに伴い、PCX は、その強力な画像処理機能と相まって、GIF、TIFF、および BMP 画像ファイル形式とともにますます使用されるようになりました。は多くのグラフィックスおよび画像ソフトウェア ツールでサポートされており、人々の注目がますます高まっています。 PCX はカラー イメージをサポートする最も初期のファイル形式で、現在は最大 256 色をサポートしています。

PCX の設計者は、カラー イメージ ファイル形式を事前に導入するというビジョンを持っており、カラー イメージ ファイル形式は現在非常に人気のあるイメージ ファイル形式になっています。 PCX 画像ファイルは、ファイルヘッダーと実際の画像データで構成されます。ファイルヘッダは128バイトで構成されており、画像表示デバイスのバージョン情報や水平・垂直解像度、カラーパレットなどの情報が記述されており、実際の画像データでは画像データの種類や色の種類を表します。

PCX 画像ファイルのデータは、PCXREL テクノロジーを使用して圧縮された画像データです。 PCX は、PC ペイントブラシの画像ファイル形式です。 PCX の画像深度は 1、4、8 ビットから選択できます。このファイル形式は以前に登場したため、True Color をサポートしていません。 PCX ファイルは RLE ランレングス エンコーディングを使用し、圧縮された画像データがファイル本体に格納されます。

したがって、収集した画像データを PCX ファイル形式に書き込む場合は、RLE エンコードする必要があります。また、PCX ファイルを読み取る場合は、さらに表示および処理する前に、まず RLE デコードする必要があります。

TIFF 画像ファイル形式

TIFF (TaglmageFileFormat) 画像ファイルは、デスクトップ パブリッシング システム用に Aldus と Microsoft によって開発された比較的一般的な画像ファイル形式です。 TIFF 形式は柔軟で変更可能であり、次の 4 つの異なる形式が定義されています: TIFF-B はバイナリ イメージに適しており、TIFF-G は白黒のグレースケール イメージに適しており、TIFF-P はパレットを備えたカラー イメージに適しており、TIFF- R は RGB トゥルー カラー イメージに適しています。

TIFF は、RGB 非圧縮、RLE 圧縮、JPEG 圧縮など、複数のエンコード方式をサポートしています。 TIFF は既存の画像ファイル形式の中で最も複雑で、拡張性、利便性、変更性が高く、IBM PC などの環境で実行される画像編集プログラムに提供できます。

TIFF イメージ ファイルは、ファイル ヘッダー、IFD と呼ばれるマーク ポインターを含む 1 つ以上のディレクトリ、およびデータ自体の 3 つのデータ構造で構成されます。 TIFF イメージ ファイルの最初のデータ構造は、イメージ ファイル ヘッダー (IFH) と呼ばれます。

この構造は、TIFF ファイル内で位置が固定されている唯一の部分です。IFD 画像ファイル ディレクトリは、可変バイト長の情報ブロックです。タグ マークは、TIFF ファイルのコア部分です。画像内ファイル ディレクトリ 使用されるすべてのイメージ パラメータは で定義されており、ディレクトリ内の各ディレクトリ エントリにはイメージのパラメータが含まれています。

GIF ファイル形式

GIF (Graphics Interchange Format) の本来の意味は「画像交換形式」で、1987 年に CompuServe によって開発された画像ファイル形式です。 GIFファイルのデータは、LZWアルゴリズムに基づく連続階調可逆圧縮形式です。その圧縮率は通常約 50% であり、どのアプリケーションにも属しません。現在、ほぼすべての関連ソフトウェアがこれをサポートしており、GIF 画像ファイルを使用するパブリック ドメインのソフトウェアが多数あります。

GIF 画像ファイルのデータは圧縮されており、可変長などの圧縮アルゴリズムが使用されています。したがって、GIF の画像深度は 1 ビットから 8 ビットの範囲になります。つまり、GIF は最大 256 色の画像をサポートします。

GIF 形式のもう 1 つの特徴は、複数のカラー画像を 1 つの GIF ファイルに格納できることであり、1 つのファイルに格納された複数の画像データを 1 つずつ読み出して画面に表示すると、最も単純なアニメーションが構成されます。 。

GIF 画像はインターレース ラインで保存され、デコードと表示を同時に行うときに 4 つのパスでスキャンできるため、GIF デコードは高速になります。最初のスキャンでは画像全体の 8 分の 1 しか表示されず、2 回目のスキャンでは画像全体の 1/4 しか表示されませんでしたが、すでに画像全体の概要が表示されていました。

GIF画像を表示する際、インターレース画像のほうが他の画像より速く表示されているように感じられますが、これがインターレース画像の利点です。

JPEGファイル形式

JPEGはJoint Photographic Experts Group(ジョイント・フォトグラフィック・エキスパート・グループ)の略称で、ファイル拡張子は「.jpg」または「.jpeg」です。 " は、最も一般的に使用されている画像ファイル形式です。ソフトウェア開発協会によって開発されました。これは、画像を小さな記憶領域に圧縮できる非可逆圧縮形式です。画像内の繰り返しのデータや重要でないデータは失われるため、画像データが破損しやすくなります。

特に圧縮率が高すぎると、最終解凍後に復元される画像の品質が大幅に低下するため、高画質を追求する場合は、あまり高い圧縮率を使用することはお勧めできません。しかし、JPEG 圧縮技術は非常に高度であり、非可逆圧縮を使用して冗長な画像データを削除し、非常に高い圧縮率を取得しながら非常に豊かで鮮明な画像を表示することができます。つまり、最小限のディスク容量でより鮮明な画像を得ることができます。 . 画質が良い。

JPEG は、画質を調整する機能があり、さまざまな圧縮率でファイルを圧縮でき、複数の圧縮レベルをサポートする非常に柔軟な形式です。圧縮率は通常 10:1 ~ 40 です。 1 の間で、圧縮率が大きいほど品質は低くなり、逆に圧縮率が小さいほど品質は高くなります。

たとえば、1.37Mb BMP ビットマップ ファイルは 20.3KB に圧縮できます。もちろん、画質とファイルサイズのバランスを見つけることもできます。 JPEG 形式は主に高周波情報を圧縮し、色情報をよく保持します。インターネットでの使用に適しており、画像の送信時間を短縮でき、24 ビットのトゥルー カラーをサポートでき、連続階調が必要な画像にもよく使用されます。

JPEG 形式は、現在インターネット上で最も人気のある画像形式です。ファイルを最小の形式に圧縮できる形式です。Photoshop ソフトウェアで JPEG 形式で保存すると、次のように 11 レベルの圧縮が提供されます。レベル0~10。このうちレベル 0 は圧縮率が最も高く、画質は最も悪くなります。実質的に詳細を失わずにレベル 10 の品質で保存する場合でも、圧縮率は 5:1 に達することがあります。 BMP 形式で保存すると 4.28MB の画像ファイルが得られますが、JPG 形式で保存するとファイルサイズは 178KB となり、圧縮率は 24:1 になります。

多くの比較を行った結果、レベル 8 圧縮を使用することが、ストレージ容量と画質の両方にとって最適な比率です。 JPEG 形式は、特にインターネットや CD-ROM リーダーで広く使用されています。

現在、すべてのブラウザは画像形式 JPEG をサポートしています。これは、JPEG 形式のファイル サイズが小さく、ダウンロード速度が速いためです。 JPEG のアップグレード版である JPEG2000 は、JPEG よりも圧縮率が約 30% 高く、非可逆圧縮と可逆圧縮の両方をサポートしています。

JPEG2000 形式の非常に重要な特徴は、プログレッシブ伝送を実現できることです。つまり、最初に画像の輪郭を伝送し、その後徐々にデータを伝送することで、継続的に画質を向上させ、画像をより美しくすることができます。霞んだ状態から透明な状態まで表示されます。

さらに、JPEG2000 は、いわゆる「関心領域」機能もサポートしています。これにより、画像上の関心領域の圧縮品質を任意に指定でき、指定した圧縮品質を選択することもできます。最初に解凍する部分。 JPEG2000 には JPEG に比べて明らかな利点があり、下位互換性があるため、従来の JPEG 形式を置き換えることができます。

JPEG2000 は、スキャナ、デジタル カメラなどの従来の JPEG 市場で使用できるほか、ネットワーク伝送、無線通信などの新興分野でも使用できます。

TGA 形式

TGA 形式 (タグ付きグラフィックス) は、アメリカの Truevision 社がディスプレイ カード用に開発した画像ファイル形式です。ファイルの拡張子は「」です。 tga」は、国際的なグラフィックスおよび画像業界に受け入れられています。 TGA は比較的単純な構造を持ち、グラフィックスおよび画像データの汎用フォーマットであり、マルチメディアの分野で大きな影響力を持ち、コンピュータで生成された画像をテレビに変換する際によく使用されるフォーマットです。 TGA 画像形式の最大の特徴は、不規則な形状のグラフィックスや画像ファイルを作成できることです。通常、グラフィックスや画像ファイルは正方形ですが、円形、ひし形、または空の画像ファイルが必要な場合は、TGA を使用できます。 TGA フォーマットは、歪みのない圧縮アルゴリズムを使用した圧縮をサポートしています。

EXIF 形式

EXIF 形式は、1994 年に富士フイルムが推進したデジタル カメラの画像ファイル形式で、実際には JPEG 形式と同じです。画像データの保存に加え、露出データや撮影日、絞り、シャッター、フラッシュデータ、小サイズ画像などの付帯情報も保存できます。

FPX 画像ファイル形式

FPX 画像ファイル形式 (拡張子 fpx) は、Kodak、Microsoft、HP、Live PictureInc によって共同開発され、1996 年 6 月に正式に発売されました。 FPX は、3 月にリリースされたマルチ解像度の画像フォーマットであり、画像を高解像度と低解像度で連続して保存し、画像を拡大しても画質を維持できるという利点があります。 、レタッチ時 FPX画像を処理する際、画像全体をまとめて処理せず、変更部分のみを処理するため、プロセッサやメモリへの負担が軽減され、画像処理時間が短縮されます。

SVG 形式

SVG は、スケーラブルなベクター グラフィック形式です。これは、グラフィック表示用に任意に拡大できるオープン標準のベクター グラフィックス言語です。エッジは非常に鮮明です。テキストは SVG 画像内で引き続き編集および検索可能です。フォントの制限はありません。生成されるファイルは小さいため、すぐにダウンロードできます。非常に便利です。高解像度の Web グラフィック ページのデザインに適しています。

PSD ファイル形式

これは、Photoshop 画像処理ソフトウェア用の特殊なファイル形式であり、ファイル拡張子は です。 psd は、レイヤー、チャンネル、マスク、さまざまなカラー モードのさまざまな画像機能をサポートできる、非圧縮のオリジナル ファイル保存形式です。スキャナーはこの形式のファイルを直接生成できません。 PSD ファイルは容量が大きい場合がありますが、元の情報をすべて保持できるため、画像処理が完了していない画像には PSD 形式で保存するのが最適です。

CDR ファイル形式

CDR 形式は、有名な描画ソフトウェア CorelDRAW 用の特別なグラフィック ファイル形式です。 CorelDRAW はベクター グラフィックス描画ソフトウェアであるため、CDR はファイルの属性、場所、ページングなどを記録できます。ただし、互換性が低く、すべての CorelDraw アプリケーションで使用できますが、他の画像編集ソフトウェアではそのようなファイルを開くことができません。

PCD ファイル形式

PCD は Kodak PhotoCD の略称で、ファイル拡張子は です。 pod は、Kodak によって開発された Photo CD ファイル形式であり、他のソフトウェア システムでのみ読み取ることができます。この形式では、YCC カラー モデルを使用して画像内の色を定義します。 YCC および CIE 色空間には、モニターや印刷デバイスの RGB および CMYK カラーよりもはるかに多くの色が含まれています。 PhotoCD イメージはほとんどが非常に高品質です。

DXF ファイル形式

DXF とは Drawing Exchange Format の略で、拡張子は です。 dxf は AutoCAD のグラフィック ファイル形式です。グラフィックを ASCII モードで保存し、グラフィックのサイズを非常に正確に表現します。CorelDraw や 3DS などの大規模なソフトウェアで呼び出して編集できます。

UFO ファイル形式

有名な画像編集ソフトウェア Ulead Photolmapct の専用画像形式で、Photolmapct で処理されたすべての画像属性を完全に記録できます。 UFO ファイルはレイヤーではなくオブジェクトを使用して画像情報を記録することに注意してください。

EPS ファイル形式

EPS とは、Encapsulated PostScript の略称で、クロスプラットフォームの標準形式であり、PC プラットフォームでの拡張子です。 eps、Macintosh プラットフォーム上。 epsf は、主にベクター画像とラスター画像の保存に使用されます。 EPS 形式は PostScript 言語で記述され、複数のトーン カーブ、アルファ チャネル、色分解、クリッピング パス、画面情報、トーン カーブなどの他の種類の情報を保存できるため、EPS 形式は印刷によく使用されます。またはプリントアウト。 Photoshop の複数の EPS 形式オプションにより、場合によっては TIFF 形式よりも優れた、印刷の包括的な制御が可能になります。

PNG 画像ファイル形式

PNG (Portable Networf Graphics) の元の名前は「Portable Network Graphics」で、インターネットで受け入れられている最新の画像ファイル形式です。 。 PNG は、GIF よりも 30% 小さい可逆圧縮画像ファイルを提供できます。 24 ビットと 48 ビットの両方のトゥルー カラー イメージのサポートと、その他の多くの技術サポートを提供します。 PNG は非常に新しいため、現在すべてのプログラムが PNG を使用して画像ファイルを保存できるわけではありませんが、Photoshop は PNG 画像ファイルを処理でき、PNG 画像ファイル形式で保存することもできます。

関連知識の詳細については、FAQ 列をご覧ください。

以上が画像のデジタル化中に使用されるエンコード方法によって、結果として得られるデジタル画像が決まります。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。