垂直検索は、特定の業界向けの専門的な検索エンジンであり、Web ライブラリ内の特定の種類の専門的な情報を統合し、処理のために必要なデータを抽出します。何らかの形でユーザーに送信します。
垂直型検索エンジンと通常の Web 検索エンジンの最大の違いは、Web ページ情報の構造化情報抽出です。つまり、Web ページの非構造化データを、Web 検索などの特定の構造化情報データに抽出します。ビジョンベースのWebページブロック分析はWebページブロックを最小単位とし、垂直検索は構造化データを最小単位とします。これらのデータは、重複排除、分類などのさらなる処理のためにデータベースに保存されます。最後に、検索を通じてユーザーのニーズを満たすために、単語の分割とインデックス付けが使用されます。
プロセス全体を通じて、データは非構造化データから構造化データに抽出され、非構造化された方法と詳細な処理後の構造化された方法でユーザーに返されます。
エンタープライズ ライブラリ検索、需給情報検索エンジン、ショッピング検索、不動産検索、人材検索、地図検索、MP3 検索、画像検索など、垂直型検索エンジンには多くの応用方向があります...あらゆる分野のほぼすべての種類の情報。すべてはさらにさまざまな種類の垂直型検索エンジンに絞り込むことができます。
ショッピングの検索エンジンなどを例に挙げると分かりやすいと思いますが、全体の流れとしては、Webページをクローリングした後、Webページから商品情報を抽出し、商品を抽出するという流れになります。名前、価格、紹介...さらにノートブックの紹介を「ブランド、モデル、CPU、メモリ、ハードディスク、表示画面...」に細分化し、情報を整理、重複除去、分類、分析、比較します。データマイニングを実行します。最後に、ユーザーは単語セグメンテーションインデックスを通じて情報を検索して渡すことができ、分析とマイニングにより市場状況レポートが提供されます。
垂直型検索エンジンには一般に以下の技術が必要です
1.Spider
2.Webページの構造化情報抽出技術またはメタデータ収集技術
3. 単語の分割とインデックス作成
4. その他の情報処理技術
垂直型検索エンジンの技術的評価は以下の点から判断すべきである
1. 網羅性
2. 更新性
3. 精度
4. 機能性
垂直検索の参入障壁は非常に低いですが、競争の敷居は高い。ひたむきな精神と優れた技術がなければ不可能です。業界ポータルには業界の利点がありますが、技術的な利点はありません。プロジェクトではなく、継続的な改善が必要な運用製品として、数人の人材を採用するだけですべての垂直検索テクノロジを処理できるとは決して考えないでください。制御の度合いは、垂直検索を成功させるための重要な要素の 1 つです。