Pythonをベースに単眼3D再構成を実現する方法-Python チュートリアル-php.cn

ホームページ

バックエンド開発

Python チュートリアル

Pythonをベースに単眼3D再構成を実現する方法

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 20, 2023 pm 02:20 PM

python

#1. 単眼 3 次元再構成の概要

対象世界の物体は 3 次元ですが、得られる画像は 2 次元ですが、この二次元画像から対象物の三次元情報をセンシングします。三次元再構成技術は、画像を何らかの方法で処理してコンピュータが認識できる三次元情報を取得し、対象物を解析する技術です。単眼 3D 再構成は、単一のカメラの動きに基づいて両眼視をシミュレートし、空間内のオブジェクトの 3 次元視覚情報を取得します。ここで、単眼とは単一のカメラを指します。

2. 実装プロセス

オブジェクトの単眼 3 次元再構築プロセスでは、関連する動作環境は次のとおりです:

matplotlib 3.3.4
numpy 1.19.5
opencv-contrib-python 3.4.2.16
opencv-python 3.4.2.16
pillow 8.2.0
python 3.6.2

再構成には主に以下の手順が含まれます。

#(1) カメラキャリブレーション

#(2) 画像特徴抽出とマッチング

#(3) 3 次元再構成

次に、各ステップの具体的な実装を詳しく見てみましょう:

(1) カメラのキャリブレーション

携帯電話のカメラなど、私たちの日常生活には多くのカメラがあります。デジタルカメラと機能モジュールの種類カメラなど各カメラのパラメータ、つまり、カメラで撮影される写真の解像度やモードなどが異なります。オブジェクトの 3 次元再構成を実行するときに、カメラの行列パラメータが事前にわからないと仮定すると、カメラの行列パラメータを計算する必要があります。この手順はカメラキャリブレーションと呼ばれます。カメラのキャリブレーションに関する原理については、インターネット上の多くの方が詳しく説明しているので、ここでは紹介しません。キャリブレーションの具体的な実装は次のとおりです。

def camera_calibration(ImagePath):
    # 循环中断
    criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 30, 0.001)
    # 棋盘格尺寸（棋盘格的交叉点的个数）
    row = 11
    column = 8
    
    objpoint = np.zeros((row * column, 3), np.float32)
    objpoint[:, :2] = np.mgrid[0:row, 0:column].T.reshape(-1, 2)

    objpoints = []  # 3d point in real world space
    imgpoints = []  # 2d points in image plane.

    batch_images = glob.glob(ImagePath + &#39;/*.jpg&#39;)
    for i, fname in enumerate(batch_images):
        img = cv2.imread(batch_images[i])
        imgGray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
        # find chess board corners
        ret, corners = cv2.findChessboardCorners(imgGray, (row, column), None)
        # if found, add object points, image points (after refining them)
        if ret:
            objpoints.append(objpoint)
            corners2 = cv2.cornerSubPix(imgGray, corners, (11, 11), (-1, -1), criteria)
            imgpoints.append(corners2)
            # Draw and display the corners
            img = cv2.drawChessboardCorners(img, (row, column), corners2, ret)
            cv2.imwrite(&#39;Checkerboard_Image/Temp_JPG/Temp_&#39; + str(i) + &#39;.jpg&#39;, img)

    print("成功提取:", len(batch_images), "张图片角点！")
    ret, mtx, dist, rvecs, tvecs = cv2.calibrateCamera(objpoints, imgpoints, imgGray.shape[::-1], None, None)

このうち、cv2.calibrateCamera 関数で取得した mtx 行列が K 行列です。

対応するパラメータを変更し、キャリブレーションを完了した後、チェッカーボードのコーナーポイントの画像を出力して、チェッカーボードのコーナーポイントが正常に抽出されたかどうかを確認できます。出力されるコーナーポイントの画像は次のとおりです:

図 1: チェッカーボードの角点の抽出 Pythonをベースに単眼3D再構成を実現する方法

(2) 画像特徴の抽出とマッチング

3 次元再構成プロセス全体では、このステップは最も重要であり、最も複雑なステップでもあり、画像特徴抽出の品質によって最終的な再構成効果が決まります。

画像特徴点抽出アルゴリズムには、SIFT アルゴリズム、SURF アルゴリズム、ORB アルゴリズムという 3 つのアルゴリズムがよく使われます。このステップでは、包括的な分析と比較を通じて、SURF アルゴリズムを使用して画像の特徴点を抽出します。 3 つのアルゴリズムの特徴点抽出効果を比較したい場合は、オンラインで検索して参照してください。ここでは 1 つずつの比較は行いません。具体的な実装は次のとおりです。

def epipolar_geometric(Images_Path, K):
    IMG = glob.glob(Images_Path)
    img1, img2 = cv2.imread(IMG[0]), cv2.imread(IMG[1])
    img1_gray = cv2.cvtColor(img1, cv2.COLOR_BGR2GRAY)
    img2_gray = cv2.cvtColor(img2, cv2.COLOR_BGR2GRAY)

    # Initiate SURF detector
    SURF = cv2.xfeatures2d_SURF.create()

    # compute keypoint & descriptions
    keypoint1, descriptor1 = SURF.detectAndCompute(img1_gray, None)
    keypoint2, descriptor2 = SURF.detectAndCompute(img2_gray, None)
    print("角点数量：", len(keypoint1), len(keypoint2))

    # Find point matches
    bf = cv2.BFMatcher(cv2.NORM_L2, crossCheck=True)
    matches = bf.match(descriptor1, descriptor2)
    print("匹配点数量：", len(matches))

    src_pts = np.asarray([keypoint1[m.queryIdx].pt for m in matches])
    dst_pts = np.asarray([keypoint2[m.trainIdx].pt for m in matches])
    # plot
    knn_image = cv2.drawMatches(img1_gray, keypoint1, img2_gray, keypoint2, matches[:-1], None, flags=2)
    image_ = Image.fromarray(np.uint8(knn_image))
    image_.save("MatchesImage.jpg")

    # Constrain matches to fit homography
    retval, mask = cv2.findHomography(src_pts, dst_pts, cv2.RANSAC, 100.0)

    # We select only inlier points
    points1 = src_pts[mask.ravel() == 1]
    points2 = dst_pts[mask.ravel() == 1]

見つかった特徴点は次のとおりです。

図 2: 特徴点の抽出 Pythonをベースに単眼3D再構成を実現する方法

( 3) 3 次元再構成

画像の特徴点を見つけて相互に一致させたら、3 次元再構成を開始できます。具体的な実装は次のとおりです。再構成効果は次のとおりです (効果は平均です):

図 3: 3 次元再構成

#3. 結論 Pythonをベースに単眼3D再構成を実現する方法

From再構成結果、単眼三次元再構成効果は平均的であるが、これらの点が関係しているのではないかと考えられる関連要素：

(1) 撮影形態。単眼三次元再構成タスクの場合、写真を撮るときにカメラを平行に動かし続けるのが最善であり、正面から写真を撮るのが最善です。つまり、斜めまたは特別な角度で写真を撮らないでください。 ;

(2) 干渉撮影時の周囲環境。無関係な物体からの干渉を減らすために、単一の撮影場所を選択するのが最善です;

(3) 撮影光源の問題。選択した写真の場所では、適切な明るさを確保する必要があります (光源が基準を満たしているかどうかを確認するには、特定の状況をテストする必要があります)。また、カメラを移動するときは、直前の瞬間と今回の光源が一貫していることも確認する必要があります。一瞬。

実際のところ、単眼 3D 再構成のパフォーマンスは通常低く、すべての条件が最適な場合でも、得られる再構成効果はあまり良くありません。あるいは、両眼3D再構成を利用することも考えられますが、単眼よりも両眼3D再構成の方が確実に効果が高く、実装も少し面倒なだけです（笑）。実際、操作はそれほど複雑ではなく、2台のカメラの撮影とキャリブレーションが最も面倒で、その他の部分は比較的簡単です。

4.コード

points1 = cart2hom(points1.T)
points2 = cart2hom(points2.T)
# plot
fig, ax = plt.subplots(1, 2)
ax[0].autoscale_view(&#39;tight&#39;)
ax[0].imshow(cv2.cvtColor(img1, cv2.COLOR_BGR2RGB))
ax[0].plot(points1[0], points1[1], &#39;r.&#39;)
ax[1].autoscale_view(&#39;tight&#39;)
ax[1].imshow(cv2.cvtColor(img2, cv2.COLOR_BGR2RGB))
ax[1].plot(points2[0], points2[1], &#39;r.&#39;)
plt.savefig(&#39;MatchesPoints.jpg&#39;)
fig.show()
# 

points1n = np.dot(np.linalg.inv(K), points1)
points2n = np.dot(np.linalg.inv(K), points2)
E = compute_essential_normalized(points1n, points2n)
print(&#39;Computed essential matrix:&#39;, (-E / E[0][1]))

P1 = np.array([[1, 0, 0, 0], [0, 1, 0, 0], [0, 0, 1, 0]])
P2s = compute_P_from_essential(E)

ind = -1
for i, P2 in enumerate(P2s):
    # Find the correct camera parameters
    d1 = reconstruct_one_point(points1n[:, 0], points2n[:, 0], P1, P2)
    # Convert P2 from camera view to world view
    P2_homogenous = np.linalg.inv(np.vstack([P2, [0, 0, 0, 1]]))
    d2 = np.dot(P2_homogenous[:3, :4], d1)
    if d1[2] > 0 and d2[2] > 0:
        ind = i

P2 = np.linalg.inv(np.vstack([P2s[ind], [0, 0, 0, 1]]))[:3, :4]
Points3D = linear_triangulation(points1n, points2n, P1, P2)

fig = plt.figure()
fig.suptitle(&#39;3D reconstructed&#39;, fontsize=16)
ax = fig.gca(projection=&#39;3d&#39;)
ax.plot(Points3D[0], Points3D[1], Points3D[2], &#39;b.&#39;)
ax.set_xlabel(&#39;x axis&#39;)
ax.set_ylabel(&#39;y axis&#39;)
ax.set_zlabel(&#39;z axis&#39;)
ax.view_init(elev=135, azim=90)
plt.savefig(&#39;Reconstruction.jpg&#39;)
plt.show()

以上がPythonをベースに単眼3D再構成を実現する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は亿速云で複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

Pythonの主な目的：柔軟性と使いやすさApr 17, 2025 am 12:14 AM

Pythonの柔軟性は、マルチパラダイムサポートと動的タイプシステムに反映されていますが、使いやすさはシンプルな構文とリッチ標準ライブラリに由来しています。 1。柔軟性：オブジェクト指向、機能的および手続き的プログラミングをサポートし、動的タイプシステムは開発効率を向上させます。 2。使いやすさ：文法は自然言語に近く、標準的なライブラリは幅広い機能をカバーし、開発プロセスを簡素化します。

Python：汎用性の高いプログラミングの力Apr 17, 2025 am 12:09 AM

Pythonは、初心者から上級開発者までのすべてのニーズに適した、そのシンプルさとパワーに非常に好まれています。その汎用性は、次のことに反映されています。1）学習と使用が簡単、シンプルな構文。 2）Numpy、Pandasなどの豊富なライブラリとフレームワーク。 3）さまざまなオペレーティングシステムで実行できるクロスプラットフォームサポート。 4）作業効率を向上させるためのスクリプトおよび自動化タスクに適しています。

1日2時間でPythonを学ぶ：実用的なガイドApr 17, 2025 am 12:05 AM

はい、1日2時間でPythonを学びます。 1.合理的な学習計画を作成します。2。適切な学習リソースを選択します。3。実践を通じて学んだ知識を統合します。これらの手順は、短時間でPythonをマスターするのに役立ちます。

Python vs. C：開発者の長所と短所Apr 17, 2025 am 12:04 AM

Pythonは迅速な開発とデータ処理に適していますが、Cは高性能および基礎となる制御に適しています。 1）Pythonは、簡潔な構文を備えた使いやすく、データサイエンスやWeb開発に適しています。 2）Cは高性能で正確な制御を持ち、ゲームやシステムのプログラミングでよく使用されます。

Python：時間のコミットメントと学習ペースApr 17, 2025 am 12:03 AM

Pythonを学ぶのに必要な時間は、人によって異なり、主に以前のプログラミングの経験、学習の動機付け、学習リソースと方法、学習リズムの影響を受けます。現実的な学習目標を設定し、実用的なプロジェクトを通じて最善を尽くします。

Python：自動化、スクリプト、およびタスク管理Apr 16, 2025 am 12:14 AM

Pythonは、自動化、スクリプト、およびタスク管理に優れています。 1）自動化：OSやShutilなどの標準ライブラリを介してファイルバックアップが実現されます。 2）スクリプトの書き込み：Psutilライブラリを使用してシステムリソースを監視します。 3）タスク管理：スケジュールライブラリを使用してタスクをスケジュールします。 Pythonの使いやすさと豊富なライブラリサポートにより、これらの分野で優先ツールになります。

Pythonと時間：勉強時間を最大限に活用するApr 14, 2025 am 12:02 AM

限られた時間でPythonの学習効率を最大化するには、PythonのDateTime、時間、およびスケジュールモジュールを使用できます。 1. DateTimeモジュールは、学習時間を記録および計画するために使用されます。 2。時間モジュールは、勉強と休息の時間を設定するのに役立ちます。 3.スケジュールモジュールは、毎週の学習タスクを自動的に配置します。

Python：ゲーム、GUIなどApr 13, 2025 am 12:14 AM

PythonはゲームとGUI開発に優れています。 1）ゲーム開発は、2Dゲームの作成に適した図面、オーディオ、その他の機能を提供し、Pygameを使用します。 2）GUI開発は、TKINTERまたはPYQTを選択できます。 TKINTERはシンプルで使いやすく、PYQTは豊富な機能を備えており、専門能力開発に適しています。

See all articles