使用 Spring Boot、Google Cloud Vertex AI 和 Gemini 模型進行基於圖像的產品搜索

Image-Based Product Search Using Spring Boot, Google Cloud Vertex AI, and Gemini Model

在本文中,我們將向您展示如何建立此功能:使用 Spring Boot 和 Google Cloud Vertex AI 的基於圖像的產品搜尋功能。



基於圖像的產品搜尋功能利用 Google Cloud Vertex AI 處理圖像並提取相關關鍵字。然後使用這些關鍵字在資料庫中搜尋匹配的產品。


  • Java 21
  • Spring 啟動 3.2.5
  • PostgreSQL
  • 頂點人工智慧
  • ReactJS



Image-Based Product Search Using Spring Boot, Google Cloud Vertex AI, and Gemini Model

1. 在Google Console上建立一個新項目

首先,我們需要為此在 Google Console 上建立一個新專案。

我們需要造訪 https://console.cloud.google.com 並建立一個新帳戶(如果您已有帳戶)。如果您有,請登入該帳戶。

如果您新增銀行帳戶,Google Cloud 將為您提供免費試用。


Image-Based Product Search Using Spring Boot, Google Cloud Vertex AI, and Gemini Model

2. 啟用頂點AI服務

在搜尋列上,我們需要找到 Vertex AI 並啟用所有建議的 API。

Image-Based Product Search Using Spring Boot, Google Cloud Vertex AI, and Gemini Model

Vertex AI 是 Google Cloud 完全託管的機器學習 (ML) 平台,旨在簡化 ML 模型的開發、部署和管理。它允許您透過提供 AutoML、自訂模型訓練、超參數調整和模型監控等工具和服務來大規模建置、訓練和部署 ML 模型

Gemini 1.5 Flash 是 Google Gemini 系列模型的一部分,專為 ML 應用程式中的高效和高效推理而設計。 Gemini 模型是 Google 開發的一系列高級 AI 模型,常用於自然語言處理 (NLP)、視覺任務和其他 AI 驅動的應用

注意:對於其他框架,您可以直接在 https://aistudio.google.com/app/prompts/new_chat 使用 Gemini API。使用結構提示功能,因為您可以自訂輸出以匹配輸入,這樣您將獲得更好的結果。

3. 建立與您的應用程式相符的新提示


Vertex AI Studio 在提示庫提供了許多範例提示。我們使用範例圖像文字到JSON來提取與產品圖像相關的關鍵字。

Image-Based Product Search Using Spring Boot, Google Cloud Vertex AI, and Gemini Model

我的應用程式是 CarShop,所以我建立了一個像這樣的提示。我期望模型會用與圖像相關的關鍵字清單來回覆我。

我的提示:將名稱 car 提取到清單關鍵字並以 JSON 格式輸出。如果您沒有找到有關汽車的任何信息,請將列表輸出為空。 n回應範例:[“rolls”, “royce”, “wraith”]

Image-Based Product Search Using Spring Boot, Google Cloud Vertex AI, and Gemini Model

我們根據您的應用程式自訂合適的提示後。現在,我們就來探討如何與 Spring Boot Application 整合。

4. 與 Spring Boot 應用程式集成


Image-Based Product Search Using Spring Boot, Google Cloud Vertex AI, and Gemini Model

首先,在 pom.xml 檔案中,您應該更新您的依賴項:

<!-- config version for dependency-->

<!-- In your dependencyManagement, please add 2 dependencies below -->


<!-- In your tab dependencies, please add the dependency below -->

在 pom.xml 檔案中完成設定後,建立一個設定類別 GeminiConfig.java

  • MODEL_NAME:「gemini-1.5-flash」
  • 位置:「設定項目時您的位置」
  • PROJECT_ID:「您的專案 ID」

Image-Based Product Search Using Spring Boot, Google Cloud Vertex AI, and Gemini Model

import com.google.cloud.vertexai.VertexAI;
import com.google.cloud.vertexai.generativeai.GenerativeModel;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;

@Configuration(proxyBeanMethods = false)
public class GeminiConfig {

    private static final String MODEL_NAME = "gemini-1.5-flash";
    private static final String LOCATION = "asia-southeast1";
    private static final String PROJECT_ID = "yasmini";

    public VertexAI vertexAI() {
        return new VertexAI(PROJECT_ID, LOCATION);

    public GenerativeModel getModel(VertexAI vertexAI) {
        return new GenerativeModel(MODEL_NAME, vertexAI);


因為 Gemini API 以 markdown 格式回應,所以我們需要建立一個函數來幫助轉換為 JSON,然後我們將 JSON 轉換為 Java 中的 List 字串。

Image-Based Product Search Using Spring Boot, Google Cloud Vertex AI, and Gemini Model

import com.fasterxml.jackson.core.JsonProcessingException;
import com.fasterxml.jackson.databind.ObjectMapper;
import com.google.cloud.vertexai.api.Content;
import com.google.cloud.vertexai.api.GenerateContentResponse;
import com.google.cloud.vertexai.api.Part;
import com.google.cloud.vertexai.generativeai.*;
import com.learning.yasminishop.common.entity.Product;
import com.learning.yasminishop.common.exception.AppException;
import com.learning.yasminishop.common.exception.ErrorCode;
import com.learning.yasminishop.product.ProductRepository;
import com.learning.yasminishop.product.dto.response.ProductResponse;
import com.learning.yasminishop.product.mapper.ProductMapper;
import lombok.RequiredArgsConstructor;
import lombok.extern.slf4j.Slf4j;
import org.springframework.stereotype.Service;
import org.springframework.transaction.annotation.Transactional;
import org.springframework.web.multipart.MultipartFile;

import java.util.HashSet;
import java.util.List;
import java.util.Objects;
import java.util.Set;

@Transactional(readOnly = true)
public class YasMiniAIService {

    private final GenerativeModel generativeModel;
    private final ProductRepository productRepository;

    private final ProductMapper productMapper;

    public List<ProductResponse> findCarByImage(MultipartFile file){
        try {
            var prompt = "Extract the name car to a list keyword and output them in JSON. If you don't find any information about the car, please output the list empty.\nExample response: [\"rolls\", \"royce\", \"wraith\"]";
            var content = this.generativeModel.generateContent(
                            PartMaker.fromMimeTypeAndData(Objects.requireNonNull(file.getContentType()), file.getBytes()),

            String jsonContent = ResponseHandler.getText(content);
            log.info("Extracted keywords from image: {}", jsonContent);
            List<String> keywords = convertJsonToList(jsonContent).stream()

            Set<Product> results = new HashSet<>();
            for (String keyword : keywords) {
                List<Product> products = productRepository.searchByKeyword(keyword);

            return results.stream()

        } catch (Exception e) {
            log.error("Error finding car by image", e);
            return List.of();

    private List<String> convertJsonToList(String markdown) throws JsonProcessingException {
        ObjectMapper objectMapper = new ObjectMapper();
        String parseJson = markdown;

            parseJson = extractJsonFromMarkdown(markdown);
        return objectMapper.readValue(parseJson, List.class);

    private String extractJsonFromMarkdown(String markdown) {
        return markdown.replace("

```json\n", "").replace("\n```

", "");


import com.learning.yasminishop.product.dto.response.ProductResponse;
import lombok.RequiredArgsConstructor;
import lombok.extern.slf4j.Slf4j;
import org.springframework.security.access.prepost.PreAuthorize;
import org.springframework.web.bind.annotation.*;
import org.springframework.web.multipart.MultipartFile;

import java.util.List;

public class YasMiniAIController {

    private final YasMiniAIService yasMiniAIService;

    public List<ProductResponse> findCar(@RequestParam("file") MultipartFile file) {

        var response = yasMiniAIService.findCarByImage(file);
        return response;

5. 重要步驟:使用 Google Cloud CLI 登入 Google Cloud

Spring Boot 應用程式無法驗證您的身份,也無法讓您接受 Google Cloud 中的資源。


5.1 首先我們需要在您的機器上安裝GCloud CLI


5.2 登入

  1. 在專案中開啟終端機(您必須 cd 進入專案)
  2. 類型:gcloud auth 登入
  3. 輸入,您將看到允許登入的視窗

gcloud auth login

Image-Based Product Search Using Spring Boot, Google Cloud Vertex AI, and Gemini Model

Image-Based Product Search Using Spring Boot, Google Cloud Vertex AI, and Gemini Model

注意:登入後,憑證將保存在 Google Maven 套件中,重啟 Spring Boot 應用程式時無需再次登入。


所以上面這些都是基於我的電子商務專案實現的,你可以根據你的專案、你的框架進行修改。在其他框架中,除了 Spring Boot(NestJs,..),您可以使用 https://aistudio.google.com/app/prompts/new_chat。並且不需要建立新的 Google Cloud 帳戶。



學習愉快! ! !

