Maison >Java >javaDidacticiel >Intégration de modèles d'IA sans effort : créer et évaluer des modèles d'IA (Spring Boot et Hugging Face)
La révolution de l'IA est là, et avec elle une liste toujours croissante de modèles puissants capables de générer du texte, de créer des visuels et de résoudre des problèmes complexes. Mais soyons réalistes : avec autant d’options, déterminer quel modèle convient le mieux à votre projet peut s’avérer une tâche ardue. Et s'il existait un moyen de tester rapidement ces modèles, de voir leurs résultats en action et de décider lequel intégrer dans votre système de production ?
Accédez à l'API d'inférence de Hugging Face : votre raccourci pour explorer et exploiter des modèles d'IA de pointe. Il élimine les tracas liés à la configuration, à l'hébergement ou à la formation des modèles en offrant une solution plug-and-play. Que vous réfléchissiez à une nouvelle fonctionnalité ou évaluiez les capacités d'un modèle, Hugging Face rend l'intégration de l'IA plus simple que jamais.
Dans ce blog, je vais vous guider dans la création d'une application backend légère à l'aide de Spring Boot qui vous permet de tester et d'évaluer des modèles d'IA sans effort. Voici ce à quoi vous pouvez vous attendre :
À la fin, vous disposerez d’un outil pratique pour tester différents modèles d’IA et prendre des décisions éclairées quant à leur adéquation aux besoins de votre projet. Si vous êtes prêt à combler le fossé entre la curiosité et la mise en œuvre, commençons !
Voici pourquoi Hugging Face change la donne pour l’intégration de l’IA :
Nous allons créer QuickAI, une application Spring Boot qui :
Rendez-vous sur huggingface.co et créez un compte si vous n'en avez pas déjà un.
Accédez aux paramètres de votre compte et générez une clé API. Cette clé permettra à votre application Spring Boot d'interagir avec l'API d'inférence de Hugging Face.
Consultez le Hub de modèles Hugging Face pour trouver des modèles adaptés à vos besoins. Pour ce tutoriel, nous utiliserons :
Utilisez Spring Initializr pour configurer votre projet avec les dépendances suivantes :
Ajoutez votre clé API Hugging Face et vos URL de modèle au fichier application.properties :
huggingface.text.api.url=https://api-inference.huggingface.co/models/your-text-model huggingface.api.key=your-api-key-here huggingface.image.api.url=https://api-inference.huggingface.co/models/your-image-model
Plongeons dans le code et construisons les services de génération de texte et d'images. Restez à l'écoute !
@Service public class LLMService { private final WebClient webClient; private static final Logger logger = LoggerFactory.getLogger(LLMService.class); // Constructor to initialize WebClient with Hugging Face API URL and API key public LLMService(@Value("${huggingface.text.api.url}") String apiUrl, @Value("${huggingface.api.key}") String apiKey) { this.webClient = WebClient.builder() .baseUrl(apiUrl) // Set the base URL for the API .defaultHeader("Authorization", "Bearer " + apiKey) // Add API key to the header .build(); } // Method to generate text using Hugging Face's Inference API public Mono<String> generateText(String prompt) { // Validate the input prompt if (prompt == null || prompt.trim().isEmpty()) { return Mono.error(new IllegalArgumentException("Prompt must not be null or empty")); } // Create the request body with the prompt Map<String, String> body = Collections.singletonMap("inputs", prompt); // Make a POST request to the Hugging Face API return webClient.post() .bodyValue(body) .retrieve() .bodyToMono(String.class) .doOnSuccess(response -> logger.info("Response received: {}", response)) // Log successful responses .doOnError(error -> logger.error("Error during API call", error)) // Log errors .retryWhen(Retry.backoff(3, Duration.ofMillis(500))) // Retry on failure with exponential backoff .timeout(Duration.ofSeconds(5)) // Set a timeout for the API call .onErrorResume(error -> Mono.just("Fallback response due to error: " + error.getMessage())); // Provide a fallback response on error } }
@Service public class ImageGenerationService { private static final Logger logger = LoggerFactory.getLogger(ImageGenerationService.class); private final WebClient webClient; public ImageGenerationService(@Value("${huggingface.image.api.url}") String apiUrl, @Value("${huggingface.api.key}") String apiKey) { this.webClient = WebClient.builder() .baseUrl(apiUrl) .defaultHeader("Authorization", "Bearer " + apiKey) .build(); } public Mono<byte[]> generateImage(String prompt) { if (prompt == null || prompt.trim().isEmpty()) { return Mono.error(new IllegalArgumentException("Prompt must not be null or empty")); } Map<String, String> body = Collections.singletonMap("inputs", prompt); return webClient.post() .bodyValue(body) .retrieve() .bodyToMono(byte[].class) / Convert the response to a Mono<byte[]> (image bytes) .timeout(Duration.ofSeconds(10)) // Timeout after 10 seconds .retryWhen(Retry.backoff(3, Duration.ofMillis(500))) // Retry logic .doOnSuccess(response -> logger.info("Image generated successfully for prompt: {}", prompt)) .doOnError(error -> logger.error("Error generating image for prompt: {}", prompt, error)) .onErrorResume(WebClientResponseException.class, ex -> { logger.error("HTTP error during image generation: {}", ex.getMessage(), ex); return Mono.error(new RuntimeException("Error generating image: " + ex.getMessage())); }) .onErrorResume(TimeoutException.class, ex -> { logger.error("Timeout while generating image for prompt: {}", prompt); return Mono.error(new RuntimeException("Request timed out")); }); } }
Prêt à plonger ? Consultez le référentiel QuickAI GitHub pour voir le code complet et suivez-le. Si vous le trouvez utile, donnez-lui un ⭐.
Envie d'aller plus loin dans ce projet ?
Vous souhaitez collaborer ou avoir des suggestions, retrouvez-moi sur LinkedIn, Portfolio examine également mes autres projets ici GitHub.
Vous avez une question ou une suggestion, n'hésitez pas à commenter ci-dessous, je me ferai un plaisir d'y répondre.
Bon codage ! ?
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!