Maison >Périphériques technologiques >IA >Implémentation d'un script de navigateur de traduction de marquage de mots basé sur l'API ChatGPT
Récemment, il existe un script de navigateur basé sur l'API ChatGPT sur GitHub, openai-translator. En peu de temps, l'étoile a atteint 12k. En plus de prendre en charge la traduction, il prend également en charge les fonctions de polissage et de synthèse. En plus des plug-ins de navigateur, il existe également un client de bureau utilisant tauri. Indépendamment de tauri et de l'utilisation de la partie rust, la partie navigateur est relativement simple à implémenter. Aujourd'hui, nous allons l'implémenter manuellement.
Par exemple, nous pouvons copier le code suivant et lancer une demande dans la console du navigateur pour terminer la traduction
//示例 const OPENAI_API_KEY = "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"; const prompt = `Translate this into Chinese: hello world`; const res = await fetch("https://api.openai.com/v1/completions", { method: "POST", headers: { "Content-Type": "application/json", authorization: `Bearer ${OPENAI_API_KEY}`, }, body: JSON.stringify({ model: "text-davinci-003", prompt, max_tokens: 1000, temperature: 0, }), }); const response = await res.json(); const result = response.choices[0].text;
OPONAI_API_KEY dans le code ci-dessus doit être remplacé par le vôtre.
La traduction de marquage de mots est une fonction courante des pages Web Lorsque l'utilisateur sélectionne un mot ou un morceau de texte, une petite fenêtre apparaît automatiquement pour afficher la traduction du mot ou du texte.
let keyword; const translation = document.createElement("div"); translation.id ="translation"; const icon = document.createElement("img"); icon.style.width ="30px"; icon.style.height = "30px"; icon.src ="http://example.com/icon.png"; translation.appendChild(icon)
document.addEventListener("mouseup", (event) => { const selection = window.getSelection().toString().trim(); if (selection) { keyword=selection; } });
function translate(){ if(keyword){ // 执行翻译逻辑 } } icon.addEventListener("mouseover", translate);
#translation { position: fixed; top: 10px; right: 10px; max-width: 300px; padding: 5px; background-color: #f7f7f7; border: 1px solid #ccc; box-shadow: 0px 2px 5px rgba(0, 0, 0, 0.1); z-index: 9999; }
Les étapes ci-dessus peuvent réaliser la fonction de base de la traduction de mots. Jetons un coup d'œil à l'effet.
Le code ci-dessus n'implémente que la version la plus simple, et le style n'est pas assez beau, nous pouvons donc utiliser webpack + React + Antd pour implémenter un plug-in moderne, ici J'utilise un modèle tampermonkey-starter créé précédemment.
En utilisant le composant Popover d'antd pour afficher et en utilisant React pour reconstruire le code js, nous pouvons obtenir les effets suivants.
Cliquez sur le bouton de traduction
Cliquez sur le bouton de traduction, et il sera demandé via l'interface et les résultats de la traduction seront affichés ci-dessous. Cependant, les résultats de la traduction ne seront pas affichés tant que l'API n'est pas entièrement renvoyée, ce qui sera plus lent. Pouvons-nous utiliser Stream ? L'interface OpenAI prend-elle en charge le rendu par flux ?
import { createParser } from "eventsource-parser"; const translate = async (text: string) => { const resp = await fetch("https://api.openai.com/v1/completions", { method: "POST", headers: { "Content-Type": "application/json", authorization: `Bearer ${OPENAI_API_KEY}`, }, body: JSON.stringify({ model: "text-davinci-003", prompt: `Translate this into Chinese: ${text}`, max_tokens: 1000, temperature: 0, frequency_penalty: 0, stream: true, }), }); if (resp.status !== 200) { const res = await resp.json(); setLoading(false); console.error(res); return; } const parser = createParser((event) => { if (event.type === "event") { const data = event.data; if (data === "[DONE]") { setLoading(false); } try { let json = JSON.parse(event.data); setResult((prev) => { return prev + json.choices[0].text; }); } catch (error) { console.log(error); } } }); const data = resp.body; if (!data) { console.log("Error: No data received from API"); return; } const reader = resp.body.getReader(); try { while (true) { const { done, value } = await reader.read(); if (done) { setLoading(false); break; } const str = new TextDecoder().decode(value); parser.feed(str); } } finally { reader.releaseLock(); } };
Dans le code ci-dessus, nous utilisons l'API fetch pour envoyer une requête HTTP et obtenir un flux lisible dans la réponse. Nous pouvons utiliser la méthode getReader pour obtenir un objet lecteur et l'utiliser pour traiter les données du flux, en utilisant le package eventsource-parser pour analyser les données des événements envoyés par le serveur.
De cette façon, le contenu de la réponse sera affiché un par un en fonction des événements envoyés par le serveur (événements envoyés par le serveur).
Les plug-ins de traduction générale ont une fonction de lecture vocale, nous pouvons utiliser l'API Web Speech. Cette API fournit deux interfaces de synthèse vocale : SpeechSynthesis et SpeechSynthesisUtterance
function speak(text) { if ('speechSynthesis' in window) { const utterance = new SpeechSynthesisUtterance(text); utterance.voice = speechSynthesis.getVoices()[0]; utterance.pitch = 1; utterance.rate = 1; speechSynthesis.speak(utterance); } }
Ensuite, appelez cette fonction directement et transmettez le texte qui doit être lu, et vous pourrez ensuite réaliser la lecture vocale
speak('Hello, world!');
Cet article présente les bases de la façon dont pour implémenter la traduction avec marquage de mots. Les fonctions incluent l'utilisation de l'interface fournie par OpenAI pour la traduction, l'ajout de boutons qui déclenchent la traduction et les événements d'écoute d'événements avec la souris dans la page HTML, l'utilisation de requêtes AJAX pour obtenir les résultats de traduction à partir de l'interface et leur affichage dans les éléments DIV. , etc. Il présente également comment utiliser webpack + réagir + antd pour implémenter un plug-in moderne et utiliser l'API Web Speech pour implémenter la fonction de lecture vocale.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!