論文を読むことは私たちの日常業務の一つとも言えますが、論文の数が多すぎるのですが、どうすれば早く読んで要約できるでしょうか? ChatGPT の登場以来、論文を読むために利用できるサービスがたくさんあります。実際、ChatGPT API の使用は非常に簡単で、わずか 30 行の Python コードで独自のアプリケーションをローカルに構築できます。
論文を読むことは私たちの日常業務の一つとも言えますが、論文の数が多すぎます。どうすれば早く読んで要約できるでしょうか? ChatGPT の登場以来、論文を読むために利用できるサービスがたくさんあります。実際、ChatGPT API の使用は非常に簡単で、わずか 30 行の Python コードで独自のアプリケーションをローカルに構築できます。
Python と ChatGPT API を使用して論文を要約する手順は簡単です:
- PDF 処理には PyPDF2、GPT-3.5-OpenAI を使用ターボインターフェース。
- PyPDF2 を使用して PDF ファイルを開いて読み取ります。
- PDF ドキュメントの各ページをスキャンしてテキストを抽出します。
- GPT-3.5-turbo を使用して、各ページのテキストの要約を生成します。
- 概要を結合し、最終的な概要テキストをファイルに保存します。
import PyPDF2
import openai
pdf_summary_text = ""
Parse pdf
pdf_file_path = "./pdfs/paper.pdf"
pdf_file = open(pdf_file_path, 'rb')
pdf_reader = PyPDF2.PdfReader(pdf_file)
各ページのテキストを取得します:
for page_num in range(len(pdf_reader. Pages)):
page_text = pdf_reader.pages[page_num].extract_text(). lower()
概要には openai の API を使用します
response = openai.ChatCompletion.create(
model="gpt-3.5-turbo",
messages=[
{"role": "system", "content": "あなたは役に立つ研究助手です。"},
{" role ": "user", "content": f"これを要約します: {page_text}"},
],
)
page_summary = response["choices"][0]["message"] [ "content"]
概要をマージ
pdf_summary_text = page_summary "n"
pdf_summary_file = pdf_file_path.replace(os.path.splitext(pdf_file_path)[1], "_summary.txt " )
with open(pdf_summary_file, "w ") as file:
file.write(pdf_summary_text)
完了、PDF ファイルを閉じてメモリをリサイクルします
pdf_file.close( )
完全なコードは次のとおりです:
import os
import PyPDF2
import re
import openai
# ここでは、次のことを想定しています。 Jupiter Notebook を指定し、URL
!curl -o Paper.pdf https://arxiv.org/pdf/2301.00810v3.pdf?utm_source=pocket_saves
# から紙を直接ダウンロードします。概要が含まれます
pdf_summary_text = ""
# PDF ファイルを開きます
pdf_file_path = "paper.pdf"
# PyPDF2 を使用して PDF ファイルを読み取ります
pdf_file = open(pdf_file_path, 'rb ')
pdf_reader = PyPDF2.PdfReader(pdf_file)
# PDF ファイル内のすべてのページをループします
for page_num in range(len(pdf_reader.pages)):
# からテキストを抽出しますページ
page_text = pdf_reader.pages[page_num].extract_text(). lower()
response = openai.ChatCompletion.create(
model="gpt-3.5-turbo",##) #messages= [
{"role": "system", "content": "あなたは有能な研究助手です。"},
{"role": "user", "content": f"要約これ: { page_text}"},
],
)
page_summary = response["choices"][0]["message"]["content"]
pdf_summary_text =page_summary "n"
pdf_summary_file = pdf_file_path.replace(os.path.splitext(pdf_file_path)[1], "_summary.txt")
with open(pdf_summary_file, "w ") as file:
file.write(pdf_summary_text )
pdf_file.close()
with open(pdf_summary_file, "r") as file:
print(file.read())
2つあります注意事項 事項:
以上が30 行の Python コードで ChatGPT API を呼び出し、論文の主な内容を要約できます。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

科学者は、彼らの機能を理解するために、人間とより単純なニューラルネットワーク(C. elegansのものと同様)を広く研究してきました。 ただし、重要な疑問が生じます。新しいAIと一緒に効果的に作業するために独自のニューラルネットワークをどのように適応させるのか

GoogleのGemini Advanced:Horizonの新しいサブスクリプションティア 現在、Gemini Advancedにアクセスするには、1か月あたり19.99ドルのGoogle One AIプレミアムプランが必要です。 ただし、Android Authorityのレポートは、今後の変更を示唆しています。 最新のGoogle p

高度なAI機能を取り巻く誇大宣伝にもかかわらず、エンタープライズAIの展開内に大きな課題が潜んでいます:データ処理ボトルネック。 CEOがAIの進歩を祝う間、エンジニアはクエリの遅い時間、過負荷のパイプライン、

ドキュメントの取り扱いは、AIプロジェクトでファイルを開くだけでなく、カオスを明確に変えることです。 PDF、PowerPoint、Wordなどのドキュメントは、あらゆる形状とサイズでワークフローをフラッシュします。構造化された取得

Googleのエージェント開発キット(ADK)のパワーを活用して、実際の機能を備えたインテリジェントエージェントを作成します。このチュートリアルは、ADKを使用して会話エージェントを構築し、GeminiやGPTなどのさまざまな言語モデルをサポートすることをガイドします。 w

まとめ: Small Language Model(SLM)は、効率のために設計されています。それらは、リソース不足、リアルタイム、プライバシーに敏感な環境の大手言語モデル(LLM)よりも優れています。 特にドメインの特異性、制御可能性、解釈可能性が一般的な知識や創造性よりも重要である場合、フォーカスベースのタスクに最適です。 SLMはLLMSの代替品ではありませんが、精度、速度、費用対効果が重要な場合に理想的です。 テクノロジーは、より少ないリソースでより多くを達成するのに役立ちます。それは常にドライバーではなく、プロモーターでした。蒸気エンジンの時代からインターネットバブル時代まで、テクノロジーの力は、問題の解決に役立つ範囲にあります。人工知能(AI)および最近では生成AIも例外ではありません

コンピュータービジョンのためのGoogleGeminiの力を活用:包括的なガイド 大手AIチャットボットであるGoogle Geminiは、その機能を会話を超えて拡張して、強力なコンピュータービジョン機能を網羅しています。 このガイドの利用方法については、

2025年のAIランドスケープは、GoogleのGemini 2.0 FlashとOpenaiのO4-Miniの到着とともに感動的です。 数週間離れたこれらの最先端のモデルは、同等の高度な機能と印象的なベンチマークスコアを誇っています。この詳細な比較


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

Dreamweaver Mac版
ビジュアル Web 開発ツール

SecLists
SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

mPDF
mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。

SublimeText3 英語版
推奨: Win バージョン、コードプロンプトをサポート!

VSCode Windows 64 ビットのダウンロード
Microsoft によって発売された無料で強力な IDE エディター

ホットトピック









