検索
ホームページテクノロジー周辺機器AIOpenai Codex Cli -Analytics Vidhyaを使用して画像キャプションアプリを構築しようとしました

まとめ

  • Codex CLIは、OpenAIモデルと対話して、自然言語を使用してコードを読み、変更し、実行できる端末ベースのAIアシスタントです。
  • プライバシーのためにローカルで実行され、マルチモーダル入力(テキスト画像)をサポートし、シェルとシームレスに統合して、スムーズなワークフローを使用します。
  • 提案、自動編集、およびフルオートモードを介して調整可能な制御を備えたバグの修正、リファクタリング、学習コードベース、およびプロトタイピングをサポートします。
  • Node.jsとOpenai APIキーを使用して簡単にインストールでき、WSL2を介してUNIXベースのシステムまたはWindowsで最適に機能します。

Openai Codex CLIは、OpenAIの最新の推論モデルの力を端末に直接もたらすオープンソースコマンドラインツールです。シェルに住んでいる軽量AIコーディングアシスタントと考えてください。コードを読み取り、ファイルを変更し、プロジェクト環境でコマンドを実行することもできます。これは、開発ワークフローを離れることなく、機能の構築、バグの修正、馴染みのないコードの説明を依頼することができることを意味します。要するに、それはチャット駆動型開発です - あなたは自然言語でコーデックスと対話し、コード編集またはコマンドの結果で応答し、ChatGPTレベルの推論に加えてコードを実行してリアルタイムで結果を見る機能を効果的に提供します。興味深いですね。さらに、この記事では、クエリにアクセスして使用する方法について説明します。

目次

  • Openai Codex CLIの主要な機能
  • あなたが知っておくべきコーデックスCLIモード
  • Codex CLIのシステム要件
  • Openai Codex CLIの使用方法は?
  • ゲームと画像のキャプションアプリを構築するための実践的なOpenai CodexCLI
  • Codex CLIのユースケース
  • 結論

Openai Codex CLIの主要な機能

Openai Codex CLIには、開発者にとって便利なコンパニオンになるいくつかの強力な機能があります。 Codex CLIの最大の利点の1つは、ローカルマシンで完全に実行されることです。ソースコードとファイルは環境にとどまり、クラウドサービスに卸売りをアップロードしていません。応答を生成するために、プロンプトと高レベルのコンテキスト(要約されたdiffsや関連するスニペットなど)のみがOpenai APIに送信されます。 CLIはオープンソースであり、ローカルで動作するため、プライバシーとデザインで制御できます。ワークフローとコードはプライベートのままです。これにより、Codex CLIは、強力なAI支援を活用しながら、共有したくない、または共有したくないコードベースに対して特に魅力的になります。

ターミナルに直接統合することにより、Codex Cliは自然に開発者の日々の作業に適合します。 GITコマンド、テキストエディター、およびビルドツールのすぐ横にあるAIアシスタントとチャットできます。これは、別のチャットインターフェイスを使用するのと比較して、コンテキストスイッチングが少ないことを意味します。このツールは、迅速なイテレーションのために設計されています。質問をしたり、指示を行ったり、変更を提案または適用したり、コードを実行したり、1か所で繰り返したりします。

ハイライトのいくつかは次のとおりです。

1。ゼロセットアップインストール

Codex CLIは走るのが非常に簡単です。必要なのはnode.jsとopenai APIキーだけです。NPMインストール-g @openai/codexのような単一のコマンドは、他のセットアップが必要ありません。複雑な構成や環境の気分はありません。 APIキーを持参すると、「機能するだけ」。 (Simple Codex –Upgradeコマンドを使用して、いつでも最新バージョンに更新することもできます。)

2。ターミナルネイティブデザイン

コーデックスはターミナルで完全に動作するため、シェル環境の自然な延長のように感じます。プロジェクトディレクトリから呼び出して、ローカルファイルやツールと対話することができます。このターミナルネイティブアプローチは、ブラウザやGUIに切り替える必要がないことを意味します。コーディング中にフローとコンテキストを維持するのに最適です。 CLIはテキストにインタラクティブなチャットのようなインターフェイスを提供するため、コンソールにAIの応答(コードdiffsやコマンド出力など)が表示されます。

3。マルチモーダル入力

Plain Textのみのツールとは異なり、Codex CLIはマルチモーダル入力を受け入れます。テキストプロンプトだけでなく、スクリーンショットや図などの画像もアシスタントを導くことができます。たとえば、エラーメッセージまたはUIスケッチのスクリーンショットを端末にドラッグすると、Codexが解釈して行動できます。これは、AIが視覚情報を使用してそれに応じてコードを生成または編集できる独自の機能です。ボンネットの下では、ビジョン対応モデルを使用して画像を理解し、スタックトレースのスクリーンショットからデバッグしたり、ワイヤーフレームからレイアウトを構築したりするなどのユースケースを可能にします。

4。リッチ承認ワークフロー

Codex CLIは、豊富な承認システムを通じて自律的に何ができるかについて、きめの細かい制御を提供します。 AIの提案されたコードの変更またはコマンドが自動実行されているか、確認が必要かどうかを判断する3つのモード(Auto Edit、Full Auto)から選択できます。この柔軟なワークフローを使用すると、あなたがどのようになりたいかを決定できます。控えめに(すべての手動承認)を開始し、繰り返しタスクの完全な自動化にダイヤルアップできます。次のセクションでは、これらのモードをさらに深く掘り下げますが、重要なポイントは、Codexが不快な変更を加えないことです。常に承認を担当しています。

5。ローカルの実行とプライバシー

すべてのコードの実行とファイル編集は、プロジェクトの環境内でマシンで行われます。モデルのクエリは別として、何も送信されません。CLIはコードベースをOpenAIにアップロードしません。これは、完全なプライバシーを保持することを意味します。ツールがデータを保持または共有していないことを知っている独自または機密コードでCodex CLIを安全に使用できます。最も自律的なモードを使用する場合でも、Codexはネットワークアクセスなしでサンドボックス環境で実行され、システムにローカルにとどまるアクションが保証されます。要するに、プライバシーやセキュリティを放棄することなく、AIペアプログラマーの利点を得ることができます。

あなたが知っておくべきコーデックスCLIモード

GitHubリンク:Openai/Codex

Codex CLIの傑出した機能は、その承認ワークフローです。基本的に、AIがどの程度の自由度を変更したり、コマンドを実行したりする自由度を決定します。 3つの承認モードがあります。これは、Auto Edit、およびFull Autoです。各モードは、自動化とユーザーの監視の間で異なるバランスをとっているため、手元のタスクの快適レベルに合ったものを選択できます。これらがどのように機能するかの概要は次のとおりです。

1.モードを提案する(デフォルト)

これは最も保守的なモードであり、すべてを慎重に確認したい場合に最適です。 AIはプロジェクトファイルを読み取り、コード編集または端末コマンドを提案できますが、明示的な承認なしに変更を適用したり、何も実行したりしません。基本的に、Codexは専門家のアドバイザーのようにあなたとやり取りします。バグ修正のパッチdiffを提案するか、テストを実行するシェルコマンドを表示してから確認を求めます。安全な探索には、新しいコードベースの学習やコードレビューの実行など、推奨事項を確認したいが、手動で適用するために提案モードを使用します。

2。自動編集モード

自動編集では、Codexはコードの変更を自動的に適用できます(独自のファイルに編集/書き込みができます)が、シェルコマンドを実行する前に尋ねる必要があります。このモードは、コードベース全体でリファクタリングや繰り返し編集を行うなどのタスクに最適です。プログラムの実行前にコントロールのチェックポイントを保持しながら、AIの直接修正コードの効率を取得します。たとえば、Codexは複数のファイルで関数を書き換えてすぐに変更を保存する可能性がありますが、テストスイートを実行したりDEVサーバーを起動したりする場合は、一時停止して順調になります。自動編集モードはバランスです:コードの反復が高速ですが、コマンドのような副作用を監督します。

3。フルオートモード

フルオートは、AIに最も自律性を与えます。 Codexは、承認のために停止することなく、ファイルを読み取り、書き込み、独自にシェルコマンドを実行できます。このモードでは、それは真に自動エージェントになります。複雑なタスクを実行してから、ステップを介して動作している間に座るように依頼することができます。物事を安全に保つために、制限付きサンドボックスで完全な自動を実行します。すべてのコマンドは、ネットワークアクセスが無効にされ、プロジェクトディレクトリにスコープされた状態で実行されます(外でさまようこともインターネットにアクセスすることもできません)。このモードは、AIが反復することを信頼する長いタスクに最適です。たとえば、壊れたビルドを修正したり、短い休憩を取っている間に新しい機能をプロトタイプしたりすることに最適です。もちろん、慎重にフルオートを使用する必要があります。強力ですが、バックアップまたはバージョン制御コードを確認する必要があります(CLIは、自動編集またはフルAutoを開始するときにGITリポジトリにいない場合はCLIが実際に警告します)。

モードの比較

3つのモードの違いは、以下の表に要約されており、それぞれの典型的なユースケースとともに。

モード エージェントができること いつ使用するか(ユースケース)
提案(デフォルト) - repo
のファイルを読む - 編集とシェルコマンドを提案します(適用/実行するには承認が必要です)
コードベース、コードレビュー、変更を完全に制御したい新しいプロジェクトの構造の安全な調査。
自動編集 - ファイルの読み取りと変更(編集を自動的に適用)
- シェルコマンドを提案します(実行には承認が必要です)
副作用に注目しながら、コードのリファクタリングまたはバルク編集を行います。手動ファイルの編集が退屈であるが、それでもコマンドを承認したい繰り返しの変更に最適です。
フルオート - コマンドを自律的に読み取り、書き込み、実行します(すべてのアクション自動承認)
- サンドボックスで実行されます(ネットワークなし、プロジェクトディレクトリに限定)
壊れたビルドですべてのテストを修正したり、新しいアプリをゼロから足場にしたりするなど、大規模または時間のかかるタスク。実行を完全にAIに委任する場合に役立ちます(例:クイックプロトタイピング)。

実際には、状況に合ったモードを選択できます。デフォルトでは、Codexを実行するだけの場合は、提案モードで開始します。モードを明示的に選択するには、Flagを使用してCLIを起動できます。たとえば、–auto-editまたは-full-autoを使用して、これらのモードで開始します。セッション中にモードを切り替えるインタラクティブコマンド(/モード)もあります。このようにして、Codexが何をするかを確認するために提案モードから始めてから、その提案に慣れたら自動編集に切り替えて、タスクの最終ストレッチのためにフルオートにキックするかもしれません。重要なことは、常に自律性のレベルを制御することです。

Codex CLIのシステム要件

Codex CLIをインストールする前に、開発環境が最小要件を満たしていることを確認してください。このツールはクロスプラットフォームですが、現在はUNIXのようなシステムで最適です。これが最小および推奨される仕様です。

要件 最小 推奨
オペレーティング·システム macos 12またはubuntu 20.04 /debian 10(linux);wsl2経由でWindows11 最新のOSアップデート(最新のMacOSまたはLTS Linuxリリース、最新のWSL2を備えたWindows)の最適な互換性。
node.js 22(または新しい) 安定性のためのnode.js(> = 22)の最新のLTSバージョン。
git (オプション) 2.23(バージョン制御機能を使用する場合) 利用可能な最新のGit(オプションですが、PRヘルパーのような完全な機能に推奨されます)。
メモリ(ラム) 最小4 GB 8 GB以上(大規模なタスクでのスムーズなパフォーマンスの場合)。

Codex CLIは、MacOSとLinuxでテストされています。 Windowsユーザーは、Native Windowsサポートがまだ実験的であるため、WSL2(Linux用のWindowsサブシステム)を介して実行できます。また、CLIを認証するには、OpenAI APIキー(OpenAIアカウントから)が必要です。次に説明します。これらとは別に、他の特別なハードウェアは必要ありません。最新のnode.jsを実行できれば、おそらく行ってもいいでしょう。

注: Codex CLIを使用する場合、特に自動モードの場合は、プロジェクトをソースコントロール(GIT)の下に置くことをお勧めします。 GITはCLIを実行するために厳密に必要はありませんが、バージョン制御により、必要に応じて変更とロールバックを簡単に確認できます。実際、Codexは、Git Repoではないディレクトリで自動編集またはフルオートを使用しようとする場合の警告を思い出させます。

Openai Codex CLIの使用方法は?

ステップ1:node.jsをインストールします

Openai Codex Cli -Analytics Vidhyaを使用して画像キャプションアプリを構築しようとしました

  1. nodejs.orgからnode.js v22をダウンロードします。
  2. デフォルト設定を使用してインストールします。
  3. インストールの確認:
バッシュ
ノード - バージョン<em>#はV22を表示する必要があります</em>
npm -version <em>#はV10を表示する必要があります</em>

ステップ2:Codex CLIをインストールします

Openai Codex Cli -Analytics Vidhyaを使用して画像キャプションアプリを構築しようとしました

バッシュ
npmインストール-g @openai/codex
  • トラブルシューティング:許可が拒否された場合、エラーを拒否した場合:
    • Windows:管理者としてPowerShellを実行します。
    • Linux/macos:sudo npm install -g @openai/codex(推奨されない;代わりにNPM許可を修正)を使用します。

ステップ3:OpenAI APIキーを設定します

Openai Codex Cli -Analytics Vidhyaを使用して画像キャプションアプリを構築しようとしました

PowerShell(Windows)の場合:

Powershell

 $ env:openai_api_key = "your-api-key-here"

それを永続的にするために:

Powershell

 setx openai_api_key "your-api-key-here"

git bash/mingw64の場合:

バッシュ
openai_api_key = "your-api-key-here"

永続的にするには、〜/.bash_profileに追加します:

バッシュ
nano〜/.bash_profile# "export openai_api_key = ..."を追加
ソース〜/.bash_profile

ステップ4:「sh.exe」エラー(Windowsのみ)を修正

  1. git-scm.comからWindows用のgitをインストールします。
  2. インストール中:
    • [コマンドプロンプトでgitおよびunixツールを使用]を選択します。
    • 「シンボリックリンクを有効にする」を有効にします。
  3. ターミナルを再起動します。

ステップ5:コーデックスを実行します

インタラクティブモード

インタラクティブに実行:

コーデックス

ゲームと画像のキャプションアプリを構築するための実践的なOpenai CodexCLI

タスク1:基本的なプロンプト実行

Openai Codex Cli -Analytics Vidhyaを使用して画像キャプションアプリを構築しようとしました

私は簡単なタスクから始めました。Codexに自分自身について2〜3文を書くためにアサードしています。 CLIは迅速かつ正確に応答し、わずか数秒でコヒーレントで文法的に音の出力を生成しました。入力が最小限であっても、強い迅速な理解と流encyさを示しました。

タスク2:OpenAIモデルを使用した画像キャプションアプリ

次に、より複雑なアプリケーションを構築してみました。ユーザーが画像をアップロードし、OpenAIモデルによって生成された説明的なキャプションを受信する画像キャプションツールです。 Codexはまともな出発点を提供しましたが、コードは時代遅れでした。非推奨コードと、ファイルの処理とモデル統合のための重要なコンポーネントの欠落を参照してください。自分でコードを介して更新しなければなりませんでした。 (参照用のスクリーンショットを含めました。)これは、制限を強調しました。新しいまたはあまり文書化されていないAPIの場合、Codexは古いパターンまたは不完全な実装に頼る可能性があります。

Codex CLIでのエラー

Openai Codex Cli -Analytics Vidhyaを使用して画像キャプションアプリを構築しようとしました

タスク3:PythonとPygameを使用したTetrisゲーム

出力

最終タスクについては、CodexにPythonとPygameを使用してTetrisゲームを構築するように依頼しました。今回は、それを釘付けにしました。コードは十分に構造化されており、完全に機能しており、主要な編集を必要としませんでした。ゲームはスムーズに実行され、ブロックの動き、回転、ラインのクリア、スコアリングなど、すべてのコアメカニズムが含まれていました。 Pygameのような確立されたライブラリを操作する際に、インタラクティブなグラフィックベースのプロジェクトを処理するCodexの能力のしっかりしたデモンストレーション。

Codex CLIのユースケース

Codex CLIは、いくつかの一般的なタスクで開発ワークフローを充電できます。

  1. バグの修正:バグまたは障害のテストにヒットした場合、[ログイン関数がエラーを投げているのはなぜですか?」などのことを尋ねるために、suggest Modeを使用して使用します。 Codexは、コードを分析し、問題(間違った変数やチェックの欠落など)を見つけ、修正を提案します。パッチを確認して承認します。トリッキーな問題の場合、フルオートモードを使用すると、Codexがテストを繰り返し実行して変更を適用することにより、Codexが複数の障害を修正できます。それでも結果を確認しますが、重い持ち上げを処理します。
  2. コードのリファクタリング:コールバックから非同期/待望への切り替えなど、ファイル間のリファクタリングは退屈です。自動編集モードでは、Codexはコードベース全体に一貫した変更を適用できます。たとえば、「APIルートをリファクタリングしてAsync/awaitをリファクタリングしてください」と言うと、ファイルの編集が処理され、必要に応じて一時停止します。 diffsを介して変更を監督し、品質を監督しながらCodexがうなり声を上げます。
  3. 新しいコードベースの学習:リポジトリをクローン化しましたか?提案モードを使用して、「スケジューラクラスは何をしますか?」と尋ねます。または「認証はどのように機能しますか?」 Codexはコードを読み取り、平易な言葉で説明し、なじみのないプロジェクトを迅速にナビゲートするのに役立ちます。変更を加えることなく、概要を要求し、モジュールの責任を理解し、機能を探索できます。
  4. プロトタイピングと足場:新しいプロジェクトや機能をキックスタートしたいですか?フルオートモードはコードを生成し、すべてをセットアップできます。 「FlaskでシンプルなTodo Webアプリを作成する」ように依頼すると、ファイルを生成し、依存関係をインストールし、アプリを自動的に実行します。 「このCLIツールへのCSVエクスポートを追加」などの新機能については、Codexはコードを書いて統合して、構築するための実用的なベースラインを提供します。

Codex CLIは、AIペアプログラマーのように機能します。これは、ありふれた編集から複雑な自動化まで、あらゆるものを溶かしています。タスクに応じて、それがどれだけ実践的または自律的であるかを制御します。

結論

Openai Codex CLIを使用すると、開発者はターミナルでフレンドリーなAIパートナーを獲得します。コードについて推論し、編集と実行のメカニズムを処理できます。 Codex CLIが何であり、ゼロエフォルトのインストールからあなたをコントロールし続ける巧妙な承認モードまで、それがどのように機能するかについて説明しました。いくつかの基本的なコマンドを開始して実行する方法と、バグの修正、リファクタリング、コードベースの学習、新しいアイデアのプロトタイピングなどの実際のユースケースに役立つ方法がわかりました。本質的に、Codex CLIはChatGPTエクスペリエンスを開発環境に持ち込み、自然言語の指示を担当している間、動作コードに変えます。これは、AIアシストされたソフトウェア開発の未来を具体化するエキサイティングなツールです。高速、柔軟性、および開発者のエンパワーメントを念頭に置いて構築されています。次のプロジェクトで試してみてください!

以上がOpenai Codex Cli -Analytics Vidhyaを使用して画像キャプションアプリを構築しようとしましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
AIゲーム開発は、激動の夢想家ポータルでエージェントの時代に入りますAIゲーム開発は、激動の夢想家ポータルでエージェントの時代に入りますMay 02, 2025 am 11:17 AM

激動ゲーム:AIエージェントとのゲーム開発に革命をもたらします BlizzardやObsidianなどの業界の巨人の退役軍人で構成されるゲーム開発スタジオであるUpheavalは、革新的なAIを搭載したPlatforでゲームの作成に革命をもたらす態勢を整えています。

UberはあなたのRobotaxiショップになりたいと思っています、プロバイダーはそれらを許可しますか?UberはあなたのRobotaxiショップになりたいと思っています、プロバイダーはそれらを許可しますか?May 02, 2025 am 11:16 AM

UberのRobotaxi戦略:自動運転車用の乗車エコシステム 最近のCurbivore Conferenceで、UberのRichard Willderは、Robotaxiプロバイダーの乗車プラットフォームになるための戦略を発表しました。 で支配的な位置を活用します

ビデオゲームをプレイするAIエージェントは、将来のロボットを変革しますビデオゲームをプレイするAIエージェントは、将来のロボットを変革しますMay 02, 2025 am 11:15 AM

ビデオゲームは、特に自律的なエージェントと現実世界のロボットの開発において、最先端のAI研究のための非常に貴重なテストの根拠であることが証明されています。 a

スタートアップインダストリアルコンプレックス、VC 3.0、およびジェームズクーリエのマニフェストスタートアップインダストリアルコンプレックス、VC 3.0、およびジェームズクーリエのマニフェストMay 02, 2025 am 11:14 AM

進化するベンチャーキャピタルの景観の影響は、メディア、財務報告、日常の会話で明らかです。 ただし、投資家、スタートアップ、資金に対する特定の結果はしばしば見落とされています。 ベンチャーキャピタル3.0:パラダイム

AdobeはAdobe Max London 2025でクリエイティブクラウドとホタルを更新しますAdobeはAdobe Max London 2025でクリエイティブクラウドとホタルを更新しますMay 02, 2025 am 11:13 AM

Adobe Max London 2025は、アクセシビリティと生成AIへの戦略的シフトを反映して、Creative Cloud and Fireflyに大幅な更新を提供しました。 この分析には、イベント以前のブリーフィングからの洞察がAdobeのリーダーシップを取り入れています。 (注:ADOB

すべてのメタがラマコンで発表しましたすべてのメタがラマコンで発表しましたMay 02, 2025 am 11:12 AM

MetaのLlamaconアナウンスは、Openaiのような閉じたAIシステムと直接競合するように設計された包括的なAI戦略を紹介し、同時にオープンソースモデルの新しい収益ストリームを作成します。 この多面的なアプローチはBOをターゲットにします

AIは単なる通常のテクノロジーに過ぎないという提案に関する醸造論争AIは単なる通常のテクノロジーに過ぎないという提案に関する醸造論争May 02, 2025 am 11:10 AM

この結論に関して、人工知能の分野には深刻な違いがあります。 「皇帝の新しい服」を暴露する時が来たと主張する人もいれば、人工知能は普通の技術であるという考えに強く反対する人もいます。 それについて議論しましょう。 この革新的なAIブレークスルーの分析は、AIの分野での最新の進歩をカバーする私の進行中のForbesコラムの一部です。 一般的な技術としての人工知能 第一に、この重要な議論の基礎を築くためには、いくつかの基本的な知識が必要です。 現在、人工知能をさらに発展させることに専念する大量の研究があります。全体的な目標は、人工的な一般情報(AGI)を達成し、さらには可能な人工スーパーインテリジェンス(AS)を達成することです

モデル市民、なぜAI価値が次のビジネスヤードスティックであるのかモデル市民、なぜAI価値が次のビジネスヤードスティックであるのかMay 02, 2025 am 11:09 AM

企業のAIモデルの有効性は、現在、重要なパフォーマンス指標になっています。 AIブーム以来、生成AIは、誕生日の招待状の作成からソフトウェアコードの作成まで、すべてに使用されてきました。 これにより、言語modが急増しました

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

WebStorm Mac版

WebStorm Mac版

便利なJavaScript開発ツール

SublimeText3 英語版

SublimeText3 英語版

推奨: Win バージョン、コードプロンプトをサポート!

EditPlus 中国語クラック版

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強力な PHP 統合開発環境

AtomエディタMac版ダウンロード

AtomエディタMac版ダウンロード

最も人気のあるオープンソースエディター