search
HomeMobile Game TutorialGaming NewsWhat is AI technology that automates system function tests including gameplay? Report on a session introducing the efforts of the PS5 system software QA team [CEDEC 2024]

On August 21, 2024, at the game developer conference "CEDEC 2024", a session "AI technology that realizes game play automation under the same conditions as human players on PlayStation 5" was held.

ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]

In this session, AI technology that realizes gameplay automation was introduced, which is used in some functional tests during QA (quality assurance) of PS5 system software. The speakers were the following three people.

Sony Interactive Entertainment Game Services R&D Department Machine Learning Researcher Hiroyuki Yabe
Sony Interactive Entertainment Game Services R&D Department Machine Learning Researcher Yutaro Miyauchi
Sony Interactive Entertainment Platform System and Experience Design Division S Department 3 Department 3 Software Engineer, Software QA Engineering Mr. Hiroki Nakahara
ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]


System software QA efforts


The PS5 has system functions such as the home and control center, but in order to ensure the quality of the system software's display content and screen transitions, the system software QA team (hereinafter referred to as the QA team) has automated testing. It is said that it is actively adopting.

ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]

It seems that there are several benefits to test automation, and one example was the ability to continue testing until the software is released. If this is a manual test, it will be done on a case-by-case basis, but in most cases it will only be done a few times per project.
In that case, if a bug were introduced at the timing indicated by the red arrow in the slide below, it would be detected during testing at the end of the project, indicated by the blue arrow, and there would be a risk that it would affect the release.

ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]

 一方,自動テストであれば毎日でも実施可能であり,緑色の矢印のタイミングですぐにバグを検出できるため,「バグの早期発見」というメリットが生じる。また,開発コードのコミット前に自動テストを実施できれば,バグの混入も防止できるとのこと。

 そのような観点から,QAチームではテスト自動化を推進しているわけだが,ゲームプレイに連動したシステム機能に関しては,少し考慮する必要があるという。
 その1つが現在プレイ中のゲームにおける進行状況などをカードとして表示する「アクティビティ」で,カードに進行度や推定プレイ時間などが正しく表示されるかどうかもQAの対象となる。また,カードの内容がゲームプレイに応じて変化することもあり,その変化に関する部分が正しく動いているかなどもQAの対象であることが示された。

ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]

 さらにシステムソフトウェアの機能テストには,アクティビティの更新内容を確認するときなど,ある程度のゲームプレイが必要なケースもある。そのため,効率化や不具合の早期発見などの観点からは,このゲームプレイも自動化することが望ましい。

ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]

 ゲームプレイに連動したシステムソフトウェアの機能はアクティビティ以外にもあり,タイトルによって使われているものとそうでないものとがある。そのため,ゲームプレイに連動した機能のテストを自動化する際には,タイトル依存のない汎用的な形での自動化が求められる。
 加えて,その自動テストは人間のプレイヤーと同じ条件,つまり画面情報と音声情報のみを使ったものであることが求められる。そうした制約のため,ゲームプレイに連動した機能の自動テストは極めてハードルが高かったそうだ。

ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]


自動プレイシステムの概要


 上記のとおり,PS5のシステムソフトウェアの機能テストには,利用可能な情報がゲームの画面情報と音声情報のみであること,また特定のゲームタイトルに依存しない汎用的な技術であることが求められる。また,QAの現場に持ち込むためには,現実的なコストで自動化を実現できることも必要だ。
 そうした制約を踏まえ,QAチームでは人間のプレイを学習して再現する技術である「模倣学習」をベースに,複数の技術を組み合わせて自動プレイシステムを開発したという。

 本セッションでは,PS5にプリインストールされている「ASTRO's PLAYROOM」の事例を使って,この自動プレイシステムの概要などが紹介された。このシステムはPC上で動作し,PS5からゲーム情報として画面情報のみを取得している。そのうえで,システムがコントローラの操作内容を決定し,それをPS5に送信することにより,ゲームを自動で操作している。

ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]

 また,このシステムでは2種類のエージェントを使ってゲームを自動操作する。1つは「リプレイエージェント」と呼ばれるもので,事前に記録した手動のゲームプレイを再生することで,その手動プレイと同じ操作内容を再現する。
 もう1つの「模倣エージェント」は,機械学習の1つである模倣学習によって人間のゲームプレイを学習したAIモデルが,人間のゲームを再現する。

ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]

 リプレイエージェントは,事前の手動プレイとまったく同じコントローラの操作を再現するという性質上,ランダムな要素が一切存在せず,常に同じ操作で進行可能なシーンのみで利用することとなる。
 具体的には,タイトル画面でゲームをスタートさせるなどの一部のUI操作や,スタート地点とゴール地点が常に変わらない固定ルートの移動などである。加えて,QAにおける機能テストに必要なPS5本体側の操作なども,リプレイエージェントで行っているとのこと。

ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]

 模倣エージェントに人間のゲームプレイを学習させる模倣学習とは,手本となる行動データから,その行動パターンを再現するモデルを作成する機械学習の一種。具体的な模倣エージェントの作成手順は,事前にゲームを手動で複数回プレイし,そのデータを用いて模倣学習を行い,その手動プレイの操作内容を再現できるモデルを構築する。

ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]

 この模倣エージェントのモデルは,入力としてゲームの画面情報のみを必要とする。ゲームの画面情報を入力すると,次のフレームにおけるコントローラの状態を出力する設定となっており,毎秒10フレームで動作させることによってリアルタイムに操作を決定できるという。この模倣エージェントが対象とするのは,リプレイエージェントが適用できないシーンすべて,つまりわずかでもランダムな要素があるシーン全般となる。

ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]

 今回の「ASTRO's PLAYROOM」の事例では,模倣エージェント用にステージ別のモデルを用意したとのこと。その理由は,1つのモデルが担当するシーンを少なくするほど,モデルそれぞれの性能が安定するからだ。

ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]

 また,2つのエージェントを切り替えるタイミングを判定する機能として,「シーン認識」も用意した。この機能は,画面情報からゲームが特定のシーンに到達したことを判定するもので,大きく2つの技術を用いている。その1つが「テンプレートマッチング」で,あらかじめ準備したテンプレート画像と同じオブジェクトがゲームの画面内に存在しているかを判定する。
 例えば,クエスト攻略時に出てくるアイコンやポップアップなどを認識する場合に利用しているそうだ。

ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]

 もう1つが「特徴点マッチング」で,あらかじめ準備したターゲット画像と,ゲーム画面の類似度を常にチェックしているという。類似度が閾値を超えると,ゲームがターゲット画像と同じシーンに到達したと判定してエージェントを切り替えるとのこと。

ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]

 また特徴点マッチングをシーン認識に活用する上では,「見た目のブレに対するロバスト性」が重要になることにも言及された。例えば,同じエリアに到達したとしても,カメラの向きが異なることによって,画面の見え方が変わってしまうことは珍しくない。同様に,ゲーム内の時刻によってライティングが変わってしまうこともある。そういった見た目の変化に対して,QAチームでは機械学習ベースの画像マッチング手法である「LoFTR」を活用したことも明かされた。

ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]

自動プレイシステム概要のまとめ
ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]


ゲームプレイ自動化の手順


 ゲームプレイの自動化にあたっては,まず,ゲームプレイを含む自動化したいテストの内容を決定する必要がある。そして,そのテストの内容をエージェントの単位に分割する。
 次にゲームを実際に手動プレイして,リプレイエージェントの場合は1回,模倣エージェントの場合は10回以上のプレイデータを取得する。ここで模倣エージェントの場合は,取得したデータを用いて模倣学習を行う。

ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]

 模倣学習が完了したら,2つのエージェントを実際に動かして,自動プレイできるかどうかの確認を行う。自動プレイが失敗した場合には,データの取得フェーズに戻り,データ取得→模倣学習→動作確認→……というフローを自動プレイが成功するまで繰り返すこととなる。
 自動プレイに成功したら,Jenkinsなどの定期実行パイプラインを使ってプロセスを整える。これがゲームプレイ自動化の一連の流れである。

ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024] ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]
ゲームプレイ自動化の各手順における機材構成やデータフローも紹介された
ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]

 QAチームでは,この自動プレイシステムを用いて,ゲームプレイを含む機能テストを実際に自動化して定期実行しているとのこと。その結果,システム上のバグを3件自動検出しており,それらのバグが混入した直後の機能テストで検出できたことも判明しているという。なおバグの検出数が少ないのは,今のところ機能テストの自動化が限定的な範囲でのトライアルという位置付けだからであるそうだ。

ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]

そのほかのゲームプレイ自動化の事例も示された
ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]


模倣エージェントの技術的説明


 模倣エージェントの技術的説明では,まず模倣学習のアルゴリズムが紹介された。今回の取り組みでは,先に記した「どんなタイトルに対しても適用できる汎用性」に加え,エンジニアのスキルがなくとも模倣エージェントを作成できる「誰でも使える簡易性」を目指したという。

ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]

 それら2つの目標を踏まえて,QAチームではアルゴリズムとして「Behaviour Cloning」を採用したとのこと。このアルゴリズムは模倣学習の中ではもっともシンプルなもので,モデルの入力と出力を結びつける教師あり学習だ。今回のケースでは,入力をゲーム画面,出力をコントローラ操作として学習を進めていくこととなる。具体的な模倣エージェントの作成の流れは,上記のとおり事前に手動プレイでゲーム画面とコントローラの情報をデータとして記録し,そのプレイデータをモデルに学習させるというものである。

ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]

 モデルの構造は極めてシンプルになっており,入力された1枚のみの画像を画像特徴量抽出層とコントローラ状態出力層(全結合層)に通して,最終的にコントローラの状態を出力する。また,操作および記録の頻度を毎秒10フレームにしているのは,学習を簡単にするためとの説明もなされた。

ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]

 コントローラのアナログスティックの出力は,アナログ値ではなく上下左右斜めとニュートラルを合わせた全9クラスとして扱っている。これは学習の容易さを踏まえた結果だという。
 また,モデルの出力に関しては,コントローラの各ボタンとスティックの状態を出力させるため,それぞれに最終層が分岐したようなネットワークを使用。最終層となる全結合層では,ボタンであればオン / オフそれぞれの誘導,スティックであれば各方向の誘導を出力している。これには,データセットに合わせて余分な操作のネットワークを作らないことにより,不要な学習の発生を防ぎ,モデルの性能を向上させる意味があるとのことだ。

ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024] ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]

 画像特徴量抽出層には,事前学習済みのEfficientNetのエンコーダを利用。模倣学習時には,そのEfficientNetのエンコーダにはさらなる学習をさせず,全結合層にのみ学習させたという。これは,少ないゲーム画面でエンコーダに学習させるより,大量の実写画像で事前学習されたEfficientNetのエンコーダを使うことによって,モデルの性能が上がることがさまざまな事例で確認されているからとのことだ。加えて,全結合層のみの学習はネットワークが小さくなるため,学習にかかる時間が短いこともメリットとして示された。

ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]

 入力を画像1枚にしているのは,入力を増やすとモデルの性能が落ちるという,これまでの実験結果がベースになっていることも明かされた。この傾向は「ASTRO's PLAYROOM」に限らず,ほかのゲームのタスクにも見られるそうだ。

ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]

 今回の取り組みで,直面した課題にどう対応したかについても紹介された。例えば,「ランダム地点に落ちている,進行に必須なアイテムを拾うためにボタンを押す」といったような操作はゲームにおいて珍しくない。しかしそういった,出現数は少ないもののクリア率に大きく影響する操作は,深層学習において学習がなかなか進まず,期待どおりにボタンを押すモデルを作成するのは非常に困難だという。

ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]

 そこで今回の取り組みでは,学習がモデルに与える影響度を調整する「Class Balance」を用い,出現割合が少ない操作であるほど重みを付けて,その学習がより強くモデルに反映されるようにしたそうだ。

ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024] ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]

 そのほか模倣学習の弱点として,操作に失敗して手本となるデータから乖離してしまうと復帰が困難になることも挙げられた。これに関しては,未知の状態から手本のある状態まで復帰する追加データを学習させることで解決したとのこと。

ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024] ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]

模倣エージェントの技術的課題と今後の発展も示された
ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]

 セッションの最後には,今回紹介された自動プレイシステムの検証を通じて,今後のQAテストの品質向上が見込めることが確認できたとの見解が示された。

ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート[CEDEC 2024]

The above is the detailed content of What is AI technology that automates system function tests including gameplay? Report on a session introducing the efforts of the PS5 system software QA team [CEDEC 2024]. For more information, please follow other related articles on the PHP Chinese website!

Statement
The content of this article is voluntarily contributed by netizens, and the copyright belongs to the original author. This site does not assume corresponding legal responsibility. If you find any content suspected of plagiarism or infringement, please contact admin@php.cn
NYT Connections hints today: Clues, answers for May 11, 2025NYT Connections hints today: Clues, answers for May 11, 2025May 12, 2025 am 10:58 AM

The New York Times word game Connections is a popular daily puzzle challenging players to find common threads between words. Similar to Wordle, it resets daily, offering a new set of increasingly difficult word groups. This guide provides hints and

NYT 'Connections' Hints And Answers For Monday, May 12NYT 'Connections' Hints And Answers For Monday, May 12May 12, 2025 am 10:57 AM

New York Times Connections game Monday, May 12th, Tips and Answers Hello everyone, connecters! A new week has begun. We have a small tradition here, playing a cheerful song at the beginning of every Monday column, hoping to make everyone move, relax their body and mind, and release some endorphins. This week, we will be back in 2012 to listen to the songs of two Canadian idols. "Closer" is one of Tegan and Sara's most popular songs, a dynamic dance-pop: Before we start, we have a great Discord community where we discuss the New York Times Connections, other New York Times games and all sorts of other things. Each joined

'Quordle' Hints And Answers For Monday, May 12'Quordle' Hints And Answers For Monday, May 12May 12, 2025 am 10:51 AM

"Quordle" tips and answers on Sunday, May 11 Hello everyone! Today's Quordle word prompts and answers are right in front. How to play Quordle For any newbie who joins us, here’s how to play Quordle: Just start typing words. You need to guess four five-letter words and have nine attempts to find them. The key is that you play all four words at the same time. If you find the letter in the correct position in any of the four words, it will light up in green. If a word contains a letter in your guess but has the wrong position, it will be displayed in yellow. You can check out the practice game at any time before starting the daily puzzle. Today's Quordle game

WWE Backlash 2025: Winners, Surprises And Everything You Should KnowWWE Backlash 2025: Winners, Surprises And Everything You Should KnowMay 12, 2025 am 10:43 AM

WWE Backlash 2025: A Night of Thrilling Matches and Unexpected Twists While no new champions were crowned at WWE Backlash 2025 in St. Louis, the event delivered a series of captivating matches. Let's break down the highlights, including John Cena's

Samsung's Super-Thin Galaxy S25 Edge Has Piqued My InterestSamsung's Super-Thin Galaxy S25 Edge Has Piqued My InterestMay 12, 2025 am 10:37 AM

Samsung's upcoming Edge phone promises flagship-level performance comparable to the Galaxy S25 Ultra, but with a significantly slimmer profile: a mere 5.8mm compared to the Ultra's 8.2mm. This dramatic reduction in thickness is intriguing, especiall

'NYT Mini' Crossword Hints, Clues And Answers For Monday, May 12'NYT Mini' Crossword Hints, Clues And Answers For Monday, May 12May 12, 2025 am 10:34 AM

"New York Times Mini Crossword" Sunday May 11 Tips, Clues and Answers Author: Kris Holt Want to know what the movement of the ocean is like? Not sure which actress has Garr's last name? Don't worry, I'll be here to provide you with extra tips and answers to the New York Times Mini Crossword today. The New York Times Mini Crossword is a simplified version of the newspaper's larger and longer-term crossword. Most of the time, in a five by five grid, there are three to five clues in each direction, but the puzzle can sometimes be bigger, especially on Saturdays. Unlike its bigger siblings, The New York Times Mini Crossword is available for free on the New York Times website or the New York Times game app. But, you need

NYT Mini crossword answers, hints for May 11, 2025NYT Mini crossword answers, hints for May 11, 2025May 12, 2025 am 10:33 AM

The New York Times Mini Crossword, a smaller version of the famous daily crossword, offers a quicker, more agile puzzle experience. Unlike its larger counterpart, this daily challenge prioritizes speed and presents a smaller set of clues. A difficul

Some Disappointing News About 'The Last Of Us' Season 3 Release DateSome Disappointing News About 'The Last Of Us' Season 3 Release DateMay 12, 2025 am 10:29 AM

The wait for The Last of Us season 3 is going to be a long one. Actress Isabela Merced recently revealed that filming isn't expected to begin until 2026, with no specific timeframe given. This means a significant delay compared to previous seasons.

See all articles

Hot AI Tools

Undresser.AI Undress

Undresser.AI Undress

AI-powered app for creating realistic nude photos

AI Clothes Remover

AI Clothes Remover

Online AI tool for removing clothes from photos.

Undress AI Tool

Undress AI Tool

Undress images for free

Clothoff.io

Clothoff.io

AI clothes remover

Video Face Swap

Video Face Swap

Swap faces in any video effortlessly with our completely free AI face swap tool!

Hot Article

Hot Tools

SublimeText3 English version

SublimeText3 English version

Recommended: Win version, supports code prompts!

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser is a secure browser environment for taking online exams securely. This software turns any computer into a secure workstation. It controls access to any utility and prevents students from using unauthorized resources.

SecLists

SecLists

SecLists is the ultimate security tester's companion. It is a collection of various types of lists that are frequently used during security assessments, all in one place. SecLists helps make security testing more efficient and productive by conveniently providing all the lists a security tester might need. List types include usernames, passwords, URLs, fuzzing payloads, sensitive data patterns, web shells, and more. The tester can simply pull this repository onto a new test machine and he will have access to every type of list he needs.

Notepad++7.3.1

Notepad++7.3.1

Easy-to-use and free code editor

PhpStorm Mac version

PhpStorm Mac version

The latest (2018.2.1) professional PHP integrated development tool