こんにちは。ドリコムAI部の栃木です。 今回は私が取り組んでいる「ゲーム内のスキル・能力の組み合わせをAIに評価させる」仕組みについて、実際のアプローチとそこから見えてきた課題、そして今後の展望について紹介したいと思います。
背景:長期運用タイトルを悩ませる「組み合わせ爆発」
多くのソーシャルゲームでは、プレイヤーを飽きさせないために、常に新しいキャラクターやスキル、装備などが追加され続けます。これはコンテンツの魅力を維持するために不可欠な要素ですが、開発の裏側では深刻な問題を引き起こします。それは、検証コストの「組み合わせ爆発」です。 新しい能力が1つ追加されると、既存の無数の能力との間で相互作用をチェックする必要があり、そのパターンは指数関数的に増加していきます。人力での検証には限界があり、時として予期せぬ強力な組み合わせ(いわゆる「ぶっ壊れ」)が生まれ、ゲームバランスを損なうリスクも高まります。 この「膨大なパターンの組み合わせ」という課題こそ、AIが得意とする領域ではないか? それが、この取り組みの出発点でした。最初の挑戦:LLMによる「総当たりシナジー評価」という夢
私たちの初期構想は、シンプルかつ非常にパワフルなものでした。「新規で開発するスキルの効果をLLMに渡し、既存の全てのスキルとの連携度合いを評価させ、リスクを分析する」LLMに全スキルのリストを「記憶」させ、新しいスキルが投入された際に「この中で最もシナジーが高い組み合わせTop10は?」「危険な相互作用を起こす可能性のあるスキルは?」といった質問に答えさせるイメージです。これが実現すれば、開発の早い段階で危険な組み合わせを検知し、品質向上とコスト削減に繋がるはずでした。
立ちはだかった「2つの壁」
しかし、実際にプロトタイプを構築し検証を進めると、理想と現実の間にある大きな壁が見えてきました。課題1:計算量という物理的な壁
「最もシナジーが高いスキル」のような相対評価を行うには、評価のたびに全スキル情報をLLMに渡し、比較させる必要があります。スキル数が数千にも及ぶ長期運用タイトルでは、一度の評価にかかる処理時間とAPIコスト(トークン数)が現実的な範囲を大きく超えてしまいました。課題2:「見つける」だけでは不十分という本質的な壁
仮に時間やコストを度外視できたとしても、より本質的な課題がありました。それは、LLMの評価の「解像度」です。 現在の仕組みでは、処理性能の限界から「何が」連携するのか(例:スキルAとスキルBの相性が良い)という評価しかできませんでした。しかし、私たちが本当に知りたいのは「どのように」連携するのか(例:スキルAの防御ダウン効果とスキルBの多段ヒットが組み合わさり、特定の敵を瞬殺できてしまう)という、具体的なリスクの中身です。 「何が」だけでは、結局その後の詳細な調査を人間が行う必要があり、コスト削減や品質向上への貢献は限定的でした。かといって「どのように」まで評価させようとすると、さらに多くのトークンを消費し、課題1がより深刻になるというジレンマに陥ったのです。次の一手:網羅性より「精度と速度」、そして「データ資産」へ
この結果を受け、私たちは「全スキルを網羅したシナジー評価」という当初の夢からは一度距離を置くことにしました。そして、より現実的で、かつ多方面に価値を提供できるアプローチへと舵を切ります。 全スキルデータをRDB、グラフDB、ベクトルDB等から参照できる仕組みを構築し、そこから「どのようにシナジーが高いのか」という深い情報を含めて、必要な組み合わせだけを高速で抽出するという方向性です。 このアプローチの最大の利点は、構築したナレッジベースがシナジー評価以外にも活用できる「データ資産」になることです。【活用案1】検証(QA)業務の高度化
- 類似バグの水平展開:
あるスキルで「特定のステータス異常が効かない」という不具合が見つかった際、データベースに「類似の効果を持つスキルを全て抽出して」と問い合わせることで、同様の不具合を抱えている可能性のあるスキルを洗い出し、効率的な回帰テストに繋げます。 - 仕様変更時の影響範囲調査:
「クリティカルダメージの計算式変更」など、ゲームの根幹に関わる仕様変更の際に、影響を受ける可能性のある全スキルを瞬時にリストアップし、テスト計画の精度を向上させます。
【活用案2】企画・バランス調整業務のデータ駆動化
- 新スキル設計の支援:
プランナーが「“暗闇”を付与しつつ、味方の“スピード”を上げるスキルを作りたい」と考えた際、データベースを検索して「そもそも類似の効果は過去に存在するか?」「存在するなら、パラメータの相場はどのくらいか?」を即座に把握でき、パワーインフレの抑制や設計工数の削減に繋がります。 - ゲーム環境の可視化:
データベース内の全スキルを分析し、「現在、攻撃力上昇バフを持つスキルは何種類あり、その平均値はいくつか?」といった統計情報を出力できます。これにより、キャラクターの追加やバランス調整を、客観的なデータに基づいて行うことが可能になります。

![[社内勉強会レポ]エンジニア勉強会](https://tech.drecom.co.jp/wp-content/uploads/2019/05/eyecatch_1906MeetupReport_01-150x150.png)
