2026.02.06

国産AIエージェント基盤「JAPAN AI Code」、ソフトウェア開発ベンチマークSWE-bench Verifiedにおいて解決率80.2%を達成〜国内開発のAIエージェント技術として世界最高水準の性能を実証〜

プレスリリース

実務レベルの開発課題を解決するJAPAN AI Codeとは

SWE-bench Verifiedベンチマークにおいて80.2%の解決率を達成

JAPAN AI独自のAIエージェント基盤

JAPAN AI Code活用例

今後の展望

JAPAN AI株式会社（本社：東京都新宿区、代表取締役社長：工藤智昭、以下JAPAN AI）は、AIコーディングエージェント「JAPAN AI Code」が、ソフトウェア開発AIの国際的な評価基準であるSWE-bench Verifiedベンチマークにおいて、全500問の評価で解決率80.2%を達成したことを発表します。これは、国内で独自開発されたAIエージェント基盤として世界最高水準の結果です。

実務レベルの開発課題を解決するJAPAN AI Codeとは

JAPAN AI Codeは、JAPAN AIが独自開発したAIエージェント基盤上で動作する、ソフトウェア開発支援AIエージェントです。

従来のコード補完ツールとは異なり、課題の理解・調査・実装・検証までを一貫して自律的に実行できます。コードの記述にとどまらず、バグの根本原因調査、コードレビュー、テスト作成、さらにはアプリケーション全体の開発まで、ソフトウェア開発における幅広い業務を担います。

JAPAN AI Codeは、JAPAN AIが提供するAIプラットフォーム「JAPAN AI STUDIO」と統合されており、企業が保有するナレッジ・ドキュメント・プロジェクト情報にアクセスしながら作業を行うことができます。単なるコーディングツールではなく、組織のコンテキストを理解した上で開発を支援する、企業向けAIエージェントです。

SWE-bench Verifiedベンチマークにおいて80.2%の解決率を達成

SWE-bench Verifiedは、AIがソフトウェア開発の実課題をどの程度解決できるかを測る国際的なベンチマークです。Django、Matplotlib、scikit-learnといった世界的に広く使われるオープンソースプロジェクトにおいて、GitHubで実際に報告されたバグや機能要望から、人間の専門家が検証・選定した500問で構成されています。

AIエージェントには、問題の説明文とリポジトリのソースコードのみが与えられます。この情報だけを頼りに、コードベースを探索し、原因を特定し、修正を実装し、既存のテストが通ることを確認するまでの一連の作業を自律的に完了する必要があります。答えを教えるヒントは一切与えられません。

結果、JAPAN AI Codeは、全500問を評価し、401問の解決（解決率80.2%）を達成しました。

◾️JAPAN AI Codeと他のAIエージェントの性能比較（SWE-bench Verified基準）

コーディングAIエージェント	解答率
JAPAN AI Code	80.20%
TRAE + Doubao-Seed-Code	78.80％
live-SWE-agent + Gemini 3 Pro Preview (2025-11-18)	77.40％
TRAE	75.20%
Lingxi-v1.5_claude-4-sonnet-20250514	74.60%
JoyCode	74.60%

※ 2026年2月時点のSWE-bench公式リーダーボード掲載数値に基づく。

◾️各AIモデル提供元が報告するSWE-bench Verifiedスコア（参考）

AIモデル名	解答率
Claude Opus 4.5	80.9%
JAPAN AI Code	80.2%
GPT5.2	80.0%
Gemini 3 Flash	78.0%

※ 各モデル提供元が自社のモデルに最適化したAIエージェント構成で評価した結果であり、JAPAN AI Codeとは評価条件が異なります。

JAPAN AI Codeは独自開発のAIエージェント基盤により、AIモデル開発元が自社モデル向けに最適化した結果と同等のスコアを実現しています。これは、AIエージェント基盤そのものの技術力を客観的に示すものです。

JAPAN AI独自のAIエージェント基盤

JAPAN AI Codeの最大の特徴は、JAPAN AIがゼロから独自開発したAIエージェント基盤上で動作している点にあります。

多くのAIコーディングツールは、AIモデルのAPIを呼び出すシンプルな構成にとどまり、モデル自体の性能に大きく依存しています。一方、JAPAN AIのエージェント基盤は、モデルの上に独自の技術レイヤーを構築することで、AIモデル単体では到達できない精度と安定性を実現しています。

◾️主な技術要素
（1）マルチAIエージェント連携
複雑なタスクを複数の専門エージェントに分割し、並列で探索・分析・検証を実行します。たとえば、コードの構造分析、テスト要件の抽出、修正パッチの検証をそれぞれ専門のエージェントが担当し、協調して問題解決に当たります。
（2）動作ツールの最適な選択
100種類以上のツールの中から、タスクに応じて最適なツールを自動で選択・実行します。ファイル操作、コード検索、テスト実行、API連携など、開発に必要な操作を自律的に判断します。
（3）コンテキスト管理
長時間にわたる作業でも、文脈の要約・圧縮技術により関連情報を維持し、一貫性のある作業を実現します。
（4）マルチAIモデル対応
Claude、GPT、Gemini、Kimi等の主要なAIモデルに加え、オープンソースモデルにも対応。用途や予算に応じて最適なモデルを選択できます。JAPAN AI Codeの今回の評価では、Claude 4.5 Opusを主軸に、GPT-5.2 Codexをサブエージェントとして組み合わせた構成も高い成果を示しています。

これらの技術要素は、SWE-benchのような標準的な評価基準で世界最高水準の成果を出すだけでなく、実際の開発現場でも複雑なタスクを安定的にこなすための基盤となっています。

◾️JAPAN AI Codeの強み
（1）組織のコンテキストを理解する
JAPAN AI Codeは、JAPAN AI STUDIOと統合されているため、プロジェクトのドキュメント、過去の会話履歴、社内ナレッジベースにアクセスしながら作業できます。孤立したコーディングツールではなく、チームの一員として組織の文脈を理解した上で開発を支援します。
（2）エンジニアリングの民主化
JAPAN AI Codeは、エンジニアだけのツールではありません。JAPAN AIのユーザーであれば、エンジニアでなくても、自然言語での指示によって業務の自動化、ファイル操作、簡易アプリケーションの作成などを行うことができます。「コスト効率の高いエンジニアリングリソース」として、技術部門と非技術部門をつなぐ架け橋となり、組織全体の生産性を向上させます。
（3）コストと品質のバランスを柔軟に選択
複数のAIモデルに対応しているため、タスクの重要度や予算に応じて最適なモデルを選択できます。高精度が必要な本番コードの修正にはClaude Opus 4.5を、日常的な調査やレビューにはコスト効率の高いモデルを使い分けることで、品質とコストの最適なバランスを実現できます。

JAPAN AI Code活用例

〈エンジニア〉
・レガシーコードの解析とモダナイゼーション
ドキュメントが不足している古いコードベースの仕様を解析し、現代的な構成へのリファクタリング案を提示します。ブラックボックス化したシステムの保守コストを劇的に下げます。
・テストコードの自動生成と品質強化
既存のコードを分析し、エッジケースを考慮した単体テストや結合テストを自動生成します。開発者が機能実装に集中している間に、裏側でテストカバレッジを向上させ、品質を底上げします。
・インシデントの一次対応・原因特定
アラート発生時、大量のログとソースコードを横断的に分析し、「どのコミットが原因か」「どのDBクエリが遅延しているか」などの仮説を即座に提示します。障害復旧（MTTR）までの時間を最小化します。

〈非エンジニア〉
・データ抽出・分析のセルフサービス化
「先月の売上データを地域別に集計したい」と依頼するだけで、必要なSQLを生成・実行し、結果をグラフ化します。エンジニアにデータ抽出依頼を出して数日待つ必要は、もうありません。
・業務効率化ツールの即時開発
日々の定型業務を自動化するスクリプトや、社内用の簡易管理画面をその場で作成します。アイデアを思いついたその日に、実際に動くツールとして手に入れることができます。
・「作りたい」を技術仕様へ変換
ふわっとしたビジネス要件を投げかけると、それを実現するための具体的な機能仕様やデータ構造の案を提示します。開発チームに相談する前に「要件の解像度」を高め、手戻りを防ぎます。

さらに、JAPAN AIが提供するノーコード開発環境「JAPAN AI STUDIO」と組み合わせることで、JAPAN AI Codeが生成したコードやアプリケーションをSTUDIOのページとして直接公開し、業務で即座に活用することも可能です。

今後の展望

JAPAN AIは、JAPAN AI Codeの進化を継続的に推進してまいります。
エージェント基盤の更なる改良に加え、開発者向けターミナルCLIツールの提供を計画しています。エンジニアが日常的に使用するターミナル環境から直接JAPAN AI Codeを利用でき、JAPAN AI STUDIOとシームレスに連携することで、ローカルのコード編集からJAPAN AI STUDIOでのページとしての公開まで、一気通貫の開発体験を実現します。エンタープライズのお客様のセキュリティ要件やワークフローに最適化されたAIコーディング環境を目指します。
また、世界水準の技術力を維持・向上させるため、同じビジョンを共有する優秀な技術者の採用を積極的に進めてまいります。AIエージェント技術の最前線で、日本発の技術革新を共に推進していく仲間を募集しています。

採用情報：https://japan-ai.co.jp/recruit

link

国産AIエージェント基盤「JAPAN AI Code」、ソフトウェア開発ベンチマークSWE-bench Verifiedにおいて解決率80.2%を達成〜国内開発のAIエージェント技術として世界最高水準の性能を実証〜

実務レベルの開発課題を解決するJAPAN AI Codeとは

SWE-bench Verifiedベンチマークにおいて80.2%の解決率を達成

JAPAN AI独自のAIエージェント基盤

JAPAN AI Code活用例

今後の展望

資料ダウンロード

会社資料を
こちらからダウンロードいただけます。

お問い合わせ

ご相談やご質問は
こちらからお問い合わせください。

国産AIエージェント基盤「JAPAN AI Code」、ソフトウェア開発ベンチマークSWE-bench Verifiedにおいて解決率80.2%を達成 〜国内開発のAIエージェント技術として世界最高水準の性能を実証〜

実務レベルの開発課題を解決するJAPAN AI Codeとは

SWE-bench Verifiedベンチマークにおいて80.2%の解決率を達成

JAPAN AI独自のAIエージェント基盤

JAPAN AI Code活用例

今後の展望

資料ダウンロード

会社資料をこちらからダウンロードいただけます。

お問い合わせ

ご相談やご質問はこちらからお問い合わせください。

国産AIエージェント基盤「JAPAN AI Code」、ソフトウェア開発ベンチマークSWE-bench Verifiedにおいて解決率80.2%を達成〜国内開発のAIエージェント技術として世界最高水準の性能を実証〜

会社資料を
こちらからダウンロードいただけます。

ご相談やご質問は
こちらからお問い合わせください。