RAGシステムの設計アプローチ — なぜ「検索拡張生成」を選んだのか

はじめに

「社内でAIを使いたい」と考えたとき、最初に思いつくのはChatGPTをそのまま使うことではないでしょうか。
確かに手軽ですが、業務で使う場合には大きな問題があります。

この記事では、なぜ私が**RAG（Retrieval-Augmented Generation：検索拡張生成）**というアプローチを選んだのか、
その理由と仕組みを解説します。

ChatGPTをそのまま使う問題点

ハルシネーション（幻覚）のリスク

ChatGPTは非常に賢いAIですが、「知らないこと」を聞かれると、それらしい嘘をつくことがあります。これを**ハルシネーション（幻覚）**と呼びます。

業務で使う場合、「AIが言ったから」という理由で誤った対応をしてしまうリスクがあります。

根拠が示せない

もう一つの問題は、回答の根拠を示せないことです。

「なぜそう言えるのか？」と聞かれても、ChatGPTは「私の知識によると」としか答えられません。業務では「どのマニュアルに書いてあるのか」「過去にどんな対応をしたのか」という根拠が必要です。

RAG（検索拡張生成）とは

基本的な考え方

RAGは、AIが回答する前にまず関連情報を検索する仕組みです。

RAGの処理フロー

質問を受け取る

ユーザーが「〇〇について教えて」と質問

ChatGPTとの違い

なぜ「検索」と「生成」を分けるのか

「AIに全部任せればいいのでは？」と思われるかもしれません。
ただ、検索と生成を分けることには明確なメリットがあるんです。

検索フェーズでは、質問に関連する情報を確実に見つけます。これはAIの「創造性」ではなく、データベースの検索機能で行います。

生成フェーズでは、見つけた情報を元に分かりやすく回答を作成します。ここでAIの文章生成能力が活きます。

この分業により、「根拠のある、読みやすい回答」が可能になります。
業務で安心して使うなら、この設計が効いてきますよね。

ベクトル検索の仕組み

従来の検索との違い

従来の検索（キーワード検索）は、入力した単語が含まれる文書を探します。しかし、これには限界があります。

ベクトルとは

ベクトル検索では、文章を**数値の配列（ベクトル）**に変換します。意味が近い文章は、数値としても近い値になります。

たとえば、以下の3つの文章があるとします。

「商品を返品したい」
「返金の手続きについて」
「天気が良いですね」

これらをベクトルに変換すると、1と2は数値として近く、3は遠くなります。質問が「払い戻しの方法は？」なら、1と2がヒットし、3はヒットしません。

Embeddingとは

文章をベクトルに変換する処理を**Embedding（埋め込み）**と呼びます。このプロジェクトでは、OpenAIのEmbedding APIを使用しています。

ベクトル検索の流れ

質問文

「返金の方法は？」

社内データ

マニュアル、FAQ、対応履歴

Embedding API

質問のベクトル

[0.12, -0.34, 0.56, ...]

データのベクトル

[0.11, -0.33, 0.55, ...]

類似度計算

pgvectorの採用理由

PostgreSQLの拡張機能

ベクトル検索を行うには、ベクトルデータを保存・検索できるデータベースが必要です。このプロジェクトでは、pgvectorというPostgreSQLの拡張機能を採用しました。

Neon PostgreSQLとの組み合わせ

Vercelが提供するNeon PostgreSQLは、pgvectorを標準でサポートしています。

追加設定なしでベクトル検索が使える
Vercelプロジェクトとの統合が簡単
サーバーレスで自動スケーリング
無料枠でも十分な性能

RAGの設計ポイント

チャンク分割

長いドキュメントは、適切なサイズに**分割（チャンク化）**する必要があります。

このプロジェクトでは、**適度なサイズ（数百〜千文字程度）**でチャンク化し、必要に応じて複数のチャンクを取得することで、精度と文脈のバランスを取っています。

検索結果の件数

質問に対して何件の関連ドキュメントを取得するかも重要です。

少なすぎる：必要な情報が含まれない可能性
多すぎる：関係ない情報が混ざる、トークン消費が増える

このプロジェクトでは、上位5〜10件を取得し、AIが適切に取捨選択するようにしています。

プロンプト設計

RAGで重要なのは、AIへの指示（プロンプト）の設計です。

あなたは社内サポートアシスタントです。
以下の検索結果を参考に、質問に回答してください。

【重要なルール】
- 検索結果に含まれる情報のみを使って回答してください
- 検索結果にない情報は「わかりません」と回答してください
- 回答の根拠となった参照元を明示してください

【検索結果】
{検索で見つけたドキュメント}

【質問】
{ユーザーの質問}

このように指示することで、AIが「知らないことを知ったふり」をするリスクを減らせます。

まとめ

RAGを採用した理由は、以下の3点に集約されます。

根拠を示せる：「〇〇のマニュアルによると」と参照元を明示できる
ハルシネーションを抑制：検索結果がなければ「わからない」と言える
最新情報に対応：データベースを更新すれば回答に反映される

AIは便利なツールですが、業務で使うには「信頼性」が必要です。RAGは、AIの能力を活かしながら、根拠のある回答を実現するアプローチです。

社内専用AIアシスタント導入の全体像

プロジェクト全体の概要と、導入効果を解説します。

分散データの統合とベクトル検索

複数のデータソースを統合し、横断検索を実現する方法を解説します。