BACK TO LAB

RAG Exp.

Retrieval-Augmented Generation / 検索拡張生成の実験

Concept

RAG（Retrieval-Augmented Generation）は、大規模言語モデル（LLM）の外部知識をリアルタイムで参照させる手法です。モデルの学習データに含まれない最新情報や、企業内・個人内のクローズドな知識に基づいた回答を可能にします。

当ラボでは、特に「ローカル環境における軽量モデル（Llama/Gemma等）」と「ベクトルデータベース」の組み合わせによる、プライバシーを重視したRAG構成の最適化を研究しています。

[1] Query: ユーザーの入力をベクトル化

↓ Vector Search

[2] Retrieval: 関連ドキュメントの抽出

↓ Context Injection

[3] Generation: LLMが文脈に基づき回答

現在の実験環境で使用している主要なスタック：

92% Accuracy (Domain Specific)

< 1.2s Retrieval Latency