GPTsの「知識」ファイルのアップロードとRAGとの違いを一覧表にまとめました

項目GPTsの知識ファイルのアップロードRAG (Retrieval-Augmented Generation)
データのベクトル化アップロードされたファイルの内容をベクトル化して使用
(テキスト、画像、音声、動画などを数値の配列に変換)
質問に対して関連する外部情報を検索し、動的にベクトル化
(質問と情報を数値の配列に変換)
類似性の計算質問とアップロードされたベクトル化データとの類似性を計算
(質問とファイルの数値配列を比較)
質問と外部データとの類似性を計算
(質問と外部データの数値配列を比較)
情報の取り込みベクトル化されたアップロードファイルの情報を取り込む検索された外部データを取り込む
目的カスタマイズされた応答の提供動的な情報取得と応答生成
情報源ユーザー提供のファイル外部データベースや知識ベース
応答の精度ユーザー特定の情報に基づいた高精度の応答広範な情報に基づいた高精度の応答
適用範囲特定のニーズや情報に特化広範な情報の取得と応答生成に特化
プロセスの動的性静的なファイルに基づく動的な情報検索に基づく
カスタマイズの容易さユーザーが簡単に情報を追加可能外部データベースの内容次第で変動
使用例特定の業務や分野に特化した知識の活用最新情報や広範な知識を必要とする応答
回答生成の速度高速外部検索とベクトル化のプロセスが必要となるため、速度は状況に依存する

ベクトル化とは

「ベクトル化」とは、テキスト、画像、音声、動画などのデータを数値の配列(ベクトル)に変換することを指します。このベクトル表現により、コンピュータはデータの意味や特徴を数値として理解し、計算や比較ができるようになります。

例えば、文章をベクトル化する場合、各単語やフレーズを特定の数値に置き換え、その文章全体を数値の配列として表現します。画像や音声、動画も同様にベクトル化することで、内容の特徴を数値で表現し、検索や類似性の計算に利用できます。応用例としては、画像検索があります。これは、画像をベクトル化して、他の画像との類似性を計算することで、関連する画像を検索する技術です。