大規模言語モデルの使用方法の3つのアプローチの違い

大規模言語モデルの使用方法として、以下の3つのアプローチがあります。それぞれの特徴と利用シナリオを比較表にまとめます。

特徴事前学習済みモデルファインチューニング済みモデルプロンプトエンジニアリング
定義大量のデータで一般的な知識を学習させたモデル特定のタスクやドメインのデータで追加学習を施したモデル特定のタスクを解決するためにモデルに特定の入力(プロンプト)を与える方法
主な利点汎用的で広範な知識を持っているため、多くの異なるタスクに応用可能ターゲットとする特定のタスクやドメインに最適化されているため、効果が高い特別な学習や追加のデータセットなしで、プロンプトの工夫によってモデルの出力を最適化可能
主な欠点特定のタスクやドメインに対する最適化が不十分であることが多いファインチューニングには追加のデータと計算リソースが必要効果的なプロンプトをデザインするには専門知識や試行錯誤が必要
適用シナリオ一般的な質問応答や文書生成など広範囲にわたるタスク特定の分野や業種での応用、例えば医療文書の解析や法律文書の要約データが限られている場合や迅速なプロトタイピングが必要な場合

この表は、各アプローチの特徴と利用シナリオを概説するもので、具体的な使用状況や目的に応じて最適な方法を選択するための基準になります。