1. 導入:プロンプトエンジニアリングの全体像を定義する
自然言語処理の分野は、大規模言語モデル(LLM)の登場により、大きな変革を遂げてきました。人間のようなテキストを理解し生成する能力を持つこれらの洗練されたモデルは、様々な領域にわたって前例のない機会を開拓しました。LLMの力を効果的に活用する核心には、プロンプトエンジニアリングという専門分野があります。その起源と進化を理解することは、現在の重要性を認識する上で不可欠です。[1]
初期の自然言語処理システムは、主に事前に定義された文法規則と辞書に依存してテキストを処理・生成していました。この時代には、今日理解されているようなプロンプティングの概念は重要な考慮事項ではありませんでした。焦点は、言語的知識をシステム自体にエンコードすることに置かれていました。1990年代には統計的NLPが台頭し、確率モデルと機械学習技術が prominence を得始めました。これらのアプローチはデータ駆動型でしたが、モデルの出力を導くための入力の明示的な作成はまだ初期段階にありました。[1] 真のパラダイムシフトは、深層学習、特に深層ニューラルネットワークの導入におけるブレークスルーによって起こりました。Word2Vec、リカレントニューラルネットワーク(RNN)、畳み込みニューラルネットワーク(CNN)のようなモデルは、NLPとAIに革命をもたらし、言語理解と生成における強化された能力を示しました。[1] しかし、プロンプトエンジニアリングの重要性を真に強調したのは、2010年代後半の大規模事前学習済みモデルの出現でした。BERT(Bidirectional Encoder Representations from Transformers)やGPTシリーズ(Generative Pretrained Transformer)のようなモデルは、注目すべき言語理解と生成能力を示しましたが、その振る舞いは受け取る入力に対して非常に敏感でした。[1] 2020年のOpenAIによるGPT-3のリリースは、極めて重要な瞬間となりました。前例のない1750億のパラメータを持つこのモデルは、大規模事前学習済みモデルの計り知れない可能性を示しました。この開発は、モデルの振る舞いを制御し導くための効果的なプロンプトを作成する技術への広範な探求を 촉発し、プロンプトエンジニアリングを重要な専門分野として確立しました。[1] この歴史的な進展は、固定ロジックを持つシステムから、入力が出力の形成に重要な役割を果たすデータ駆動型モデルへの明確な傾向を示しています。モデルが複雑さと能力を増し続けるにつれて、望ましい結果を引き出すための熟練したプロンプトエンジニアリングの必要性はますます高まるでしょう。
現在のLLM時代において、プロンプトエンジニアリングは、これらのモデルを導き、望ましい出力を生成させる効果的な入力プロンプトを作成する技術と科学として定義できます。[2] それは単に指示を与えることを超え、モデルの能力、その固有の限界、そしてそれが動作する特定の文脈についての深い理解を伴います。[2] 効果的なプロンプトエンジニアリングには、学際的なアプローチが必要であり、ドメイン固有の知識と、AIモデルへの微妙な理解、そして異なる文脈に合わせてプロンプトを調整するための体系的なアプローチを融合させます。[2] それは単にプロンプトを構築することではなく、特定の目標を達成するためにこれらのモデルが言語をどのように処理し解釈するかについての包括的な把握を必要とします。プロンプトを効果的に設計する能力は、人間の意図と機械の理解との間の重要な架け橋として機能し、ユーザーが広範なアプリケーションのためにLLMの潜在能力を最大限に引き出すことを可能にします。
LLMの潜在能力を最大限に引き出す上で、プロンプトエンジニアリングの重要性はいくら強調してもしすぎることはありません。よく練られたプロンプトは、AIが生成する応答の精度を高め、関連情報を得るのにかかる時間を短縮し、AIツールが複雑な企業タスクに対して確実に機能することを保証するために不可欠です。[7] プロンプトを注意深く設計することにより、ユーザー要求の曖昧さに対処し、ハルシネーション(モデルが不正確または捏造された情報を生成すること)の発生を最小限に抑え、さらにはモデルの推論プロセスにショートカットを作成して、より効率的な対話と迅速な問題解決につなげることが可能になります。[7] 下手に設計されたプロンプトは、何度繰り返しても正しい応答をもたらす可能性は低いでしょう。[7] したがって、プロンプトエンジニアリングを習得することは、LLMを実世界のアプリケーションで実用的かつ信頼できるものにするために不可欠です。効果的なプロンプティング技術がなければ、最も強力な言語モデルでさえ、無関係、不正確、またはユーザーの意図した目的に合わない出力を生成する可能性があります。これは、様々な分野でLLMの有用性と影響を最大化するために、プロンプトエンジニアリングの原則と実践に関する包括的な理解が根本的に必要であることを強調しています。
2. LLM向けプロンプトエンジニアリングにおける主要な課題の特定と分析
大規模言語モデルの驚くべき能力にもかかわらず、プロンプトエンジニアリングの分野には、完全なマニュアル作成を妨げるいくつかの主要な課題が残っています。これらの課題は、言語とモデルの振る舞いの固有の性質から、評価の実用性、そして絶えず進化するAIの状況にまで及びます。
一つの重要な課題は、ユーザーの指示にしばしば存在する曖昧さや漠然さです。プロンプトが曖昧であることは一般的な問題であり、言語モデルからの無関係な回答につながります。[8] モデルを効果的に導くのに十分な具体性を提供することと、ニュアンスのあるまたは創造的な応答を可能にする十分な柔軟性を維持することの間で適切なバランスを取ることは難しい場合があります。[9] ユーザーは、LLMが必要とする精度で自分のニーズを明確に表現するのに苦労する可能性があり、広範すぎるまたは不明確なプロンプトは、的を射ない出力をもたらす可能性があります。[10] したがって、包括的なマニュアルは、ユーザーから明確かつ具体的な指示を引き出し、これらをモデルを望ましい結果に効果的に導くプロンプトに変換するための戦略に対処する必要があります。これには、曖昧な要求を洗練させ、文脈を提供し、応答に望ましい形式と詳細レベルを指定する技術が含まれます。[8]
もう一つの大きな障害は、異なるLLM間、さらには同じモデルの異なるバージョンや繰り返しの実行においてさえ、プロンプトから生じる可能性のある一貫性のない、予測不可能な結果です。大規模言語モデルは非決定論的な振る舞いを示すことがあり、これは同じ入力プロンプトが繰り返しの実行で異なる出力を生成する可能性があることを意味します。[11] プロンプトのわずかな変更でさえ、全く異なる結果につながる可能性があり、これらのモデルが入力の微妙な変化に敏感であることを強調しています。[12] この一貫性のなさは、LLMアプリケーションの信頼性にとって重大な課題をもたらし、プロンプトの有効性の評価を困難にし、回答が見かけ通りでない場合にユーザーの不満を引き起こす可能性があり、研究者にとって再現性の問題を生み出します。[8] さらに、あるモデルでうまく機能するプロンプトが、別のモデルでは不安定さやパフォーマンスの低下につながる可能性があり、プロンプトエンジニアリングのモデル固有の性質を強調しています。[13] 完全なマニュアルは、この一貫性のなさの根本的な理由を掘り下げ、異なるLLMプラットフォーム間でより予測可能で信頼性の高い出力を達成するためにプロンプトを最適化する戦略を提供する必要があります。
現在のプロンプトエンジニアリング技術は、多段階の推論や外部知識の統合を必要とする複雑なタスクに対処する際にも限界に直面しています。LLMは、プロセスを導く明確な構造がプロンプトに欠けている場合、多段階推論に苦労することがよくあります。[14] Chain-of-Thoughtプロンプティングのような技術は有望性を示していますが、現在のモデルは依然として、複雑な推論シナリオにおいて完全に自律的であるというよりは、外部入力や強化学習に依存することが多いです。[15] さらに、LLMは本質的に永続的なメモリや状態を欠いており、文脈の保持と管理のためには追加のソフトウェアやシステムが必要です。[2] それらの知識も、事前学習されたデータに限定されており、リアルタイムの更新や高度に専門化された情報へのアクセス能力を制限しています。[2] 場合によっては、特に高度な推論モデルでは、より単純なタスクを「考えすぎる」傾向があり、より効率の悪い、あるいは不正確な回答につながることさえあります。[16] 包括的なマニュアルは、複雑でニュアンスのあるタスクを処理する際のこれらの限界を克服するために、高度なプロンプティング技術とLLMを外部知識で補強するための戦略を探求する必要があります。
プロンプトの品質と有効性を評価することは、もう一つの重要な課題です。プロンプトがどれだけうまく機能するかを評価するための標準化された指標やベンチマークが不足しています。[9] 関連性や創造性など、プロンプトの品質の多くの側面は本質的に主観的であり、客観的に測定することが困難です。[17] 精度、一貫性、一貫性などの様々な指標が存在しますが、それらの適用可能性と解釈は、特定のタスクと文脈によって異なる可能性があります。[17] 自動評価手法は独自のバイアスを導入する可能性があり、必ずしも品質に関する人間の判断と一致しない場合があります。[19] プロンプトの有効性に関する明確で測定可能な基準を確立することは、体系的な改善にとって不可欠ですが、これは依然として研究開発が進行中の領域です。[17] 完全なマニュアルは、利用可能な評価指標と方法の包括的な概要、および異なるプロンプトエンジニアリングアプリケーションに対して意味のあるベンチマークを確立する方法に関するガイダンスを提供する必要があります。
最後に、プロンプトエンジニアリングの分野は、言語モデルの継続的な進歩により、急速に進化する性質によって特徴付けられます。プロンプトエンジニアリングは急速に発展している分野であり、新しい技術やベストプラクティスが頻繁に出現しています。[20] 言語モデルがより洗練されるにつれて、それらを効果的にプロンプトする戦略も適応する必要があります。プロンプトエンジニアは、この分野の最新の研究と開発に遅れずについていくために、継続的な学習に従事する必要があります。[9] モデルがより直感的になり、より少ない明示的なプロンプトでユーザーの意図を理解できるようになるにつれて、この分野が大きな変遷を遂げる可能性さえあります。[23] この動的な性質は、包括的なマニュアルが現在の最先端技術を捉えるだけでなく、将来のトレンドとプロンプトエンジニアリング分野における継続的な学習と適応の重要性についての洞察を提供することを必要とします。
3. 一貫性がなく予測不可能なプロンプト結果という課題への対処
大規模言語モデルの固有の非決定論的な性質は、プロンプトからの一貫性がなく予測不可能な結果という課題の主な原因です。この変動性の根底にある原因を理解することは、効果的な緩和戦略を開発するために不可欠です。
この一貫性のなさの根本的な理由の一つは、言語生成自体の確率論的な性質にあります。[11] LLMは、受け取った入力と訓練された膨大な量のテキストに基づいて、シーケンス内の次の単語の確率分布を予測するように設計されています。固定された一連のルールに従うのではなく、この確率分布からサンプリングして応答を生成します。この確率論的アプローチは、本質的に、与えられたプロンプトに対して複数の潜在的な結果を可能にします。[11] LLMによって採用される特定のサンプリング戦略は、出力の変動性にさらに影響を与えます。「temperature」(温度)のようなパラメータは、サンプリングプロセスのランダム性を制御します。高い温度はランダム性と創造性を高めますが、低い温度はより決定論的で一貫性のある出力につながります。[11] top-kおよびtop-pサンプリングなどの他のサンプリング技術も、次の単語の選択にランダム性の要素を導入します。[11] テキスト生成の確率論的な性質とサンプリング戦略の影響を超えて、ある程度のランダム性がLLMのアーキテクチャとトレーニングプロセスにしばしば組み込まれており、これも出力の変動に寄与する可能性があります。[11] さらに、LLMは、広範な言語スタイルと文脈を網羅する巨大なデータセットで訓練されています。訓練データのこの多様性は、モデルが生成中に強調する特定のパターンに応じて、同じプロンプトに対する異なる解釈と応答につながる可能性があります。[11] これらの固有の非決定性の原因を認識することは、LLM出力の一貫性と予測可能性を高めることができるプロンプトエンジニアリング技術を開発するための第一歩です。
一貫性のないプロンプト結果の課題に対処するために、言語モデルにより明確なガイダンスと構造を提供するために、いくつかの最適化技術を採用することができます。明確で具体的な指示に焦点を当てることが最も重要です。曖昧なプロンプトは、多様で無関係な出力を生み出す可能性が高くなります。[3] 複雑なタスクをより小さく、より管理しやすいステップに分解することも、モデルを論理的な推論シーケンスを通じて導くことにより、一貫性を向上させることができます。[8] 関連する詳細と文脈を明示的にエンコードするようにプロンプトを構造化することは、モデルがクエリの特定の側面に焦点を当てるのを助け、より一貫性のある応答につながります。[8] プロンプトにテンプレートを利用すると、繰り返し発生するタスクに対して一貫した形式と構造を確立し、プロンプトがどのように解釈されるかの変動性を減らすことができます。[8] プロンプトの異なるセクションを区切るために明確なマーカーや区切り文字を追加することも、モデルが指示を解析し、集中力を維持するのに役立ちます。[8] 推論を必要とする複雑なクエリの場合、多くの場合Chain-of-Thoughtプロンプティングのような技術を通じて、プロンプト内で段階的な思考を奨励することは、モデルをより一貫性のある推論の線に導くことができます。[8] 最後に、事実の正確性が重要な場合、プロンプト内で出典の引用を明示的に要求することは、モデルが検証可能な情報に基づいて応答を根拠づけることを奨励し、信頼性を高めることができます。[8] これらのプロンプト最適化技術を実装することにより、実践者は出力生成プロセスに対してより大きな制御を発揮し、LLM応答の一貫性を向上させることができます。
一貫性のためのプロンプトエンジニアリングのプロセスは、しばしばフィードバックループと反復的な改良を活用することを含みます。効果的なプロンプトを作成することは、めったに一度きりの試みではありません。通常、望ましいレベルの予測可能性を達成するためには、テスト、調整、再テストが必要です。[8] モデルの出力を観察し、一貫性のないインスタンスを特定することにより、プロンプトエンジニアは、プロンプトがどのように解釈されているかについての貴重な洞察を得て、必要な調整を行うことができます。モデル自身の出力を使用して後続のプロンプトを通知し、洗練させることは、この反復プロセスの重要な側面です。[22] 高い一貫性が最重要視されるアプリケーションでは、継続的なアラインメントテストを実装することが有益です。この体系的なアプローチは、異なる条件下でのLLM応答の一貫性を繰り返しテストおよび検証して、変動を特定し対処することを含みます。[29] フィードバックとテスト結果に基づいてプロンプトを継続的に監視および改良することにより、LLMインタラクションの信頼性と一貫性を徐々に向上させることが可能です。
言語モデルのAPI設定も、その出力の一貫性を制御する上で重要な役割を果たします。最も影響力のあるパラメータの1つは「temperature」であり、前述のように、サンプリングプロセスのランダム性を管理します。[11] 非常に低いtemperature値を設定すると、モデルが最も可能性の高い次の単語を選択するように促され、より正確で一貫性のある応答が得られます。逆に、高いtemperatureはより多くの変動性を導入し、創造的なタスクには望ましいかもしれませんが、一貫性を損なう可能性があります。[25] top-kやtop-pなどの他のサンプリングパラメータを探索することも、潜在的な出力の範囲に対する追加の制御を提供し、一貫性の向上に貢献することができます。[11] これらのモデルパラメータの効果を理解し、特定のアプリケーション要件に合わせて適切に調整することは、予測可能性のためのプロンプトエンジニアリングの重要な側面です。
高度な再現性を必要とするタスクの場合、シード値を組み込むことは、LLM応答の予測不可能な性質を抑制するための強力な手法となり得ます。[29] シード値は、言語モデルの疑似乱数生成器に一貫した開始点を提供します。これは、同じプロンプトとモデルパラメータで同じシードを使用すると、毎回同じ応答が得られ、テストを信頼でき、再現可能にすることを意味します。[29] 開発およびテスト段階でシード値を使用することにより、プロンプトエンジニアは、観測された出力の変化がプロンプトまたはモデルの変更によるものであり、ランダムな変動によるものではないことを保証できます。この機能は、プロンプトのデバッグや、LLMを利用したアプリケーションの安定性と信頼性を確保するために特に価値があります。
4. 複雑なタスクと推論における現在のプロンプトエンジニアリングの限界を克服する
大規模言語モデルは印象的な能力を示しますが、現在のプロンプトエンジニアリング技術は、複雑な推論や訓練データを超える知識の統合を必要とする複雑なタスクに取り組む際には、依然として限界に直面しています。これらの課題に対処するために、いくつかの高度なプロンプティング技術と戦略が登場しています。
多段階の推論を必要とするタスクには、Chain-of-Thought (CoT) プロンプティングが非常に効果的な技術であることが証明されています。[8] このアプローチは、プロンプト内でモデルを一連の中間的な推論ステップを通じて明示的に導き、人間が複雑な問題解決に取り組む方法を模倣します。問題をより小さく論理的な部分に分解することにより、CoTプロンプティングはモデルに段階的に考えることを促し、より正確で解釈可能な解決策につながります。[14] もう一つの高度な技術はTree-of-Thought (ToT) プロンプティングであり、これはモデルに複数の可能な次のステップを生成させ、異なる推論パスを並行して探索するように促すことでCoTアプローチを一般化します。[2] これにより、モデルはより広範な潜在的な解決策を検討し、必要に応じてバックトラックすることができます。Least-to-Mostプロンプティングは、複雑な問題をモデルが順次解決するより単純なサブ問題に分解し、最終的な答えに向かって構築していく別の戦略です。[2] Self-Consistencyプロンプティングは、CoTアプローチを使用して同じプロンプトに対して複数の独立した応答を生成し、次に最も一貫性のある答えを最終出力として選択することを含み、結果の信頼性を向上させることができます。[24] これらの高度なプロンプティング技術は、モデルの推論プロセスを導くための構造化されたフレームワークを提供し、より複雑でニュアンスのあるタスクを処理できるようにします。
LLMの事前学習データの固有の限界を克服するために、外部の知識とツールを統合することは、多くの複雑なアプリケーションにとって不可欠です。Retrieval-Augmented Generation (RAG) は、外部データソースから関連情報を取得し、それをプロンプトに組み込むことによってモデルの応答を強化する著名な技術です。[2] これにより、モデルは元のトレーニングの一部ではなかった最新情報や専門知識にアクセスできます。さらに、LLMは外部ツールやAPIを使用してリアルタイムデータにアクセスしたり、特定のアクションを実行したり、他のシステムと対話したりするように促すことができます。[21] たとえば、プロンプトはモデルに金融APIを使用して現在の株価を取得するように指示したり、特定のトピックに関する最新の研究をWebで検索するように指示したりできます。これらの統合戦略は、LLMの能力を大幅に拡大し、内部知識ベースを超える情報を必要とするタスクに取り組むことを可能にします。
LLMには永続的なメモリがないため、会話の複数のターンにわたって、または長時間の対話のためにコンテキストを管理することは、複雑なタスクにとって不可欠です。コンテキストを維持するための戦略には、後続のプロンプトに関連する会話履歴の一部を明示的に含めることが含まれます。[31] しかし、LLMには処理できる入力の長さ(トークン制限)に制限があるため、長い対話では前のターンからの最も関連性の高い情報を要約または選択的に含める技術が重要になります。[8] 効果的なコンテキスト管理により、モデルは長時間の対話を通じて一貫性を維持し、関連性のある応答を提供できるようになり、これは複雑な会話型アプリケーションにとって不可欠です。
興味深いことに、いくつかの高度な推論モデルは、複雑なタスクに対して強力である一方、より単純なクエリを提示されたときに「考えすぎる」傾向を示すことがあります。[16] より少ない推論ステップを必要とする簡単なタスクの場合、これらのモデルの追加の分析プロセスは不利になる可能性があり、より複雑なモデルと比較して応答が遅くなったり、精度が低下したりする可能性があります。[16] このような場合、プロンプトエンジニアリングには、モデルに深い分析なしで迅速な回答を与えるように明示的に指示する簡潔で直接的なプロンプトを提供することが含まれる場合があります。[16] あるいは、非常に単純なクエリの場合は、タスクにより適した、より複雑でないモデルを選択する方が効率的かもしれません。[16] 異なるLLMアーキテクチャの特性を理解し、それに応じてプロンプトを調整することは、さまざまなタスク複雑度レベルにわたってパフォーマンスを最適化するために重要です。
最後に、複雑なタスクに最適なプロンプトを見つけるには、多くの場合、反復的な改良と実験のプロセスが必要であることを認識することが重要です。[3] 異なる言い回し、構造、およびプロンプティング技術の組み合わせは、さまざまな結果をもたらす可能性があります。プロンプトエンジニアは、体系的なアプローチを採用し、異なるプロンプトを実験し、モデルの出力を分析して、特定のタスクに何が最も効果的かを特定する必要があります。[3] モデル自体からのフィードバックを活用することも、プロンプトの調整を導くことができます。[8] この試行錯誤と分析の反復プロセスは、複雑でニュアンスのあるアプリケーションのためにLLMの潜在能力を最大限に引き出すためにしばしば必要です。
5. プロンプトの品質と有効性を評価するための堅牢な方法の確立
プロンプトの品質と有効性を評価するための堅牢な方法を確立することは、プロンプトエンジニアリング技術の体系的な改善と、LLMを利用したアプリケーションの信頼性の高い展開にとって不可欠です。これには、主要な指標を定義し、適切な測定方法を採用する必要があります。
プロンプトの有効性のさまざまな側面を評価するために、いくつかの主要な指標を使用できます。関連性 (Relevance) は、モデルの出力がプロンプトにおけるユーザーの元の意図とどれだけ密接に一致するかを測定します。[17] 正確性 (Accuracy) は、出力が事実として正しく、既知の情報と一致する程度を評価します。これは特に精度が要求されるドメインで重要です。[17] 一貫性 (Consistency) は、同じプロンプトが複数回入力された場合に、モデルが再現可能で類似した応答を提供するかどうかを評価します。[17] 効率性 (Efficiency) は、モデルが出力を生成する際の速度とリソース使用量を調べます。これはリアルタイムアプリケーションにとって重要です。[18] 可読性 (Readability) と一貫性 (Coherence) は、出力の明瞭さ、論理的な流れ、および全体的な理解しやすさを測定します。これは特にユーザーインタラクションやコンテンツ消費に関連します。[18] その他の重要な指標には、完全性 (Completeness)(応答に必要な要素がすべて含まれているか)、具体性 (Specificity)(詳細度のレベル)、創造性 (Creativity)(新規性と独創性)、トーンとスタイルへの準拠 (Adherence to Tone and Style)(望ましいペルソナとの一貫性)、およびユーザー満足度 (User Satisfaction)(エンドユーザーからのフィードバック)があります。[17] より専門的なアプリケーションでは、忠実性 (Faithfulness)(与えられた文脈を反映する正確さ)、回答関連性 (Answer Relevancy)(質問に直接答えているか)、文脈関連性 (Context Relevancy) と再現率 (Recall)(RAGにおける検索された文脈の質)などの指標が特に関連する場合があります。[19] 適切な評価指標の選択は、プロンプティングタスクの特定の目標と要件に大きく依存します。
これらの指標に基づいてプロンプトの品質を測定するために、さまざまな方法を採用できます。人手によるレビュー (Manual Review) は、精度、関連性、一貫性などの事前に定義された基準に基づいて、人間の評価者が言語モデルの出力を評価することを含みます。[17] この方法は定性的な洞察を提供しますが、時間がかかり主観的になる可能性があります。自動評価 (Automated Evaluation) は、AIツールとアルゴリズムを利用して、一連のプロンプトと対応する例を分析することにより、流暢さや精度などの指標を評価します。[8] これには、生成されたテキストを人間が書いた参照テキストと比較するBLEUやROUGEなどの参照ベースの指標、および忠実性や回答関連性などの品質および事実性指標が含まれます。[18] モデルトレーニング中によく使用されるパープレキシティ (Perplexity) やクロスエントロピー (Cross-entropy) などの固有指標も、モデルの不確実性とパフォーマンスに関する洞察を提供できます。[19] A/Bテスト (A/B Testing) は、ユーザーエンゲージメントやフィードバックに基づいてターゲットタスクに対する複数のプロンプトバリエーションのパフォーマンスを比較し、どのプロンプトが最良の結果をもたらすかを判断する別の価値ある方法です。[17] 最後に、調査、評価、またはコメントを通じて直接ユーザーフィードバック (User Feedback) を収集することは、プロンプトの現実世界での有効性と生成された応答に対するユーザー満足度に関する重要な洞察を提供できます。[17] 多くの場合、これらの方法の組み合わせが、プロンプト品質の最も包括的な評価を提供します。
ベンチマークと評価フレームワークを確立することは、プロンプトのパフォーマンスを標準化され客観的な方法で評価するために不可欠です。これには、特定の入力-プロンプト-期待される出力のペアを持つ単体テスト (unit tests) を作成し、制御された条件下でのモデルの振る舞いを検証することが含まれます。[32] 特定のタスクまたはドメイン用の標準化テストセット (standardized test sets) を開発することで、異なるプロンプティング技術とモデルの体系的な比較が可能になります。既存の評価フレームワークとプラットフォーム (evaluation frameworks and platforms) を利用することも、評価プロセスを合理化し、確立された指標と方法論へのアクセスを提供できます。[32] 関連性があり広く採用されているベンチマークの開発は、プロンプトエンジニアリング分野における継続的な取り組みです。
評価は、プロンプトエンジニアリングプロセスの不可欠かつ反復的な部分であるべきです。典型的なワークフローは、まず初期プロンプトと望ましい目的を定義することから始まるかもしれません。[18] 次に、タスクの特定の目標に基づいて評価のためのターゲット指標が設定されます。[18] その後、適切なツールと方法を使用して、言語モデルでプロンプトを実行することにより、初期評価データを生成します。[18] 次に、結果が分析され、プロンプトのパフォーマンスを改善できる領域が特定されます。[18] これらの発見に基づいて、プロンプトが洗練され、評価プロセスが繰り返されます。この再評価と反復のサイクルは、プロンプトが確立された指標に従って望ましいパフォーマンスレベルを達成するまで続きます。[18] この体系的なアプローチにより、プロンプトが継続的に改善され、有効性のために最適化されることが保証されます。
6. 進化する言語モデルに伴うプロンプトエンジニアリングの進化する性質への対応
プロンプトエンジニアリングの分野は本質的に動的であり、大規模言語モデルの急速な進歩に絶えず適応しています。LLMにおける最近のブレークスルーは、これらのモデルとの対話方法に大きな影響を与え、プロンプトエンジニアリングの実践に新たなフロンティアを開きました。
最も注目すべき進歩の1つは、新しいLLMが示す強化された文脈理解です。[22] モデルは現在、より洗練されたトレーニング方法と広範なデータセットのおかげで、複雑なプロンプトを解釈し、より広い文脈を考慮し、より正確でニュアンスのある応答を提供することにおいて、より優れています。さらに、最近のモデルは改善された推論能力を示しており、中にはプロンプトでの明示的な指示なしにChain-of-Thoughtプロンプティングのような技術を内部的に適用するものさえあります。[24] LLMがより長いプロンプトとより複雑なタスクを処理する能力も向上しており、より詳細な指示とより豊富な文脈情報を提供できるようになりました。[16] テキスト、画像、時には音声さえも含むプロンプトを処理し応答できるマルチモーダルモデルの出現は、もう一つの重要な飛躍であり、多様なアプリケーションにおけるプロンプトエンジニアリングの新たな可能性を開いています。[22] これらの進歩は、集合的に、より直感的で高性能な言語モデルへの傾向を示しており、これがプロンプトエンジニアリングで採用される戦略と技術に影響を与えています。
いくつかの新たなトレンドが、プロンプトエンジニアリングの未来を形作っています。AIモデルがユーザーの入力スタイルと好みに基づいて応答を調整する適応型プロンプティング (Adaptive prompting) 技術が開発されており、対話をより自然でユーザーフレンドリーにすることを目指しています。[22] プロンプトの有効性に関する即時フィードバックを提供し、明瞭さ、バイアスの可能性、望ましい結果との整合性を評価し、改善提案を行うリアルタイムプロンプト最適化 (Real-time prompt optimization) 技術も登場しています。[22] モデルにプロンプト自体について推論させるメタプロンプティング (meta-prompting) のような、より洗練されたプロンプティング戦略が探求されています。[33] 1つのプロンプトの出力が次のプロンプトの入力として使用されるプロンプト連鎖 (Prompt chaining) とシーケンシング (sequencing) は、複雑なワークフローに取り組むためにますます一般的になっています。[20] モデルに複数の専門家とのブレインストーミングプロセスをシミュレートするように指示するマルチペルソナプロンプティング (multi-persona prompting) や、精度を向上させる可能性のある感情的な刺激を使用する感情プロンプティング (emotion prompting) のような技術も注目を集めています。[34] これらのトレンドは、LLMとの対話におけるより動的、自動化され、ニュアンスのあるアプローチへの移行を強調しています。
さらに将来に目を向けると、自動プロンプティングシステム (auto-prompting systems) とより自律的なエージェント (autonomous agents) への移行の可能性があります。人間の介入なしに自身のプロンプトを作成、評価、改良する再帰的なプロンプト生成が可能な自律エージェントが現実のものとなりつつあります。[23] ユーザーが正確なプロンプトを作成する必要なく、日常言語でAIと対話できる自然言語インターフェース (natural language interfaces) の開発も進んでいます。[23] DSPyのようなフレームワークは、言語モデルのプロンプトと重みの最適化を自動化するように設計されており、プロンプト作成をより自動化し、人間の専門知識への依存度を低くしています。[23] これらの開発は、多くのアプリケーションにおいて、AI自体がプロンプトの生成と改良においてより大きな役割を果たす可能性があり、エンドユーザーによる広範な手動プロンプトエンジニアリングの必要性が低下する可能性がある未来を示唆しています。
AIモデルが進化するにつれて、プロンプトエンジニアの役割も変化する可能性があります。主に個々のプロンプトの作成に焦点を当てるのではなく、LLMを効果的に活用するプロンプトテンプレートと全体的なシステムの設計により重点が置かれるかもしれません。[20] その役割は、AI機能をより広範なワークフローに統合し、AIシステムの出力を検証し、その信頼性と倫理的な使用を保証することへと進化する可能性があります。[24] AIモデルの根底にある能力と限界についての深い理解は、この分野で働く人々にとってますます重要になるでしょう。[24] 必要なスキルは、詳細なプロンプト構築への焦点から、AIシステム設計と統合のより全体的な理解へと移行するかもしれません。
プロンプトエンジニアリングにおける将来の研究は、いくつかのエキサイティングな方向性を探求すると期待されています。ユーザーのニーズやタスク要件にリアルタイムで適応できる動的なプロンプト生成と最適化技術 (Dynamic prompt generation and optimization) は、主要な焦点分野です。[21] LLMと外部ツール、データベース、APIとの間のよりシームレスなインターフェースを開発し、コンテキストとパフォーマンスを強化することは、もう一つの重要な道筋です。[21] LLMが展開中にユーザーフィードバックやタスクパフォーマンスに基づいて学習し適応できるリアルタイムフィードバックループ (real-time feedback loops) を持つシステムの開発に関する研究も進行中です。[21] テキスト、画像、音声を単一のインタラクションで組み合わせるなど、プロンプトエンジニアリングを複数のモダリティに拡張すること (incorporating multiple modalities) は、新たな課題と機会を提示します。[21] 検索精度を向上させ、ライブデータを統合することに焦点を当てたRetrieval-Augmented Generation (RAG) システムの強化 (Enhancements in RAG) は、引き続き不可欠です。[21] 最後に、プロンプトとその出力におけるバイアス、プライバシー、説明可能性に関連する倫理的課題に対処すること (addressing ethical challenges) は、将来の研究の重要な領域となるでしょう。[21] これらの将来の方向性は、さらなるイノベーションの大きな可能性を秘めた、活気に満ちた急速に進化する分野を示しています。
7. プロンプトエンジニアのための既存リソースとドキュメントに関する包括的ガイド
プロンプトエンジニアリングの技術と科学を習得しようとする人々にとって、豊富なリソースとドキュメントが利用可能です。この状況を効果的にナビゲートすることは、学習プロセスを大幅に加速し、実践者を最新の進歩について常に情報を得られるようにすることができます。
いくつかの主要なオンラインプラットフォームとコミュニティは、プロンプトエンジニアにとって貴重なハブとして機能します。OpenAIの開発者プラットフォームを通じてアクセス可能なPrompt Engineering Guideは、基本的な原則とベストプラクティスを提供し、彼らのコミュニティフォーラムはユーザーが洞察を議論し共有するためのスペースを提供します。[35] Redditは、r/PromptEngineeringやr/aipromptprogrammingなどのアクティブなコミュニティをホストしており、ユーザーはヒントを共有し、課題について議論し、新しいツールや技術に関する情報を広めています。[6] Learn Prompting (learnprompting.org) は、初心者と上級ユーザーの両方にとって広く引用されるリソースとなっている、包括的なオープンソースガイドです。[38] GitHubで利用可能なDAIR.AIのPrompt Engineering Guideは、広範なプロンプティング技術、アプリケーション、ツールをカバーするもう一つの優れたリソースであり、最新の研究で継続的に更新されています。[5] Prompt Engineering Guide (promptingguide.ai) も、学習ガイド、論文、モデル固有のプロンプティング情報のコレクションを提供しています。[5] これらのオンラインプラットフォームは、学習し、プロンプトエンジニアリングコミュニティとつながりを保つための動的な環境を提供します。
大規模言語モデルの開発者によって提供される公式ドキュメントは、各モデルの特定の機能と推奨される使用法を理解するための不可欠なリソースです。OpenAIのAPIドキュメントは、パラメータやプロンプティングのベストプラクティスを含む、彼らのモデルに関する詳細情報を提供します。[36] Anthropicは、彼らのアーキテクチャに合わせたプロンプトエンジニアリングガイドラインを含む、Claudeモデルのための包括的なドキュメントを提供します。[30] Google Cloud AIドキュメントには、彼らの言語モデルのためのプロンプト設計に関するガイダンスが含まれています。[41] Amazon Bedrockドキュメントは、Titanを含む彼らのモデルスイートに特化したプロンプトエンジニアリングに関するリソースを提供します。[27] AI21 Labsも、彼らのJurassic-2モデルでの効果的なプロンプティングのためのドキュメントと例を提供しています。[7] これらの一次情報源を参照することは、プロンプトエンジニアが最も効果的かつ意図された方法でモデルを利用していることを保証します。
より構造化された学習体験のために、様々な教育コースとチュートリアルが利用可能です。Learn PromptingやDAIR.AI Academyのようなプラットフォームは、プロンプトエンジニアリングの基礎と高度な技術をカバーする自己学習コースやインタラクティブなマスタークラスを提供しています。[38] LinkedIn LearningやYouTubeのようなプラットフォーム上のビデオチュートリアルは、プロンプティング戦略の視覚的かつ実践的なデモンストレーションを提供します。[31] UdemyやCourseraのようなオンライン学習プラットフォームも、異なるスキルレベルとアプリケーション領域に対応したプロンプトエンジニアリング専門のコースをホストしています。[37] これらの教育リソースは、プロンプトエンジニアリングの専門知識を開発しようとしている個人にとって、よりガイド付きで包括的な学習パスを提供します。
この分野の最新の研究と進歩に遅れずについていくためには、研究論文や記事に取り組む必要があります。arXivのようなリポジトリは、AIと自然言語処理の分野におけるプレプリントや公開論文の貴重な情報源として機能し、しばしばプロンプトエンジニアリング技術に関する最先端の研究を特集しています。[2] Medium、Towards AI、AI企業の公式ブログなどのプラットフォーム上の多数のブログ投稿や記事は、プロンプトエンジニアリングにおける実践的な洞察、実世界の例、および新たなトレンドの議論を提供します。[3] これらの出版物は、学術研究者と業界の実践者の両方からの貴重な視点を提供します。
利用可能なリソースが豊富であるにもかかわらず、既存のプロンプトエンジニアリングドキュメントにはまだ潜在的なギャップと改善の余地があります。入門資料は豊富ですが、ユーザーが「完璧なマニュアル」を望んでいることから示唆されるように、非常に高度なトピックをかなりの深さで掘り下げた包括的なリソースは少ないかもしれません。プロンプトのパフォーマンスに対するより標準化された評価フレームワークとベンチマークの必要性も、現在の状況で明らかです。[9] さらに、言語モデルとプロンプティング技術の両方における進歩の急速なペースを考えると、ドキュメントを一貫して更新し続けることは大きな課題となる可能性があります。[38] より詳細なリソースを作成し、より明確な評価基準を確立し、情報が最新の状態に保たれることを保証することによってこれらのギャップに対処することは、プロンプトエンジニアリング分野の継続的な成長と成熟にとって不可欠です。
8. ケーススタディ:高度なアプリケーションにおける成功したプロンプトエンジニアリング戦略
プロンプトエンジニアリングの力は、科学的発見や創造的なコンテンツ生成を含む、さまざまな高度なドメインでの成功した応用を通じて最もよく示されます。これらのケーススタディは、注意深く作成されたプロンプトが、驚くべき結果を達成するためにLLMの潜在能力をどのように解き放つことができるかを強調しています。
科学的発見の領域では、プロンプトエンジニアリングは研究を加速するための貴重なツールとして浮上しています。大規模言語モデルは、テキストや画像のマイニング、合成経路の予測、さらにはバッテリー研究における劣化パターンの分析などのタスクのために化学研究で利用されています。[57] 研究者たちは、よく設計されたプロンプトによって導かれたLLMエージェントが、人間の専門家のそれを超える新規性を示す研究アイデアを生成することさえでき、オープンエンドな科学的発見プロセスの自動化に貢献できることを実証しました。[20] プロンプトはまた、文献レビューの実施、複雑なデータセットの分析、新しい仮説の生成など、より伝統的な研究タスクを支援するためにも使用されています。[58] 例えば、再生可能エネルギーの分野では、学生たちはAIを、反復的なプロンプト改良によって導き、アイデアをブレインストームし、プロジェクトを開発することに成功しました。[59] メタ認知プロンプティング(AIにその推論を説明させる)や定量化されたフィードバックループの使用などの高度なプロンプティング技術も、AI支援による科学研究の厳密さと信頼性を高めるために探求されています。[33] これらの例は、LLMが科学プロセスに有意義に貢献できるようにするプロンプトエンジニアリングの変革的な可能性を示しています。
プロンプトエンジニアリングはまた、創造的なコンテンツ生成の分野に革命をもたらし、個人や組織がより高い効率と創造性で高品質のテキスト、画像、音声を生成できるようにしました。注意深く構造化されたプロンプトは、特定のオーディエンスと目的に合わせて調整された、LinkedInのようなプロフェッショナルネットワーキングプラットフォーム向けの魅力的で有益なコンテンツを生成するために使用されています。[34] Eコマースでは、よく練られたプロンプトにより、LLMがクリック率と全体的な売上の大幅な増加につながった魅力的な商品説明を生成することが可能になりました。[50] プロンプトエンジニアリングは、効果的なソーシャルメディアキャンペーンの設計やメールニュースレター向けの魅力的なコンテンツ作成において重要な役割を果たします。[53] 開発者は、さまざまなプログラミング言語でコードスニペットを生成するためにプロンプトを活用し、ソフトウェア開発ワークフローを合理化しています。[53] ビジュアルアートでは、DALL-EやMidjourneyのようなモデルでのプロンプトエンジニアリングが、テキスト記述から想像力豊かで複雑なビジュアルを生成するための前例のない能力を解き放ち、迅速なプロトタイピングとコンセプトデザインを可能にしました。[51] オーディオにおいてさえ、プロンプトエンジニアリングはAIモデルを導き、さまざまなアプリケーション向けにカスタムの音楽トラックや効果音を作成します。[53] 創造的なコンテンツ生成における成功戦略には、しばしば特定の形式を持つプロンプトテンプレートの使用、望ましいコンテンツの例の組み込み(少数ショットプロンプティング)、AIへの役割やペルソナの割り当て、多様な視点を持つコンテンツを生成するためのマルチペルソナプロンプティングのような技術の採用が含まれます。[34] これらのケーススタディは、多数のコンテンツ作成タスクにわたって創造性と生産性を向上させる効果的なプロンプトエンジニアリングの広範な影響を示しています。
9. 倫理的配慮とプロンプトエンジニアリングにおけるバイアスへの対処の重要性
プロンプトエンジニアリングが大規模言語モデルの力を活用するためにますます不可欠になるにつれて、生じる重大な倫理的配慮に対処することが極めて重要です。これらの中でも、AIにおけるバイアスの問題と、それがプロンプトによってどのように影響を受けるかは最重要です。
AIプロンプトにおけるバイアスは、さまざまな原因から生じる可能性があります。LLMの開発に使用されるトレーニングデータがすべてのグループを平等に代表していない可能性があり、データ不均衡 (data imbalance) として知られる偏った出力につながります。[48] AIモデルはまた、歴史的データに存在するバイアスを意図せずに学習し、永続させ、社会的な偏見を反映する可能性があります。[61] 一見中立的なプロンプトでさえ、基礎となるトレーニングデータやモデルが言語を解釈する方法のために、バイアスのある応答を引き起こす可能性があり、微妙で意図しないバイアス (subtle and unintentional biases) につながります。[48] さらに、ステレオタイプや偏見のある言葉を含むプロンプトは、AIにこれらの有害な考えを繰り返し、さらには増幅させ、否定的なステレオタイプを強化させる可能性があります。[47] これらのバイアスの原因を理解することは、プロンプトエンジニアリングにおけるそれらの影響を緩和するための第一歩です。
LLMの責任ある使用を確実にするために、プロンプト設計に関するいくつかの倫理的ガイドラインに従うべきです。プロンプトにおける公平性 (fairness) を優先し、差別 (discrimination) を積極的に回避することが不可欠です。[61] ユーザーの要求の背後にある意図と文脈についての透明性 (transparency) を維持することは、AIがより関連性があり倫理的な応答を提供するのに役立ちます。[47] プロンプトが機密データを要求したり、意図せずに明らかにしたりしないようにすることで、ユーザーのプライバシー (privacy) と機密情報 (confidential information) を保護することは、重要な倫理的責任です。[47] 有害、憎悪的、または非倫理的な出力の生成を防ぐには、敬意を払いバランスの取れた情報を奨励する慎重なプロンプト設計が必要です。[47] AIモデルがコンテンツを生成しますが、プロンプトエンジニアはそのコンテンツの性質と影響に対する説明責任 (accountability) を確保するよう努めるべきです。[61] プロンプトにおける文化的感受性 (cultural sensitivity) と包括性 (inclusivity) を促進することは、否定的なステレオタイプの強化を避け、AIが多様な文化的視点を考慮した敬意のある中立的なコンテンツを生成することを保証するのに役立ちます。[47] 最後に、要求され生成された情報における正確性 (accuracy) と真実性 (truthfulness) へのコミットメントは、プロンプトエンジニアリングにおける基本的な倫理原則です。[47]
プロンプトエンジニアは、AI出力におけるバイアスを積極的に緩和するために、さまざまな戦略を採用できます。プロンプトで中立的で包括的な言葉遣い (neutral and inclusive language) を使用することは、望ましくないバイアスを引き起こすのを避けるための重要な第一歩です。[48] AIに公平性、多様性、包括性に関する文脈 (context about fairness, diversity, and inclusion) を提供することは、応答を生成する前に複数の視点を考慮することを奨励できます。[48] モデルにあらゆる種類のバイアスを避けるように明示的に指示する (explicitly instructing the model to avoid bias) ことも効果的です。[49] 異なるシナリオ、性別、文化的文脈、人口統計グループにわたってプロンプトをテストする (Testing prompts across different groups) ことは、モデルの出力における潜在的なバイアスを特定するのに役立ちます。[48] 事実情報が必要な場合、モデルに情報源を提供するように促す (prompting the model to provide sources) ことは、正確性を確保し、偏った情報の影響を減らすのに役立ちます。[47] 既知のバイアスに対抗するためにプロンプトを変更することを含む、プロンプトデバイアス (prompt debiasing) のようなより高度な技術も探求されています。[49] 少数ショットプロンプトで提供される例における多様な表現を確保する (Ensuring diverse representation in examples) ことも、バイアスを緩和する別の方法です。[49] 最後に、バイアスに関するモデルの出力の継続的な監視を含む反復的な改良プロセスを採用する (adopting an iterative refinement process that includes continuous monitoring) ことで、公平性と包括性を促進するためにプロンプトを継続的に調整できます。[60]
バイアスという重要な問題を超えて、プロンプトエンジニアリングは他の重要な倫理的懸念も提起します。不適切に設計されたプロンプトは、意図せずに誤情報 (misinformation) の拡散につながる可能性があり、これは重大な悪影響を及ぼす可能性があります。[47] 悪意のあるアクターがシステムの欠陥を悪用したり、AIをだまして有害または不適切なコンテンツを生成させたりするプロンプトを作成する可能性もあります。[47] ユーザーがAIシステムと対話していることを認識できるように、AIインタラクションにおける透明性 (transparency in AI interactions) を確保することは、信頼を構築するために不可欠です。[47] ユーザーデータを扱う場合、プロンプトエンジニアは、データ保護法と倫理ガイドラインを遵守し、ユーザーの同意 (user consent) と情報に対する制御 (control over their information) を優先する必要があります。[60] これらのより広範な倫理的懸念に対処することは、大規模言語モデルの責任ある有益な開発と展開を促進するために不可欠です。
10. 結論:プロンプトエンジニアリングの決定版マニュアルに向けて
結論として、プロンプトエンジニアリングは、大規模言語モデルの変革的な力を効果的に活用する上で極めて重要な専門分野として位置づけられます。このマニュアルでは、プロンプトエンジニアリングの多面的な状況を探求し、AI能力の向上におけるその重要な役割と、これらの高度なモデルに関連する固有の課題への対処を強調しました。
分析は、LLMから正確で一貫性があり、信頼性の高い出力を達成するためのプロンプトエンジニアリングの根本的な重要性を強調しました。[7] しかし、ユーザー指示の曖昧さ、結果の一貫性のなさと予測不可能性、複雑な推論と知識統合の処理における限界、プロンプトの有効性評価の難しさ、そして分野の急速な進化など、いくつかの主要な課題が残っています。[8] さらに、バイアス、誤情報、責任あるAI利用を取り巻く倫理的配慮は最重要であり、プロンプトエンジニアリングプロセス全体を通じて慎重な注意が必要です。[47]
プロンプトエンジニアリングを習得するために、証拠に基づいた行動計画には、継続的な学習へのコミットメントと、LLMおよびプロンプティング技術における最新の研究と進歩に常に最新情報を得ることが含まれるべきです。[9] 多様なプロンプティング戦略を用いた実験とモデルパラメータの慎重な操作は、出力への影響を理解するために不可欠です。[3] 関連する指標を用いたプロンプトパフォーマンスの体系的な評価アプローチの開発と、評価結果に基づく反復的な改良は、継続的な改善にとって不可欠です。[17] 倫理ガイドラインを遵守し、プロンプトとAI出力におけるバイアスを緩和するための戦略を積極的に実施することは、すべてのプロンプトエンジニアが受け入れるべき責任です。[48] 最後に、活気に満ちたプロンプトエンジニアリングコミュニティとの関わり、および利用可能な豊富なリソースとドキュメントを活用することは、個人のスキルと知識を大幅に向上させるでしょう。[5]
今後、いくつかの将来の研究パスがプロンプトエンジニアリング分野の進歩に有望性を示しています。より堅牢で標準化された評価指標とベンチマークの開発は、依然として重要なニーズです。[9] LLMがますます複雑な推論タスクを処理し、外部知識をシームレスに統合できるようにするための新しい技術を探求することは、その適用可能性を拡大するでしょう。[21] 自動プロンプティングシステムと自律エージェントが人間のプロンプトエンジニアの役割に与える長期的な影響を調査することは、人間とAIの相互作用の未来を理解するために不可欠です。[23] AI出力におけるバイアスを検出および緩和するためのより効果的な方法に関する継続的な研究は、公平性と公正性を確保するために不可欠です。[48] 最後に、プロンプトエンジニアリングと他の新興AI技術との交差点を探索することは、新しく予期せぬ可能性を解き放つ可能性があります。
プロンプトエンジニアリングの決定版マニュアルへの道のりは、人工知能の絶え間ない進歩によって推進される継続的な取り組みです。継続的な学習、厳密な実験、倫理的配慮、そしてコミュニティとの関わりを受け入れることにより、実践者は進化する状況を効果的にナビゲートし、大規模言語モデルの責任ある影響力のある応用に貢献することができます。
出典と証拠
(以下、原文の出典リストが続きます。翻訳は不要と判断し、省略します。)
引用
日本語に全文翻訳:
- 9 url: https://sciety.org/articles/activity/10.20944/preprints202503.1808.v1, Author(s): Anonymous, Publication date: 2025, Title of work: Prompt Engineering for Large Language Models in Education: A Systematic Review and Empirical Study, Publication/platform: Sciety, Note: Comprehensive investigation into prompt engineering for LLMs in educational contexts.
8 url: https://latitude-blog.ghost.io/blog/common-llm-prompt-engineering-challenges-and-solutions/, Author(s): Anonymous, Publication date: Unknown, Title of work: Common LLM Prompt Engineering Challenges and Solutions, Publication/platform: Latitude Blog, Note: Discusses common problems and solutions in prompt engineering.
20 url: https://esd.copernicus.org/articles/16/423/2025/, Author(s): Xiao, F., et al., Publication date: 2025, Title of work: Simulating institutional decision-making for land system models using large language models, Publication/platform: Earth System Dynamics, Note: Explores the use of LLMs for simulating institutional decision-making and highlights challenges in scalability, interpretability, and reliability.
57 url: https://pubs.acs.org/doi/10.1021/acscentsci.4c01935, Author(s): Zhou, Z., et al., Publication date: 2024, Title of work: Prompt Engineering for Chemical Research with Large Language Models, Publication/platform: ACS Central Science, Note: Discusses the application and limitations of prompt engineering in chemical research.
62 url: https://www.cambridge.org/core/journals/design-science/article/challenges-in-applying-large-language-models-to-requirements-engineering-tasks/1FC7666F0A0B4E7091D2D4B2D46321B5, Author(s): Ferrari, A., et al., Publication date: 2025, Title of work: Challenges in applying large language models to requirements engineering tasks, Publication/platform: Design Science, Note: Identifies challenges in using LLMs for requirements engineering.
11 url: https://futureagi.com/blogs/optimizing-non-deterministic-llm-prompts-with-future-agi, Author(s): FutureAGI Team, Publication date: 2025, Title of work: Optimizing Non-Deterministic LLM Prompts with Future AGI, Publication/platform: FutureAGI Blog, Note: Explains the non-deterministic nature of LLMs and the importance of prompt optimization.
12 url: https://arxiv.org/html/2406.12334v3, Author(s): Frigerio, M., et al., Publication date: 2024, Title of work: Prompt Sensitivity in Large Language Models: A Comprehensive Study and Toolkit, Publication/platform: arXiv, Note: Investigates the sensitivity of LLMs to minor variations in prompts.
13 url: https://medium.com/@dan_43009/how-small-changes-in-a-prompt-can-lead-to-wildly-different-results-and-what-you-can-do-about-it-d4d3d72f8a2e, Author(s): Cleary, D., Publication date: 2024, Title of work: How small changes in a prompt can lead to wildly different results, and what you can do about it, Publication/platform: Medium, Note: Illustrates the sensitivity of LLMs to small prompt changes.
29 url: https://artium.ai/insights/taming-the-unpredictable-how-continuous-alignment-testing-keeps-llms-in-check, Author(s): Anonymous, Publication date: Unknown, Title of work: Taming the Unpredictable: How Continuous Alignment Testing Keeps LLMs in Check, Publication/platform: Artium AI Insights, Note: Discusses continuous alignment testing for managing LLM response unpredictability.
25 url: https://insight.factset.com/ai-strategies-series-inconsistent-and-outdated-responses, Author(s): Loughlin, J., Publication date: Unknown, Title of work: AI Strategies Series: Inconsistent and Outdated Responses, Publication/platform: FactSet Insight, Note: Explains why LLMs can give inconsistent responses to the same prompt.
16 url: https://techcommunity.microsoft.com/blog/azure-ai-services-blog/prompt-engineering-for-openai%E2%80%99s-o1-and-o3-mini-reasoning-models/4374010, Author(s): Azure AI Services Team, Publication date: 2025, Title of work: Prompt Engineering for OpenAI’s O1 and O3-mini Reasoning Models, Publication/platform: Microsoft Tech Community Blog, Note: Discusses prompt engineering for specific OpenAI reasoning models, highlighting their strengths and limitations.
7 url: https://www.ai21.com/knowledge/prompt-engineering/, Author(s): AI21 Labs Team, Publication date: Unknown, Title of work: Prompt Engineering, Publication/platform: AI21 Labs Knowledge Base, Note: Explains the importance of prompt engineering and its benefits.
15 url: https://www.reddit.com/r/PromptEngineering/comments/1j250g9/the_latest_breakthroughs_in_ai_prompt_engineering/, Author(s): Reddit User, Publication date: 2024, Title of work: The latest breakthroughs in AI prompt engineering, Publication/platform: Reddit, Note: Discusses advancements in prompt engineering, including Auto-CoT.
2 url: https://arxiv.org/html/2401.14423v3, Author(s): Sharma, P., et al., Publication date: 2024, Title of work: A Survey of Prompt Engineering Techniques for Large Language Models, Publication/platform: arXiv, Note: Provides a survey of prompt engineering techniques for LLMs and discusses their limitations.
14 url: https://www.lakera.ai/blog/prompt-engineering-guide, Author(s): Lakera AI Team, Publication date: Unknown, Title of work: Prompt Engineering Guide: How to Talk to Large Language Models, Publication/platform: Lakera AI Blog, Note: Offers a guide to prompt engineering, including strategies for writing clear prompts and addressing security.
18 url: https://portkey.ai/blog/evaluating-prompt-effectiveness-key-metrics-and-tools/, Author(s): Portkey AI Team, Publication date: 2024, Title of work: Evaluating Prompt Effectiveness: Key Metrics and Tools, Publication/platform: Portkey AI Blog, Note: Discusses key metrics and a structured process for evaluating prompt effectiveness.
17 url: https://www.kdnuggets.com/measuring-prompt-effectiveness-metrics-and-methods, Author(s): Galvez, J., Publication date: 2025, Title of work: Measuring Prompt Effectiveness: Metrics and Methods, Publication/platform: KDnuggets, Note: Explores various metrics and methods for evaluating prompt quality and effectiveness.
19 url: https://www.deepchecks.com/question/common-metrics-evaluating-prompts/, Author(s): Williamson, T., Publication date: Unknown, Title of work: Common metrics evaluating prompts?, Publication/platform: deepchecks.com, Note: Lists and describes common metrics for evaluating prompt effectiveness in LLMs.
32 url: https://community.openai.com/t/how-do-you-measure-prompt-performance/662643, Author(s): OpenAI Community Users, Publication date: 2024, Title of work: How do you measure prompt performance?, Publication/platform: OpenAI Community Forum, Note: Discusses methods for measuring prompt performance, including unit tests and human evaluation.
28 url: https://medium.com/athina-ai/optimizing-ai-performance-the-art-of-measuring-prompt-effectiveness-e81c7ead599f, Author(s): Athina AI Team, Publication date: Unknown, Title of work: Optimizing AI Performance: The Art of Measuring Prompt Effectiveness, Publication/platform: Medium, Note: Explains the importance of measuring prompt performance and outlines key metrics and methods.
21 url: https://medium.com/@Matthew_Frank/the-evolution-of-prompt-engineering-7bda6c07f612, Author(s): Frank, M., Publication date: 2025, Title of work: The Evolution of Prompt Engineering, Publication/platform: Medium, Note: Describes the evolution of prompt engineering alongside advancements in AI technologies.
23 url: https://lbbonline.com/news/the-future-of-prompt-engineering-evolution-or-extinction, Author(s): LBBOnline Team, Publication date: 2025, Title of work: The Future of Prompt Engineering: Evolution or Extinction?, Publication/platform: LBBOnline, Note: Explores the future of prompt engineering in light of evolving AI capabilities.
24 url: https://medium.com/@leela.kumili/the-evolution-of-prompt-engineering-what-software-engineers-need-to-know-1d25bdeac7c2, Author(s): Kumili, L., Publication date: Unknown, Title of work: The Evolution of Prompt Engineering: What Software Engineers Need to Know, Publication/platform: Medium, Note: Discusses the evolution of prompt engineering and its implications for software engineers.
1 url: https://www.promptengineering4u.com/learning/evolution, Author(s): Prompt Engineering 4U Team, Publication date: Unknown, Title of work: Evolution, Publication/platform: Prompt Engineering 4U, Note: Provides a brief overview of the history and evolution of prompt engineering.
22 url: https://www.datacamp.com/blog/what-is-prompt-engineering-the-future-of-ai-communication, Author(s): Datacamp Team, Publication date: Unknown, Title of work: What is Prompt Engineering? The Future of AI Communication, Publication/platform: DataCamp Blog, Note: Discusses recent advancements and the future of prompt engineering.
43 url: https://arxiv.org/html/2501.11709v1, Author(s): Zhang, X., et al., Publication date: 2025, Title of work: Understanding Prompt Knowledge Gaps in Developer-ChatGPT Conversations for Issue Resolution, Publication/platform: arXiv, Note: Identifies knowledge gaps in developer prompts and their impact on issue resolution.
26 url: https://www.sap.com/belgie/resources/what-is-prompt-engineering, Author(s): SAP Team, Publication date: Unknown, Title of work: What is Prompt Engineering?, Publication/platform: SAP Belgium, Note: Explains prompt engineering techniques and their applications.
10 url: https://www.digitalocean.com/resources/articles/prompt-engineering-best-practices, Author(s): DigitalOcean Team, Publication date: Unknown, Title of work: Prompt Engineering Best Practices: How to Communicate Effectively with AI, Publication/platform: DigitalOcean, Note: Outlines best practices for effective prompt engineering.
39 url: https://guides.library.georgetown.edu/ai/prompts, Author(s): Georgetown University Library, Publication date: Unknown, Title of work: How to Craft Prompts, Publication/platform: Georgetown University Library Guides, Note: Provides resources and frameworks for writing effective prompts.
27 url: https://aws.amazon.com/what-is/prompt-engineering/, Author(s): AWS Team, Publication date: Unknown, Title of work: What is Prompt Engineering?, Publication/platform: Amazon Web Services, Note: Explains prompt engineering and provides examples of techniques.
34 url: https://www.prompthub.us/blog/prompt-engineering-for-content-creation, Author(s): PromptHub Team, Publication date: Unknown, Title of work: Prompt Engineering for Content Creation: Principles and Patterns, Publication/platform: PromptHub Blog, Note: Discusses principles and patterns for effective prompt engineering in content creation.
3 url: https://orq.ai/blog/what-is-the-best-way-to-think-of-prompt-engineering, Author(s): ORQ.ai Team, Publication date: Unknown, Title of work: What is the Best Way to Think of Prompt Engineering?, Publication/platform: ORQ.ai Blog, Note: Explores the core aspects and best practices of prompt engineering.
4 url: https://geniusee.com/single-blog/prompt-engineering-best-practices, Author(s): Geniusee Team, Publication date: Unknown, Title of work: Prompt Engineering Best Practices: How to Get the Most Out of Language Models, Publication/platform: Geniusee Blog, Note: Outlines best practices for prompt engineering and its importance in AI success.
31 url: https://www.youtube.com/watch?v=DsbWPfGfGTA, Author(s): McKinney, A., Publication date: Unknown, Title of work: Prompt Engineering for ChatGPT, Publication/platform: YouTube, Note: Video discussing prompt engineering techniques for ChatGPT.
46 url: https://medium.com/@dan_43009/prompt-engineering-for-content-creation-1edabe971d35, Author(s): Cleary, D., Publication date: 2024, Title of work: Prompt Engineering for Content Creation, Publication/platform: Medium, Note: Discusses prompt engineering principles for content creation with LLMs.
47 url: https://slash.co/articles/ethical-practices-in-prompt-engineering-balancing-creativity-and-responsibility/, Author(s): Slash.co Team, Publication date: 2024, Title of work: Ethical Practices in Prompt Engineering: Balancing Creativity and Responsibility, Publication/platform: Slash.co, Note: Examines the ethical challenges and core principles of prompt engineering.
61 url: https://www.oreilly.com/library/view/the-quick-guide/9781394243327/c07.xhtml, Author(s): Kasirzadeh, A., Publication date: 2024, Title of work: The Quick Guide to Large Language Models: From Beginner to Expert, Publication/platform: O’Reilly, Note: Chapter on ethical considerations in prompt engineering.
60 url: https://www.tutorialspoint.com/prompt_engineering/prompt_engineering_ethical_considerations.htm, Author(s): Tutorialspoint Team, Publication date: Unknown, Title of work: Prompt Engineering – Ethical Considerations, Publication/platform: Tutorialspoint, Note: Discusses ethical considerations in prompt engineering, including bias, privacy, and transparency.
48 url: https://mindfulengineer.ai/understanding-biases-in-prompts/, Author(s): Mindful Engineer Team, Publication date: Unknown, Title of work: Understanding Biases in Prompts: A Guide for Ethical AI, Publication/platform: Mindful Engineer, Note: Explains how biases can appear in AI prompts and how to identify and address them.
49 url: https://futureskillsacademy.com/blog/prompt-bias-in-ai/, Author(s): Future Skills Academy Team, Publication date: Unknown, Title of work: Prompt Bias in AI: Identification, Mitigation, and Ethical Guidelines, Publication/platform: Future Skills Academy Blog, Note: Discusses prompt bias in AI, including identification, mitigation, and ethical guidelines.
5 url: https://www.promptingguide.ai/, Author(s): Anonymous, Publication date: Unknown, Title of work: Prompt Engineering Guide, Publication/platform: promptingguide.ai, Note: A comprehensive guide with papers, techniques, and tools related to prompt engineering.
41 url: https://cloud.google.com/discover/what-is-prompt-engineering, Author(s): Google Cloud Team, Publication date: Unknown, Title of work: What is prompt engineering?, Publication/platform: Google Cloud, Note: Explains prompt engineering and provides strategies for enhancing skills.
42 url: https://docs.aws.amazon.com/bedrock/latest/userguide/prompt-engineering-guidelines.html, Author(s): AWS Team, Publication date: Unknown, Title of work: Prompt engineering guidelines, Publication/platform: Amazon Bedrock User Guide, Note: Provides guidelines for prompt engineering with Amazon Bedrock models.
30 url: https://docs.anthropic.com/en/docs/build-with-claude/prompt-engineering/overview, Author(s): Anthropic Team, Publication date: Unknown, Title of work: Prompt engineering, Publication/platform: Anthropic Documentation, Note: Overview of prompt engineering techniques for Claude models.
6 url: https://www.reddit.com/r/PromptEngineering/comments/1hkpg5t/i_have_a_number_of_resources_and_documents_on/, Author(s): Reddit User, Publication date: 2024, Title of work: I have a number of resources and documents on prompt engineering. Let’s start a collection?, Publication/platform: Reddit, Note: Reddit thread discussing resources on prompt engineering.
38 url: https://learnprompting.org/docs/introduction, Author(s): Learn Prompting Team, Publication date: Unknown, Title of work: Introduction, Publication/platform: Learn Prompting, Note: Introduction to the Learn Prompting guide, highlighting its comprehensiveness.
40 url: https://github.com/dair-ai/Prompt-Engineering-Guide, Author(s): DAIR.AI Team, Publication date: Unknown, Title of work: dair-ai/Prompt-Engineering-Guide, Publication/platform: GitHub, Note: GitHub repository for the DAIR.AI Prompt Engineering Guide.
37 url: https://www.reddit.com/r/PromptEngineering/comments/15464gs/best_prompt_engineering_resource/, Author(s): Reddit User, Publication date: 2024, Title of work: Best prompt engineering resource, Publication/platform: Reddit, Note: Reddit thread discussing the best resources for prompt engineering.
35 url: https://community.openai.com/t/openais-dec-17th-2023-prompt-engineering-guide/562526, Author(s): OpenAI Community User, Publication date: 2023, Title of work: OpenAI’s Dec 17th, 2023 Prompt Engineering Guide, Publication/platform: OpenAI Community Forum, Note: Announcement of OpenAI’s prompt engineering guide.
36 url: https://platform.openai.com/docs/guides/prompt-engineering, Author(s): OpenAI Team, Publication date: Unknown, Title of work: Prompt Engineering, Publication/platform: OpenAI Developer Platform, Note: Official prompt engineering guide from OpenAI.
57 url: https://pubs.acs.org/doi/10.1021/acscentsci.4c01935, Author(s): Zhou, Z., et al., Publication date: 2024, Title of work: Prompt Engineering for Chemical Research with Large Language Models, Publication/platform: ACS Central Science, Note: Discusses prompt engineering techniques and examples in chemical research.
59 url: https://www.nsta.org/blog/art-and-science-prompt-engineering, Author(s): Burns, B., Publication date: Unknown, Title of work: The Art and Science of Prompt Engineering, Publication/platform: NSTA Blog, Note: Explores the characteristics of good prompts and the prompt engineering process in an educational context.
33 url: https://www.reddit.com/r/aipromptprogramming/comments/1jqi6ad/machine_learning_science_my_research_has/, Author(s): Reddit User, Publication date: 2024, Title of work: Machine Learning Science: My research has revolutionized prompt engineering, Publication/platform: Reddit, Note: Reddit post claiming a breakthrough in prompt engineering for scientific applications.
50 url: https://medium.com/@simrwaraich/beyond-the-hype-real-world-examples-of-how-prompts-make-ai-work-1fef905ecb40, Author(s): Waraich, S., Publication date: 2025, Title of work: Beyond the Hype: Real-World Examples of How Prompts Make AI Work, Publication/platform: Medium, Note: Provides case studies of successful prompt engineering in marketing and customer service.
44 url: https://arxiv.org/html/2401.04122v2, Author(s): Bommasani, R., et al., Publication date: 2024, Title of work: Annotating Prompts to Understand and Improve Performance of Large Language Models, Publication/platform: arXiv, Note: Discusses a rigorous process for prompt generation in research.
58 url: https://pmc.ncbi.nlm.nih.gov/articles/PMC10585440/, Author(s): Cheatham, C. C., et al., Publication date: 2023, Title of work: Prompt Engineering: A New Frontier in Healthcare, Publication/platform: PMC, Note: Discusses the potential of prompt engineering in healthcare applications.
51 url: https://www.a3logics.com/blog/prompt-engineering-use-cases/, Author(s): A3logics Team, Publication date: Unknown, Title of work: 10+ Amazing Prompt Engineering Use Cases for Business, Publication/platform: A3logics Blog, Note: Outlines various use cases of prompt engineering across different industries.
45 url: https://www.promptingguide.ai/papers, Author(s): Anonymous, Publication date: Unknown, Title of work: Papers, Publication/platform: Prompt Engineering Guide, Note: Lists research papers related to prompt engineering.
52 url: https://moldstud.com/articles/p-success-stories-in-prompt-engineering-case-studies, Author(s): MoldStud Team, Publication date: Unknown, Title of work: Success Stories in Prompt Engineering: Case Studies, Publication/platform: moldstud.com, Note: Briefly mentions the integration of conversational interfaces as a success story in prompt engineering.
34 url: https://www.prompthub.us/blog/prompt-engineering-for-content-creation, Author(s): PromptHub Team, Publication date: Unknown, Title of work: Prompt Engineering for Content Creation: Principles and Patterns, Publication/platform: PromptHub Blog, Note: Discusses principles and patterns for effective prompt engineering in content creation.
53 url: https://clickup.com/blog/prompt-engineering-examples/, Author(s): ClickUp Team, Publication date: Unknown, Title of work: 30+ Prompt Engineering Examples to Automate Your Workflows, Publication/platform: ClickUp Blog, Note: Provides numerous examples of prompt engineering across various use cases.
63 url: https://www.tandfonline.com/doi/full/10.1080/10447318.2024.2431761, Author(s): Schleer, C., et al., Publication date: 2024, Title of work: Prompt engineering as a novel creative skill: Three studies on discerning, writing, and refining prompts for AI art generation, Publication/platform: Thinking Skills and Creativity, Note: Investigates prompt engineering as a creative skill for AI art generation.
54 url: https://www.quanthub.com/identify-common-use-cases-for-prompt-engineering/, Author(s): QuanHub Team, Publication date: Unknown, Title of work: Identify Common Use Cases for Prompt Engineering, Publication/platform: QuanHub, Note: Identifies common use cases for prompt engineering in text, image, audio, and video generation.
46 url: https://medium.com/@dan_43009/prompt-engineering-for-content-creation-1edabe971d35, Author(s): Cleary, D., Publication date: 2024, Title of work: Prompt Engineering for Content Creation, Publication/platform: Medium, Note: Discusses prompt engineering principles for content creation.
55 url: https://merge.rocks/blog/top-10-prompt-engineering-use-cases-for-business, Author(s): Merge Team, Publication date: Unknown, Title of work: Top 10 Prompt Engineering Use Cases for Business, Publication/platform: Merge Blog, Note: Outlines the top 10 business applications of prompt engineering.
56 url: https://www.reddit.com/r/ChatGPT/comments/14d7pfz/become_god_like_prompt_engineer_with_this_one/, Author(s): Reddit User, Publication date: 2023, Title of work: Become God-like Prompt Engineer with this one simple trick, Publication/platform: Reddit, Note: Reddit post discussing prompt engineering for ChatGPT.
11 url: https://futureagi.com/blogs/optimizing-non-deterministic-llm-prompts-with-future-agi, Author(s): FutureAGI Team, Publication date: 2025, Title of work: Optimizing Non-Deterministic LLM Prompts with Future AGI, Publication/platform: FutureAGI Blog, Note: Explains the reasons for inconsistent results from LLM prompts.
16 url: https://techcommunity.microsoft.com/blog/azure-ai-services-blog/prompt-engineering-for-openai%E2%80%99s-o1-and-o3-mini-reasoning-models/4374010, Author(s): Azure AI Services Team, Publication date: 2025, Title of work: Prompt Engineering for OpenAI’s O1 and O3-mini Reasoning Models, Publication/platform: Microsoft Tech Community Blog, Note: Discusses limitations of prompt engineering for multi-step reasoning with specific OpenAI models.
2 url: https://arxiv.org/html/2401.14423v3, Author(s): Sharma, P., et al., Publication date: 2024, Title of work: A Survey of Prompt Engineering Techniques for Large Language Models, Publication/platform: arXiv, Note: Provides a survey of prompt engineering techniques for LLMs.
18 url: https://portkey.ai/blog/evaluating-prompt-effectiveness-key-metrics-and-tools/, Author(s): Portkey AI Team, Publication date: 2024, Title of work: Evaluating Prompt Effectiveness: Key Metrics and Tools, Publication/platform: Portkey AI Blog, Note: Details key metrics for evaluating prompt effectiveness.
17 url: https://www.kdnuggets.com/measuring-prompt-effectiveness-metrics-and-methods, Author(s): Galvez, J., Publication date: 2025, Title of work: Measuring Prompt Effectiveness: Metrics and Methods, Publication/platform: KDnuggets, Note: Outlines methods to measure prompt quality.
21 url: https://medium.com/@Matthew_Frank/the-evolution-of-prompt-engineering-7bda6c07f612, Author(s): Frank, M., Publication date: 2025, Title of work: The Evolution of Prompt Engineering, Publication/platform: Medium, Note: Describes the evolution of prompt engineering with advancements in LLMs.
61 url: https://www.oreilly.com/library/view/the-quick-guide/9781394243327/c07.xhtml, Author(s): Kasirzadeh, A., Publication date: 2024, Title of work: The Quick Guide to Large Language Models: From Beginner to Expert, Publication/platform: O’Reilly, Note: Discusses biases in AI prompts and mitigation strategies.
16 url: https://techcommunity.microsoft.com/blog/azure-ai-services-blog/prompt-engineering-for-openai%E2%80%99s-o1-and-o3-mini-reasoning-models/4374010, Author(s): Azure AI Services Team, Publication date: 2025, Title of work: Prompt Engineering for OpenAI’s O1 and O3-mini Reasoning Models, Publication/platform: Microsoft Tech Community Blog, Note: Details further limitations of prompt engineering for complex reasoning with specific OpenAI models.
38 url: https://learnprompting.org/docs/introduction, Author(s): Learn Prompting Team, Publication date: Unknown, Title of work: Introduction, Publication/platform: Learn Prompting, Note: Implies gaps in existing prompt engineering documentation.
引用文献
Evolution – Prompt Engineering 4U, 4月 8, 2025にアクセス、 https://www.promptengineering4u.com/learning/evolution
Prompt Design and Engineering: Introduction and Advanced Methods – arXiv, 4月 8, 2025にアクセス、 https://arxiv.org/html/2401.14423v3
Prompt Engineering in 2025: Tips + Best Practices | Generative AI Collaboration Platform, 4月 8, 2025にアクセス、 https://orq.ai/blog/what-is-the-best-way-to-think-of-prompt-engineering
Mastering prompt engineering: Best practices for state-of-the-art AI solutions – Geniusee, 4月 8, 2025にアクセス、 https://geniusee.com/single-blog/prompt-engineering-best-practices
Prompt Engineering Guide, 4月 8, 2025にアクセス、 https://www.promptingguide.ai/
I have a number of resources and documents on prompt engineering. Let’s start a collection? – Reddit, 4月 8, 2025にアクセス、 https://www.reddit.com/r/PromptEngineering/comments/1hkpg5t/i_have_a_number_of_resources_and_documents_on/
What is Prompt Engineering? Techniques & Use Cases – AI21 Labs, 4月 8, 2025にアクセス、 https://www.ai21.com/knowledge/prompt-engineering/
Common LLM Prompt Engineering Challenges and Solutions – Ghost, 4月 8, 2025にアクセス、 https://latitude-blog.ghost.io/blog/common-llm-prompt-engineering-challenges-and-solutions/
A Survey of Techniques, Key Components, Strategies, Challenges, and Student Perspectives on Prompt Engineering for Large Language Models (LLMs) in Education | Sciety, 4月 8, 2025にアクセス、 https://sciety.org/articles/activity/10.20944/preprints202503.1808.v1
Prompt Engineering Best Practices: Tips, Tricks, and Tools | DigitalOcean, 4月 8, 2025にアクセス、 https://www.digitalocean.com/resources/articles/prompt-engineering-best-practices
Optimizing Non-Deterministic LLM Prompts | Future AGI, 4月 8, 2025にアクセス、 https://futureagi.com/blogs/optimizing-non-deterministic-llm-prompts-with-future-agi
What Did I Do Wrong? Quantifying LLMs’ Sensitivity and Consistency to Prompt Engineering, 4月 8, 2025にアクセス、 https://arxiv.org/html/2406.12334v3
How small changes in a prompt can lead to wildly different results, and what you can do about it | by Dan Cleary | Medium, 4月 8, 2025にアクセス、 https://medium.com/@dan_43009/how-small-changes-in-a-prompt-can-lead-to-wildly-different-results-and-what-you-can-do-about-it-d4d3d72f8a2e
10 Techniques for Effective Prompt Engineering | Lakera – Protecting AI teams that disrupt the world., 4月 8, 2025にアクセス、 https://www.lakera.ai/blog/prompt-engineering-guide
The Latest Breakthroughs in AI Prompt Engineering Is Pretty Cool – Reddit, 4月 8, 2025にアクセス、 https://www.reddit.com/r/PromptEngineering/comments/1j250g9/the_latest_breakthroughs_in_ai_prompt_engineering/
Prompt Engineering for OpenAI’s O1 and O3-mini Reasoning …, 4月 8, 2025にアクセス、 https://techcommunity.microsoft.com/blog/azure-ai-services-blog/prompt-engineering-for-openai%E2%80%99s-o1-and-o3-mini-reasoning-models/4374010
Measuring Prompt Effectiveness: Metrics and Methods – KDnuggets, 4月 8, 2025にアクセス、 https://www.kdnuggets.com/measuring-prompt-effectiveness-metrics-and-methods
Evaluating Prompt Effectiveness: Key Metrics and Tools – Portkey, 4月 8, 2025にアクセス、 https://portkey.ai/blog/evaluating-prompt-effectiveness-key-metrics-and-tools/
What are common metrics for evaluating prompts? – Deepchecks, 4月 8, 2025にアクセス、 https://www.deepchecks.com/question/common-metrics-evaluating-prompts/
Exploring the opportunities and challenges of using large language models to represent institutional agency in land system modelling – ESD, 4月 8, 2025にアクセス、 https://esd.copernicus.org/articles/16/423/2025/
The Evolution of Prompt Engineering | by Mattafrank | Medium, 4月 8, 2025にアクセス、 https://medium.com/@Matthew_Frank/the-evolution-of-prompt-engineering-7bda6c07f612
What is Prompt Engineering? A Detailed Guide For 2025 – DataCamp, 4月 8, 2025にアクセス、 https://www.datacamp.com/blog/what-is-prompt-engineering-the-future-of-ai-communication
The Future of Prompt Engineering: Evolution or Extinction …, 4月 8, 2025にアクセス、 https://lbbonline.com/news/the-future-of-prompt-engineering-evolution-or-extinction
The Evolution of Prompt Engineering: What Software Engineers Need to Know – Medium, 4月 8, 2025にアクセス、 https://medium.com/@leela.kumili/the-evolution-of-prompt-engineering-what-software-engineers-need-to-know-1d25bdeac7c2
AI Strategies Series: Inconsistent and Outdated Responses – FactSet Insight, 4月 8, 2025にアクセス、 https://insight.factset.com/ai-strategies-series-inconsistent-and-outdated-responses
What is prompt engineering? | SAP, 4月 8, 2025にアクセス、 https://www.sap.com/belgie/resources/what-is-prompt-engineering
What is Prompt Engineering? – Generative AI – AWS, 4月 8, 2025にアクセス、 https://aws.amazon.com/what-is/prompt-engineering/
Optimizing AI Performance: The Art of Measuring Prompt Effectiveness – Medium, 4月 8, 2025にアクセス、 https://medium.com/athina-ai/optimizing-ai-performance-the-art-of-measuring-prompt-effectiveness-e81c7ead599f
Taming the Unpredictable: How Continuous Alignment Testing Keeps LLMs in Check – AI/LLM – Artium, 4月 8, 2025にアクセス、 https://artium.ai/insights/taming-the-unpredictable-how-continuous-alignment-testing-keeps-llms-in-check
Prompt engineering overview – Anthropic API, 4月 8, 2025にアクセス、 https://docs.anthropic.com/en/docs/build-with-claude/prompt-engineering/overview
Become a ChatGPT Prompting Expert: Advance Prompt Engineering Techniques for Optimal Results – YouTube, 4月 8, 2025にアクセス、 https://www.youtube.com/watch?v=DsbWPfGfGTA
How do you measure prompt performance? – API – OpenAI Developer Community, 4月 8, 2025にアクセス、 https://community.openai.com/t/how-do-you-measure-prompt-performance/662643
Machine Learning Science – My research has revolutionized prompt engineering : r/aipromptprogramming – Reddit, 4月 8, 2025にアクセス、 https://www.reddit.com/r/aipromptprogramming/comments/1jqi6ad/machine_learning_science_my_research_has/
Prompt Engineering for Content Creation – PromptHub, 4月 8, 2025にアクセス、 https://www.prompthub.us/blog/prompt-engineering-for-content-creation
OpenAI’s Dec 17th, 2023 Prompt Engineering Guide, 4月 8, 2025にアクセス、 https://community.openai.com/t/openais-dec-17th-2023-prompt-engineering-guide/562526
Prompt engineering – OpenAI API, 4月 8, 2025にアクセス、 https://platform.openai.com/docs/guides/prompt-engineering
Best prompt engineering resource : r/PromptEngineering – Reddit, 4月 8, 2025にアクセス、 https://www.reddit.com/r/PromptEngineering/comments/15464gs/best_prompt_engineering_resource/
Prompt Engineering Guide: The Ultimate Guide to Generative AI, 4月 8, 2025にアクセス、 https://learnprompting.org/docs/introduction
How to Craft Prompts – Artificial Intelligence (Generative) Resources – Research – Guides, 4月 8, 2025にアクセス、 https://guides.library.georgetown.edu/ai/prompts
dair-ai/Prompt-Engineering-Guide – GitHub, 4月 8, 2025にアクセス、 https://github.com/dair-ai/Prompt-Engineering-Guide
Prompt Engineering for AI Guide | Google Cloud, 4月 8, 2025にアクセス、 https://cloud.google.com/discover/what-is-prompt-engineering
Prompt engineering concepts – Amazon Bedrock, 4月 8, 2025にアクセス、 https://docs.aws.amazon.com/bedrock/latest/userguide/prompt-engineering-guidelines.html
Towards Detecting Prompt Knowledge Gaps for Improved LLM-guided Issue Resolution, 4月 8, 2025にアクセス、 https://arxiv.org/html/2501.11709v1
From Prompt Engineering to Prompt Science With Human in the Loop – arXiv, 4月 8, 2025にアクセス、 https://arxiv.org/html/2401.04122v2
Papers | Prompt Engineering Guide, 4月 8, 2025にアクセス、 https://www.promptingguide.ai/papers
Prompt Engineering for Content Creation | by Dan Cleary – Medium, 4月 8, 2025にアクセス、 https://medium.com/@dan_43009/prompt-engineering-for-content-creation-1edabe971d35
Ethical Practices In Prompt Engineering: Balancing Creativity And …, 4月 8, 2025にアクセス、 https://slash.co/articles/ethical-practices-in-prompt-engineering-balancing-creativity-and-responsibility/
Biases in Prompts: Learn how to tackle them – Mindful Engineer, 4月 8, 2025にアクセス、 https://mindfulengineer.ai/understanding-biases-in-prompts/
Understanding Prompt Bias and How to Overcome It – Future Skills Academy, 4月 8, 2025にアクセス、 https://futureskillsacademy.com/blog/prompt-bias-in-ai/
Beyond the Hype: Real-World Examples of How Prompts Make AI Work – Medium, 4月 8, 2025にアクセス、 https://medium.com/@simrwaraich/beyond-the-hype-real-world-examples-of-how-prompts-make-ai-work-1fef905ecb40
Top Use Cases of AI Prompt Engineering For Success – A3Logics, 4月 8, 2025にアクセス、 https://www.a3logics.com/blog/prompt-engineering-use-cases/
Success Stories in Prompt Engineering Case Studies – MoldStud, 4月 8, 2025にアクセス、 https://moldstud.com/articles/p-success-stories-in-prompt-engineering-case-studies
Prompt Engineering Examples, Techniques & Practical Applications – ClickUp, 4月 8, 2025にアクセス、 https://clickup.com/blog/prompt-engineering-examples/
Identify Common Use Cases for Prompt Engineering – – QuantHub, 4月 8, 2025にアクセス、 https://www.quanthub.com/identify-common-use-cases-for-prompt-engineering/
Top 10 prompt engineering use cases for business – Merge Rocks, 4月 8, 2025にアクセス、 https://merge.rocks/blog/top-10-prompt-engineering-use-cases-for-business
Become God Like Prompt Engineer With This One Prompt : r/ChatGPT – Reddit, 4月 8, 2025にアクセス、 https://www.reddit.com/r/ChatGPT/comments/14d7pfz/become_god_like_prompt_engineer_with_this_one/
Leveraging Prompt Engineering in Large Language Models for Accelerating Chemical Research | ACS Central Science, 4月 8, 2025にアクセス、 https://pubs.acs.org/doi/10.1021/acscentsci.4c01935
Prompt Engineering as an Important Emerging Skill for Medical Professionals: Tutorial, 4月 8, 2025にアクセス、 https://pmc.ncbi.nlm.nih.gov/articles/PMC10585440/
The Art and Science of Prompt Engineering | NSTA, 4月 8, 2025にアクセス、 https://www.nsta.org/blog/art-and-science-prompt-engineering
Ethical Considerations in Prompt Engineering – Tutorialspoint, 4月 8, 2025にアクセス、 https://www.tutorialspoint.com/prompt_engineering/prompt_engineering_ethical_considerations.htm
7 Ethical Considerations in Prompt Engineering – The Quick Guide …, 4月 8, 2025にアクセス、 https://www.oreilly.com/library/view/the-quick-guide/9781394243327/c07.xhtml
Challenges in applying large language models to requirements engineering tasks | Design Science – Cambridge University Press & Assessment, 4月 8, 2025にアクセス、 https://www.cambridge.org/core/journals/design-science/article/challenges-in-applying-large-language-models-to-requirements-engineering-tasks/1FC7666F0A0B4E7091D2D4B2D46321B5
Full article: Prompting AI Art: An Investigation into the Creative Skill of Prompt Engineering, 4月 8, 2025にアクセス、 https://www.tandfonline.com/doi/full/10.1080/10447318.2024.2431761



