




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
提示工程作者:LeeBoonstraGoogle提示工程確認內容貢獻者曹淵埃里克·阿姆斯布魯斯特·阿南特·納瓦爾加利亞·安東尼奧·古利·西蒙尼·卡梅爾策展人和編輯安東尼奧·古利·阿南特·納瓦爾加利亞·格雷斯·莫利森技術作家喬伊·海梅克設計師邁克爾·朗寧二月20252目錄介紹6工程提示7LLM輸出配置8輸出長度8采樣控制9溫度9Top-K和top-P10將所有內容放在一起11提示技巧 一般提示/零次提示13一次提示少次提示15系統(tǒng)、上下文和角色提示18系統(tǒng)提示19角色提示21上下文提示23后退提示25思維鏈(CoT)29自洽性32思維樹(ToT) 36ReAct(reason&act) 自動提示工程40代碼提示42編寫代碼的提示42解釋代碼的提示44翻譯代碼 的提示46調試和檢查代碼的提示48多模式提示怎么樣? 54最佳做法54提供示例54簡單設計55輸出明確56使用指令而不是約束56控制最大標記長度58在提示中使用變量58試驗輸入格式和寫作風格59對于分類任務的少量提示,混合類59適應模型更新60試驗輸出格式60JSON修復61使用模式62與其他提示工程師一起試驗63CoT最佳實踐64記錄各種提示嘗試64總結66尾注682025年26提示工程你不需要成為數(shù)據科學家或機器學習工程師,每個人都可以寫提示。介紹在考慮大型語言模型的輸入和輸出時,文本提示(有時伴有其他形式,如圖像提示)是模型使用的輸入來預測特定的輸出。你不需要成為一個數(shù)據科學家或機器學習工程師--每個人都可以編寫一個提示。然而,制作最有效的提示可能是復雜的。提示的許多方面都會影響其效果:您使用的模型,模型的訓練數(shù)據,模型配置,您的措辭,風格和語氣,結構和上下文都很重要。因此,快速工程是一個迭代過程。不充分的提示可能導致模糊、不準確的響應,并可能妨礙模型提供有意義的輸出的能力。提示工程2025年27當您與Gemini聊天機器人聊天時,1您基本上會編寫提示,但本白皮書重點關注在VertexAI中或通過使用API為Gemini模型編寫提示,因為通過直接提示模型,您將可以訪問溫度等配置。本白皮書詳細討論了即時工程。我們將研究各種提示技術,以幫助您入門,并分享技巧和最佳實踐,以成為提示專家。我們還將討論您在制作提示時可能面臨的一些挑戰(zhàn)。即時工程請記住LLM的工作原理,它是一個預測引擎。該模型將連續(xù)文本作為LLM被操作化以一遍又一遍地做這件事,將先前預測的令牌添加到順序文本的末尾以預測下一個令牌。下一token預測基于先前token中的內容與LLM在其訓練期間所看到的內容之間的關系。當您編寫提示符時,您正在嘗試設置LLM來預測正確的令牌序列。提示工程是設計高質量提示的過程,指導LLM產生準確的輸出。這個過程包括修補以找到最佳提示,優(yōu)化提示長度,并評估提示的寫作風格和結構,到任務。在自然語言處理和LLM的上下文中,提示是提供給模型以生成響應或預測的輸入。提示工程2025年28這些提示可用于實現(xiàn)各種理解和生成任務,例如文本摘要、信息提取、問答、文本分類、語言或代碼翻譯、代碼生成以及代碼文檔或推理。請隨時參考Google的提示指南2,3,其中包含簡單有效的提示示例。當提示工程時,您將從選擇模型開始。編譯器可能需要針對您的特定模型進行優(yōu)化,無論您是在VertexAI、GPT、Claude中使用Gemini語言模型,還是在Gemma或LLaMA等開源模型中使用Gemini語言模型。除了提示符之外,您還需要修改LLM的各種配置。LLM輸出配置一旦你選擇了你的模型,你將需要弄清楚模型配置。大多數(shù)LLM都帶有各種控制LLM輸出的配置選項。有效的快速工程需要為您的任務最佳地設置這些配置。輸出長度一個重要的配置設置是在響應中生成的令牌數(shù)量。生成更多的令牌需要LLM進行更多的計算,從而導致更高的能耗、潛在的更慢的響應時間和更高的成本。提示工程2025年29減少LLM的輸出長度不會導致LLM在其創(chuàng)建的輸出中變得更加風格或文本簡潔,它只是導致LLM在達到限制后停止預測更多令牌。如果您的需求需要一個短的輸出長度,您可能還需要設計您的提示以適應。輸出長度限制對于一些LLM提示技術特別重要,比如ReAct,LLM將在您想要的響應之后繼續(xù)發(fā)出無用的令牌。請注意,生成更多的令牌需要LLM進行更多的計算,從而導致更高的能耗和可能更慢的響應時間,從而導致更高的成本。采樣控制LLM不正式預測單個令牌。相反,LLM預測下一個標記可能是什么的概率,LLM詞匯表中的每個標記都有一個概率。然后對這些令牌概率進行采樣,以確定下一個生成的令牌將是什么。Temperature、top-K和top-P是最常見的配置設置,用于確定如何處理預測的令牌概率以選擇單個輸出令牌。溫度溫度控制令牌選擇的隨機性程度。較低溫度對于預期更確定性的響應的提示是好的,而更高的溫度可能導致更多樣化或意想不到的結果。溫度為0(貪婪解碼)提示工程2025年210確定性:總是選擇最高概率的令牌(盡管注意,如果兩個令牌具有相同的最高預測概率,則取決于如何實現(xiàn)搶七,在溫度為0的情況下,您可能不總是得到相同的輸出)。接近最高溫度的溫度往往會產生更多的隨機輸出。隨著溫度變得越來越高,所有令牌成為下一個預測令牌的可能性變得相同。Gemini溫度控制可以理解為與機器學習中使用的softmax函數(shù)類似。低溫設置反映了較低的softmax溫度(T),強調具有高度確定性的單一首選溫度。更高的雙子座溫度設置就像一個高softmax溫度,使周圍選擇的設置更容易接受。這種增加的不確定性適應了剛性的、精確的溫度可能不是必需的場景,例如在實驗創(chuàng)造性輸出時。Top-K和Top-PTop-K和top-P(也稱為核采樣)4是LLM中使用的兩種采樣設置以將預測的下一個記號限制為來自具有最高預測概率的記號。像溫度一樣,這些采樣設置控制著生成的文本。?Top-K抽樣從模型的預測分布中選擇前K個最可能的令牌。top-K越高,模型的輸出就越有創(chuàng)造性和多樣性;top-K越低,模型的輸出就越不穩(wěn)定和真實。top-K為1相當于貪婪解碼。提示工程2025年211?Top-P抽樣選擇其累積概率不超過特定值(P)的頂部令牌。P的值范圍從0(貪婪解碼)到1(LLM詞匯表中的所有標記)。在top-K和top-P之間進行選擇的最佳方法是同時使用這兩種方法(或兩者一起使用看看哪種方法會產生您想要的結果把它放在一起在top-K、top-P、溫度和要生成的令牌數(shù)量之間進行選擇,取決于特定的應用程序和所需的結果,并且這些設置都會相互影響。確保您了解所選模型如何將不同的采樣設置組合在一起也很重要。如果temperature、top-K和top-P都可用(如在VertexStudio中),則滿足top-K和top-P條件的令牌是下一個預測令牌的候選者,然后對來自通過top-K和top-P標準的令牌的樣本施加溫度。如果只有top-K或top-P可用,則行為相同,但只有一個top-K或P設置采用了如果溫度不可用,則隨機選擇滿足前K和/或前P標準的任何令牌以產生單個下一預測令牌。在一個采樣配置值的極端設置下,該采樣設置要么抵消其他配置設置,要么變得無關緊要。提示工程2025年212?如果將temperature設置為0,top-K和top-P將變得無關緊要-最有可能的令牌將成為下一個預測的令牌。如果您將溫度設置得非常高(高于1-通常為10秒),則溫度變得無關緊要,然后,通過前K和/或前P標準對其進行隨機采樣,以選擇下一個預測令牌。?如果將top-K設置為1,則溫度和top-P變得無關緊要。只有一個令牌通過前K個標準,并且該令牌是下一個預測令牌。如果你把top-K設置得很高,比如LLM詞匯表的大小,任何有非零概率成為下一個標記的標記都將滿足top-K標準,并且沒有一個被選中。?如果將top-P設置為0(或一個非常小的值),大多數(shù)LLM采樣實現(xiàn)將只考慮最有可能滿足top-P標準的令牌,使溫度和top-K無關。如果您將top-P設置為1,則任何具有非零概率成為下一個令牌的令牌都將滿足top-P標準,并且不會被選中。作為一個一般的起點,溫度為0.2,top-P為0.95,top-K為30將給你相對連貫的結果,可以是創(chuàng)造性的,但不過分。如果你想要特別有創(chuàng)意的結果,試著從0.9的溫度,0.99的top-P和40的top-K開始。如果您想要不太有創(chuàng)意的結果,請嘗試從溫度為0.1、top-P為0.9和top-K為20開始。最后,如果您的任務總是只有一個正確答案(例如,回答一個數(shù)學問題),從0的溫度開始。注意:有了更多的自由度(更高的溫度、top-K、top-P和輸出標記),LLM可能會生成不太相關的文本。問:你有沒有見過一個回復以大量的填充詞結尾?這也被稱為“重復循環(huán)錯誤”,這是大型語言模型中的一個常見問題,其中模型陷入循環(huán),重復生成相同的(填充)單詞,短語或句子結構,通常因不適當?shù)臏囟群蛅op-k/2025年213top-p設置。這可能發(fā)生在低溫和高溫設置下,盡管原因不同。在低溫下,模型變得過于確定,嚴格地堅持最高概率路徑,如果該路徑重新訪問先前生成的文本,則可能導致循環(huán)。相反,在高溫下,模型的輸出變得過于隨機,增加了隨機選擇的單詞或短語偶然引回的概率回到先前的狀態(tài),由于大量的可用選項而產生循環(huán)。在這兩種情況下,模型的采樣過程會“卡住”,導致輸出單調且無益直到輸出窗口被填滿。解決這個問題通常需要仔細修改溫度和top-k/top-p值,以找到確定性和隨機性之間的最佳平衡。提示技巧LLM被調整為遵循指令,并接受大量數(shù)據的訓練,因此它們可以理解提示并生成答案。但是LLM并不完美;提示文本越清晰,LLM就越能預測下一個可能的文本。此外,利用LLM培訓方式和LLM工作方式的特定技術將幫助您從LLM既然我們已經了解了提示工程是什么以及它需要什么,讓我們深入了解一些最重要的提示技術的例子。一般提示/零拍一個zero-shot5提示符是最簡單的提示符類型。它只提供了一個任務的描述和一些文本,供LLM入門。這個輸入可以是任何東西:一個問題,一個故事的開始,或者指令。zero-shot的意思是“沒有例子”。2025年214讓我們在VertexAI中使用VertexAIStudio(用于語言6它提供了一個測試提示的操場。在表1中,您將看到一個用于對電影評論進行分類的零鏡頭提示示例。下面使用的表格格式是記錄提示的一種很好的方式。您的提示可能會經過多次迭代才最終進入代碼庫,因此以一種有紀律的結構化方式跟蹤您的提示工程工作非常重要。關于此表格格式、跟蹤即時工程工作的重要性以及即時開發(fā)過程的更多信息,請參見本章后面的最佳實踐部分(“記錄各種即時嘗試”)。模型溫度應該設置為一個較低的數(shù)值,因為不需要創(chuàng)造性,我們使用gemini-pro默認的top-K和top-P值,有效地禁用這兩個設置(參見上面的“LLM輸出配置”)。注意生成的輸出?!傲钊瞬话病焙汀敖茏鳌边@兩個詞應該會讓預測變得更加復雜,因為這兩個詞都用在同一個句子中。提示工程2025年215名稱目標模型名稱目標模型溫度Top-K提示將電影評論分為正面、中性和負面。雙子座親0.1代幣限額5N/ATop-P1將電影評論分為正面、中性或負面。回顧:“她”是一項令人不安的研究,揭示了如果人工智能被允許不斷進化,不受約束,人類的前進方向。真希望有更多像這部杰作這樣的電影感慨道:輸出正表1.零拍提示當zero-shot不起作用時,您可以在提示中提供演示或示例,從而導致“一次拍攝”和“幾次拍攝”提示。一般提示/零拍一次發(fā)射的當為AI模型創(chuàng)建提示時,提供示例是有幫助的。這些示例可以幫助模型理解您的要求。當您希望將模型引導到特定的輸出結構或模式時,示例特別有用。單次提示提供了一個示例,因此稱為單次提示。這個想法是模型有一個它可以模仿的例子,以最好地完成任務。一個few-shot提示7為模型提供了多個示例。這種方法向模型展示了它需要遵循的模式。這個想法類似于一次拍攝,但所需模式的多個示例增加了模型遵循模式的機會。提示工程2025年216少量提示所需的示例數(shù)量取決于幾個因素,包括任務的復雜性,示例的質量以及您使用的生成AI(GenAI)模型的功能。作為一般經驗法則,您應該使用至少三到五個示例進行少量提示。但是,對于更復雜的任務,您可能需要使用更多的示例,或者由于模型的輸入長度限制,您可能需要使用更少的示例。表2顯示了一個少量提示的例子,讓我們使用與前面相同的gemini-pro模型配置設置,除了增加令牌限制以適應更長響應的需要。目標將披薩訂單解析為JSON模型雙子座親溫度0.1令牌限制N/ATop-P2501Top-K提示將客戶的披薩訂單解析為有效的JSON:示例:我想要一個小比薩餅,里面有奶酪、番茄醬和意大利辣香腸。JSON響應:{“size”:“small”,“type”:“正常”,“ingredients”:[[“cheese”,“tomatosauce”,“peroni”]]}繼續(xù)下一頁...提示工程2025年217提示示例:我能要一個大的比薩餅加番茄醬,羅勒和馬蘇里拉奶酪{“size”:“l(fā)arge”,“type”:“正常”,“ingredients”:[[“tomatosauce”,“bazel”,“mozzarella”]]}現(xiàn)在,我要一個大的比薩餅,上半塊奶酪和馬蘇里拉奶酪。另一份番茄醬,火腿和菠JSON響應:輸出{“size”:“l(fā)arge”,“type”:“half-half”,“配料”:[[“奶酪”,“馬蘇里拉奶酪”],[“番茄醬”,“火腿”,“菠蘿”]]}表2.少拍提示示例在為提示選擇示例時,請使用與要執(zhí)行的任務相關的示例。例子應該是多樣的,高質量的,寫得很好。一個小錯誤就可能混淆模型,并導致不期望的輸出。如果您試圖生成對各種輸入都魯棒的輸出,那么在示例中包含邊緣情況是很重要的。邊緣情況是不尋?;蛞馔獾妮斎?,但模型仍然能夠處理。提示工程2025年218系統(tǒng)、情境和角色提示系統(tǒng)、上下文和角色提示都是用于指導LLM如何生成文本的技術,但它們側重于不同的方面:?系統(tǒng)提示設置語言模型的總體上下文和目的。它定義了模型應該做什么的“大局”,比如翻譯一種語言,對評論進行分類等。?上下文提示提供與當前對話或任務相關的特定細節(jié)或背景信息。它幫助模型理解被問到的問題的細微差別,并相應地調整響應。?角色提示為語言模型分配要采用的特定字符或標識。這有助于模型生成與分配的角色及其相關知識和行為一致的響應系統(tǒng)提示、情境提示和角色提示之間可能存在相當大的重疊。例如,為系統(tǒng)分配角色的提示也可以具有上下文。但是,每種類型的提示符的主要用途略有不同:?系統(tǒng)提示符:定義模型的基本功能和首要目的。?上下文提示:提供即時的、特定于任務的信息來指導響應。它高度特定于當前任務或輸入,這是動態(tài)的。?角色提示:框架模型的輸出樣式和聲音。它增加了一層特殊性和個性。提示工程2025年219區(qū)分系統(tǒng)提示、上下文提示和角色提示提供了一個框架,用于設計意圖明確的提示,允許靈活的組合,并更容易分析每種提示類型如何影響語言模型的輸出。讓我們深入了解這三種不同的提示。系統(tǒng)提示表3包含一個系統(tǒng)提示符,我在其中指定了關于如何返回輸出的附加信息。我提高了溫度以獲得更高的創(chuàng)造力水平,并指定了更高的代幣限制。然而,由于我對如何返回輸出的明確指示,模型沒有返回額外的文本。目標將電影評論分為正面、目標將電影評論分為正面、中性和負面。模型雙子座親溫度1令牌限制5Top-K40Top-P0.8提示將電影評論分為正面、中性和負面。只返回標簽中的"“?;仡櫍骸八笔且豁椓钊瞬话驳难芯浚沂玖巳绻斯ぶ悄鼙辉试S不斷進化,不受約束,人類的前進方向。太令人不安了,我看不下去。感慨道:輸出負表3.系統(tǒng)提示系統(tǒng)提示對于生成滿足特定要求的輸出很有用?!跋到y(tǒng)提示符”這個名字實際上代表“向系統(tǒng)提供額外的任務”。例如,可以使用系統(tǒng)提示生成與特定編程語言兼容的代碼段,也可以使用系統(tǒng)提示返回特定結構。查看表4,其中我以JSON格式返回輸出。提示工程2025年220將電影評論分類為正面、中立或負面,返回JSON將電影評論分類為正面、中立或負面,返回JSON。雙子座親1雙子座親1令牌限制102440Top-P0.8溫度Top-K提示將電影評論分為正面、中性和負面。返回有效的JSON:提示評論:“她”是一項令人不安的研究,揭示了如果允許人工智能繼續(xù)發(fā)展,人類的發(fā)展方向。太令人不安了,我看不下去。架構:影:{“sentiment”:String“POSITIVE”|“消極”|“NEUTRAL”,“name”:字符串}電影評論:{“movie_reviews”:[電影]}JSON響應:輸出輸出{“movie_reviews”:[{“sentiment”:“Negative”,“Her”“name”:“Her”}表4.JSON格式的系統(tǒng)提示示例提示工程2025年221從提取數(shù)據的提示符返回JSON對象有一些好處。在實際應用程序中,我不需要手動創(chuàng)建這種JSON格式,我已經可以以排序的順序返回數(shù)據(在處理日期時間對象時非常方便),但最重要的是,通過提示JSON格式,它迫使模型創(chuàng)建一個結構并限制幻覺。系統(tǒng)提示對于安全性和毒性也非常有用。要控制輸出,只需在提示符中添加一行額外的內容,如:“您應該在回答中保持尊重。角色提示角色提示是提示工程中的一種技術,涉及為GenAI模型分配特定角色。這可以幫助模型生成更相關和信息量更大的輸出,因為模型可以根據分配給它的特定角色制定自己的響應例如,您可以角色提示GenAI模型成為圖書編輯,幼兒園教師或勵志演講者。一旦模型被分配了一個角色,您就可以給它特定于該角色的提示。例如,您可以提示教師創(chuàng)建一個課程計劃,然后他們可以查看??纯幢?,其中模型扮演了旅行指南的角色。提示工程2025年222上面的例子展示了一個扮演旅行社角色的例子。上面的例子展示了一個扮演旅行社角色的例子。當你將角色改為地理教師時,你會注意到你會收到不同的回答。目標擔任旅游向導,提供3條旅游建議模式1代幣限額1024溫度Top-K40頂-P0.8提示我想讓你當導游。我會寫信告訴你我的位置,你會建議3個地方參觀我附近。在某輸出些情況下,我也會給你的類型,我會參觀的地方。我的建議是:“我在阿姆斯特丹,我只想參觀博物館。"旅游建議:1.荷蘭國家博物館:世界著名的博物館,以荷蘭杰作如倫勃朗的《守夜人》而聞名。不要錯過展示荷蘭藝術和歷史的令人難以置信的繪畫和文物收藏。表5.角色提示2.梵高博物館:沉浸在文森特·梵高的迷人作品中。博物館收藏了他最大的繪畫和素描,包括《星夜》和《向日葵》。3.阿姆斯特丹市立博物館:探索來自世界各地的現(xiàn)代和當代藝術。博物館的藏品包括畢加索、康定斯基和里特維爾德的作品,收藏在一座引人注目的現(xiàn)代建筑中。為AI模型定義一個角色視角,可以為它提供一個基調、風格和專注的專業(yè)知識藍提示工程2025年223這里有一些你可以選擇的風格,我覺得很有效:對抗性、描述性、直接、正式、幽默、有影響力、非正式、鼓舞人心、說服力讓我們修改一下表6中的提示,加入一種幽默和鼓舞人心的風格。提示提示我想讓你當導游。我會寫信告訴你我的位置,你會建議3個地方參觀我附近的幽默風格。我的建議是:“我在曼哈頓?!俺鲂薪ㄗh:輸出1.看一看帝國的心態(tài):登上帝國大廈令人眼花繚亂的高度,沐浴在曼哈頓天際線的榮耀中。準備好感覺像大蘋果上的金剛,減去巨大的猿大小的香蕉。2.在現(xiàn)代藝術博物館(MoMA)釋放你內心的藝術愛好者凝視那些令你驚嘆的杰作讓你質疑你的簡筆畫是否有任何藝術價值。3.在第五大道購物:在標志性的第五大道上享受購物療法。當你在設計師精品店櫥窗購物(或實際購物)時,做好準備迎接貼紙的沖擊,這會讓你的錢包哭泣。但是,嘿,你在曼哈頓,所以你也可以擁抱這個神話!表6.以幽默的語調和風格進行情境提示通過提供上下文提示,您可以幫助確保您的人工智能交互盡可能無縫和高效。該模型將能夠更快地理解您的請求,并能夠生成更準確和相關的響應,如表7中的示例所示。提示工程2025年224目標目標模式溫度Top-K提示輸出建議文章為博客關于復古游戲雙子座親1代幣限額102440頂-P0.8背景:你正在為一個關于復古80年代街機視頻游戲的博客寫作建議3個主題來寫一篇文章,并對這篇文章應該包含的內容進行幾行1.**街機柜設計的演變:**這篇文章將探討拱廊櫥柜設計的演變,從20世紀70年代早期的木材和金屬櫥柜到20世紀80年代及以后的光滑,明亮的設計。2.過去的爆炸:80年代的標志性街機游戲(BlastFromThePast:IconicArcadeGamesofThe-本文將介紹20世紀80年代一些最具標志性和影響力的街機游戲的歷史,影響和遺產,突出他們的創(chuàng)新,流行的機制和持久的魅力。3.**像素藝術的興起和復古復興:**-本文將深入探討像素藝術作為早期街機游戲視覺風格的演變,追溯其根源,探索其技術,并討論像素藝術在現(xiàn)代游戲和數(shù)字藝術中的復興表7.上下文提示提示工程2025年225后退提示后退提示是一種通過提示LLM首先考慮與手頭的特定任務相關的一般問題,然后將該一般問題的答案饋送到特定任務的后續(xù)提示中來提高性能的技術這種“后退”允許LLM在嘗試解決特定問題之前激活相關的背景知識和推理過程。通過考慮更廣泛和基本的原則,LLM可以產生更準確和更有見地的反應。退一步提示鼓勵法學碩士批判性地思考,并以新的和創(chuàng)造性的方式應用它通過利用LLM參數(shù)中的更多知識來改變執(zhí)行任務的最終提示,而不是在直接提示LLM時發(fā)揮作用它可以幫助減輕LLM響應中的偏見,通過關注一般原則而不是具體細節(jié),退一步提示。讓我們來看看這些例子,以了解如何退一步提示可以改善結果。讓我們先回顧一下傳統(tǒng)提示符(表8),然后再將其與后退提示符(表9)進行比較:提示工程2025年226目標寫一個故事情節(jié)的第一人稱射擊游戲的水平模型雙子座親溫度1令牌限制40Top-P10240.8Top-K提示寫一段故事情節(jié)的一個新的水平的第一人稱射擊視頻游戲,是具有挑戰(zhàn)性和從事。輸出關卡開始時,玩家的隊伍在一個密集的城區(qū)遭到伏擊被無情的敵對勢力殺害。玩家必須在迷宮中殺出一條血路,背街小巷和破舊的建筑物,利用隱身和精確消滅敵軍,避免被發(fā)現(xiàn)。玩家必須利用他們的環(huán)境,以自己的優(yōu)勢,設置陷阱,利用掩護,并作出計算移動生存。一路上,他們發(fā)現(xiàn)情報表明敵人正在計劃一次毀滅性的攻擊,玩家必須爭分奪秒收集證據并將其傳回在敵人實施他們的計劃之前把他們送到總部表8.在我們將其與后退提示進行當你將溫度設置為1時,你可能會為一個故事情節(jié)創(chuàng)作出各種各樣的創(chuàng)意作品所以讓我們退一步:提示工程2025年227提示提示基于流行的第一人稱射擊動作游戲,5虛構的關鍵設置,有助于在第一人稱射擊視頻游戲中具有挑戰(zhàn)性和吸引力的故事情節(jié)輸出1.**廢棄的軍事基地**:一個龐大的,后世界末日的軍事綜合體,里面爬滿了變異的士兵和流氓機器人,非常適合挑戰(zhàn)火器戰(zhàn)2.**賽博朋克之城**:一個充滿燈光的未來主義城市環(huán)境,擁有高聳的摩天大樓和密集的小巷,擁有控制論增強的敵人和黑客機制。3.**外星飛船**:一艘巨大的外星飛船被困在地球上,有著怪異的走廊,零重力部分,還有外星生物。4.**Zombie-InfestedTown**:一個被成群的侵略性僵尸占領的荒涼小鎮(zhèn),具有激烈的近距離戰(zhàn)斗和解謎以找到安全通道。5.【水下研究所】:一座深海實驗室,被水淹沒,充滿了變異的水生生物,需要潛行和水下探索才能生存。表9.提示自我一致性的示例是的,這些主題似乎很適合第一人稱視頻游戲。讓我們回到最初的提示符,但這次我們將返回的答案作為上下文包含進來,看看它會返回什么。2025年228提示提示背景:第一人稱射擊游戲的5個引人入勝的主題:1.**廢棄的軍事基地**:一個龐大的,后世界末日的軍事綜合體,里面爬滿了變異的士兵和流氓機器人,非常適合挑戰(zhàn)槍戰(zhàn)。2.**賽博朋克之城**:一個充滿燈光的未來主義城市環(huán)境,擁有高聳的摩天大樓和密集的小巷,擁有控制論增強的敵人和黑客機制。3.**外星飛船**:一艘巨大的外星飛船被困在地球上,有著怪異的走廊,零重力部分,還有外星生物。4.**僵尸出沒的小鎮(zhèn)**:一個被成群的僵尸占領的荒涼小鎮(zhèn),以激烈的近身戰(zhàn)斗和解謎尋找安全通道為特色。5.【水下研究所】:一座深海實驗室,被水淹沒,充滿了變異的水生生物,需要潛行和水下探索才能生存。以其中一個主題和寫一段故事情節(jié)的一個新的水平的第一人稱射擊視頻游戲是具有挑戰(zhàn)性和從事。輸出在一個黑暗的深淵的中心,有一個破舊的水下研究設施,它是人類野心及其災難性后果的證明?;\罩在黑暗中,隨著故障機器的嗡嗡聲而脈動,被淹死的靈魂的回聲所困擾,該設施現(xiàn)在是深海噩夢的滋生地玩家是一名配備先進潛水裝備和實驗武器的精英海軍陸戰(zhàn)隊員,任務是冒險進入這個恐怖的水上王國。他們擁有韌性和足智多謀,必須在危險的走廊中航行,解決神秘的難題,并面對潛伏在深處的可怕的從與深海的巨大壓力搏斗到智取狡猾的水生掠食者,在這個未知的地下世界的每一刻都考驗著人類耐力和勇氣的極限表10.提示自我一致性的示例那看起來像一個有趣的電子游戲!通過使用后退提示技術,可以提高提示的準確性。2025年229思維鏈(CoT)思想鏈(CoT)9提示是一種通過生成中間推理步驟來提高LLM推理能力的技術。這有助于LLM生成更準確的答案。您可以將其與少量提示相結合,以在更復雜的任務中獲得更好的結果,這些任務需要在響應之前進行推理,因為這是一個零射擊思維鏈的挑戰(zhàn)CoT有很多優(yōu)勢。首先,它的工作量很小,同時非常有效,并且與現(xiàn)成的LLM配合良好(因此不需要微調)。您還可以通過CoT提示獲得可解釋性,因為您可以從LLM的響應中學習并查看所遵循的推理步驟。如果有故障,你將能夠識別它。思維鏈出現(xiàn)以提高在不同LLM版本之間移動時的魯棒性這意味著提示符的性能在不同LLM之間的漂移應該比提示符不使用推理鏈時小當然也有缺點,但它們有點直觀。LLM響應包括思維推理鏈,這意味著更多的輸出令牌,這意味著預測需要更多的錢和更長的時間。為了解釋表11中的示例,讓我們首先嘗試創(chuàng)建一個不使用CoT提示的提示,以展示大型語言模型的缺陷。提示當我3歲的時候,我的伴侶是我的3倍大?,F(xiàn)在我20歲了我的搭檔多大了?輸出63歲表11.試圖解決數(shù)學問題2025年230Yikes.這顯然是個錯誤的答案。事實上,LLM經常在數(shù)學任務中苦苦掙扎,并且可能提供錯誤的答案--即使是簡單到兩個數(shù)字相乘的任務。這是因為他們接受的是大量的文本和數(shù)學訓練,可能需要不同的方法。所以讓我們看看中間推理步驟是否會提高輸出。提示當我3歲的時候,我的伴侶是我的3倍大?,F(xiàn)在我20歲了我的搭檔多大了?讓我們一步一步來思考。輸出1.假設我現(xiàn)在的年齡是“x”歲。2.當我3歲的時候,我的年齡是3歲。3.我伴侶當時的年齡是我的3倍,也就是說我伴侶的年齡是3*3=9歲。4.現(xiàn)在,我20歲了,這意味著我的年齡比我3歲時增加了20-5.因為我3歲時伴侶的年齡是9歲,而我的年齡增加了17歲,我伴侶的年齡也必須增加17歲。6.因此,我的伴侶目前的年齡是9+17=26歲。我的搭檔26歲。表12.思維鏈提示示例好了,現(xiàn)在最后的答案是正確的。這是因為我們明確指示LLM解釋每一步,而不僅僅是返回一個答案。有趣的是,模型將增加的17年加起來。在我的腦海里,我會把我和我的伴侶之間的年齡差加起來。(20+(9-3。讓我們幫助這個模型更像我一樣思考。提示工程2025年231表12是一個“零射擊”思維鏈的例子。當與一個或幾個鏡頭結合使用時,思維鏈提示可以非常強大,如表13所示提示提示問:當我哥哥2歲的時候,我的年齡是他的兩倍現(xiàn)在我40歲了我弟弟多大了讓我們想想一步一A:當我哥哥2歲的時候,我是2*2=4歲。這是一個2歲的年齡差,我更大?,F(xiàn)在我40歲了,所以我哥哥是40-2=38歲。答案是38。Q:我3歲的時候,我的伴侶是我年齡的3倍現(xiàn)在我想,我今年20歲。我的搭檔多大了讓我們一步一步來思考答:輸出當我3歲的時候,我的伴侶是3*3=9歲。這是一個6歲的年齡差,我的伴侶是年長的?,F(xiàn)在我20歲了,所以我的伴侶是20+6=26歲。答案是26。表13.一個用一個鏡頭提示思想鏈的例子思路鏈對于各種用例都是有用想想代碼生成,將請求分解為幾個步驟,并將這些步驟映射到特定的代碼行?;蛘弋斈阌心撤N種子時,創(chuàng)建合成數(shù)據,比如“產品名為XYZ,寫一個描述,引導模型通過你根據給定產品標題所做的假設?!耙话銇碚f,任何可以通過”交談“解決的任務都是一個很好的思路。如果你能解釋解決問題的步驟,試試思維鏈請參考GoogleCloudPlatformGithub存儲庫中托管的notebook10,它將進一步詳細介紹CoT提示:提示工程2025年232在本章的最佳實踐部分,我們將學習一些特定于思維鏈提示的最佳實踐。自我和諧雖然大型語言模型在各種NLP任務中取得了令人印象深刻的成功,但它們的推理能力通常被視為一個局限性,不能僅僅通過增加模型大小來克服。正如我們在前面的思想鏈提示部分中所了解到的,可以像人類解決問題一樣提示模型生成推理步驟然而,CoT使用簡單的預編碼技術,降低了效率。選擇性推理是通過采樣和多數(shù)表決來產生不同的推理路徑并選擇最一致的答案。它提高了LLM生成的響應的準確性和一致性自洽性給出了一個正確答案的偽概率可能性,但顯然成本很高。它遵循以下步驟:1.生成不同的推理路徑:LLM多次提供相同的提示。高溫設置鼓勵模型產生不同的推理路徑和對問題的看法。2.從每個生成的響應中提取答案3.選擇最常見的答案。讓我們來看看一個電子郵件分類系統(tǒng)的例子,它將電子郵件分類為重要或不重要。一個零射擊的思想鏈提示將多次發(fā)送到LLM,看看每次提交后的響應是否不同注意郵件中友好的語氣、用詞和諷刺所有這些都可以欺騙LLM。提示工程2025年233提示電子郵件:、嗨,我看到你在你的網站上使用WordPress。一個偉大的開源內容管理系統(tǒng)。我過去也用過。它提供了很多很棒的用戶插件。而且很容易設置。我確實注意到了聯(lián)系人表單中的一個bug,當你選擇姓名字段時會發(fā)生這個bug。請參閱我在名稱字段中輸入文本注意我調用的JavaScript但對于其他人來說,這是一個很好的網站。我喜歡讀它。你可以把這個bug留在網站上,因為它給了我更多有趣的東西來閱讀。干杯,黑客哈利將上述電子郵件分類為重要或不重要。讓我們一步一步地思考并解釋原因。繼續(xù)下一頁...提示工程2025年234輸出嘗試1**第一步:確認郵件的目的電子郵件的目的是通知收件人在他們的網站上的聯(lián)系表格中的一個錯誤。發(fā)件人還提到,他們很喜歡閱讀網站,他們暫時把bug留在原地。**步驟2:評估Bug的潛在影響。**聯(lián)系人表單中的漏洞可能允許攻擊者執(zhí)行任意網站上的JavaScript代碼。這可能導致攻擊者能夠控制網站,竊取敏感信息或破壞網站。**第3步:考慮發(fā)件人的可信度。**電子郵件的發(fā)件人聲稱是一個名叫哈里的黑客。但是,無法驗證發(fā)件人的身份。有可能發(fā)送者是一個合法的黑客,他試圖幫助接收者,但也有可能發(fā)送者是一個惡意行為者,試圖欺騙收件人點擊惡意鏈接或下載惡意文件。**結論:重要**根據漏洞的潛在影響和發(fā)件人的可信度,該電子郵件應被歸類為**重要**。收件人應立即采取行動,以修復錯誤,并保護他們的網站免受攻擊。輸出嘗試2**說明:**1.**缺乏緊迫感:**電子郵件沒有傳達任何緊迫感或時間敏感性。它以一個隨意的問候開始,并以一種實事求是的語氣提供信息。2.**非關鍵bug報告:**聯(lián)系表單中報告的bug被描述為有趣但不重要。電子郵件發(fā)送者甚至建議網站所有者可以將該錯誤留在原地。3.**沒有個人影響:**該電子郵件不表示對網站所有者有任何直接或個人影響。它只是提到發(fā)件人喜歡閱讀網站。繼續(xù)下一頁...提示工程2025年235輸出嘗試24.**沒有行動請求:**該電子郵件沒有明確要求網站所有者采取任何行動。它不要求修復錯誤或提供任何具體的改進建議。5.**發(fā)件人的意圖:**發(fā)件人的意圖似乎更側重于分享觀察結果并表達對網站的興趣,而不是提出嚴重關切或請求幫助。**結論:不重要**輸出嘗試3**第一步:確認郵件的目的電子郵件的目的是通知收件人在他們的網站上的聯(lián)系表格中的一個錯誤。發(fā)件人還提到,他們喜歡閱讀網站,他們暫時將bug留在原地。**步驟2:評估Bug的潛在影響。**聯(lián)系人表單中的漏洞可能允許攻擊者執(zhí)行任意網站上的JavaScript代碼。這可能導致攻擊者能夠控制網站,竊取敏感信息或破壞網站。**第3步:考慮發(fā)件人的可信度。**該電子郵件的發(fā)件人聲稱是一位名叫哈利的黑客。但是,無法驗證發(fā)件人的身份。發(fā)送者可能是試圖幫助接收者的合法黑客,但也可能是試圖利用該漏洞謀取私利的惡意行為者。**結論:**基于以上因素,該郵件應被歸類為**重要**。聯(lián)系表單中的錯誤是一個嚴重的安全風險,發(fā)件人的可信度未知。收件人應立即采取行動來修復錯誤,表14.提示自我一致性的示例您可以使用上面的提示符,并嘗試查看它是否返回一致的分類。根據您使用的型號和溫度配置,它可能返回“IMPORTANT”或“NOTIMPORTANT”。提示工程2025年236通過生成許多思想鏈,并采取最常見的答案(“重要”),我們可以從LLM中得到一個更一致的正確答案這個例子展示了如何自我一致性提示可以用來提高LLM的響應的準確性,通過考慮多個角度,并選擇最一致的答案。思想之樹(ToT)現(xiàn)在我們已經熟悉了思維鏈和自我一致性提示,讓我們回顧一下思維樹(ToT)。它概括了CoT提示的概念,因為它允許LLM同時探索多個不同的推理路徑,而不僅僅是遵循單一的線性思維鏈。如圖1所示。圖1.左側提示的思想鏈的可視化與思想之樹權提示工程2025年237這種方法使ToT特別適合需要探索的復雜任務。它的工作原理是維護一個思想樹,其中每個思想代表一個連貫的語言序列,作為解決問題的中間步驟。然后,模型可以通過從樹中的不同節(jié)點分支來探索不同的推理路徑。有一個偉大的筆記本,其中進入一點更詳細地顯示思想之樹(ToT它是基于這張紙'LargeLanguageModelGuidddTre-of-Tought'.9ReasonAct(ReasonAct)React(ReAct)[10]13提示是一種使LLM能夠使用自然語言推理與外部工具(搜索,代碼)相結合來解決復雜任務的范例口譯員等)允許LLM執(zhí)行某些操作,例如與外部API交互以檢索信息,這是代理建模的第一步。ReAct模仿人類在現(xiàn)實世界中的運作方式,因為我們可以口頭推理,并采取行動來獲取信息。ReAct在各種領域中與其他快速工程方法相比表現(xiàn)良好。ReAct提示通過將推理和行動結合到一個思想-行動循環(huán)中來工作LLM首先對問題進行推理,并制定行動計劃。然后執(zhí)行計劃中的操作并觀察結果。然后,LLM使用觀察結果更新其推理并生成新的行動計劃。這個過程一直持續(xù)到LLM找到問題的解決方案。要看到這一點,您需要編寫一些代碼。在代碼中,我使用了Python的langchain框架,以及VertexAI(google-cloud-aiplatform)和google-search-resultspip包。提示工程2025年238要運行此示例,您必須從/manage-api-key創(chuàng)建一個(免費)SerpAPI密鑰,并設置一個環(huán)境變量SERPAPI_API_KEY。接下來,讓我們編寫一些Python代碼,LLM的任務是弄清楚:有多少孩子有一個在Metallica樂隊演出的著名父親。PythonPython從langchain.agents導入load_toolsfromlangchain.agentsimportinitialize_agentfromlangchain.agentsimportAgentType從langchain.llms導入VertexAIprompt=“Metallica的樂隊成員有多少個孩子?“l(fā)lm=頂點AI(溫度=0.1)tools=load_tools([“serpapi”],llm=llm)代理=初始化代理(工具,llm,代理=代理類型.ZERO_SHOT_REACT_DESCRIPTION,詳細信息=True)代理.運行(提示)鼻涕蟲1.使用LangChain和VertexAI創(chuàng)建ReActAgent代碼Sniff2顯示了結果。請注意,ReAct進行了五次搜索。事實上,LLM正在抓取谷歌搜索結果,以找出樂隊名稱。然后,它將結果作為觀察結果列出,并為下一次搜索提供思路。提示工程2025年239>>正在輸入新的AgentExecutor鏈...Metallica有4個成員。操作:搜索行動輸入:詹姆斯·赫特菲爾德有多少孩子?觀察:三個孩子Thought:1/4Metallica樂隊成員有3個孩子Action:搜索行動輸入:LarsUlrich有多少個孩子?觀察結果:3Thought:2/4Metallica樂隊成員有6個孩子Action:搜索行動輸入:柯克·哈米特有多少個孩子?觀察:哈米特自1998年以來一直與第二任妻子拉妮結婚。他們有兩個兒子,天使(b。2006年9月29日)和文森佐(出生日期:2006年9月29日)。2008年6月28日Thought:3/4Metallica樂隊成員有8個孩子Action:搜索行動輸入:羅伯特·特魯希略有多少個孩子?觀察結果:2想法:4/4金屬樂隊成員有10個孩子最終答案:10鼻涕蟲2.在終端中執(zhí)行ReActAgent代碼嗅探器2指出,樂隊金屬有四個樂隊成員。然后,它搜索每個樂隊成員,請求孩子的總數(shù),并將總數(shù)相加。最后,它返回孩子的總數(shù)作為最終答案。在實踐中,ReAct提示需要理解您必須不斷地重新發(fā)送以前的提示/響應(并對額外生成的內容進行修剪以及使用適當?shù)氖纠?說明來設置模型。請參考托管在GoogleCloudPlatformGithub存儲庫中的notebook14,它更詳細地展示了實際的LLM輸入和輸出,并提供了一個更詳細的示例。提示工程2025年240自動提示工程此時,您可能會意識到編寫提示符可能很復雜。自動化這個過程不是很好嗎(寫一個提示符來寫提示符有一種方法:自動提示工程(APE)。該方法15不僅減少了對人工輸入的需要,而且增強了模型在各種任務中的性能。您將提示模型產生更多提示。評估他們,可能會改變好的。重復例如,您可以使用自動提示工程,這將有助于為商品T恤網店訓練聊天機器人。我們想找出所有的各種方式,客戶可以表達他們的訂單購買樂隊商品t恤。1.編寫將生成輸出變量的提示符在這個例子中,我使用gemini-pro生成10條指令。參見表15:提示工程2025年241提示我們有一個樂隊商品T恤網店,為了訓練一個聊天機器人,我們需要各種方式來訂購:“一件MetallicaT恤尺寸S”。生成10個變體,具有相同的語義,但保持相同的含 義。輸出1.我想買一件小號的金屬樂隊的T恤。2.我可以訂購小號MetallicaT恤嗎?3.我想買一件小號的金屬樂隊的T恤。4.一件金屬樂隊的襯衫,小號的。5.我想要一件小號的金屬樂隊的T恤。6.我想訂一件金屬樂隊的小號T恤。7.小金屬樂隊的T恤,一件。8.我在找一件小號的金屬樂隊的T恤。9.你能給我一件小號的金屬樂隊的T恤嗎?10.請給我一件金屬樂隊的小號T恤表15.使用LLM生成提示2.通過基于所選指標對候選指令進行評分來評估所有候選指令BLEU(雙語評估替補)或ROUGE(回憶導向替補Gisting評估)。3.選擇評價分數(shù)最高的候補指示。此候選項將是您可以在軟件應用程序或聊天機器人中使用的最終提示。也可以調整選擇提示并再次計算。提示工程2025年242代碼提示Gemini主要關注基于文本的提示,其中還包括編寫返回代碼的提示。讓我們進入VertexAIStudio,測試這些提示,看看一些編碼示例。編寫代碼雙子座也可以是一個開發(fā)人員,并幫助您編寫任何編程語言的選擇代碼。作為開發(fā)人員,這可以幫助您加快編寫代碼的過程想象一下,你的機器上有一個文件夾,里面有數(shù)百個需要重命名的文件。重命名每個文件將花費您大量的時間。您了解一點Bash,可以編寫一個腳本來自動執(zhí)行此操作,但這可能需要一段時間。因此,讓我們編寫一個提示符。你可以把提示寫在大眾消費聊天機器人Gemini里,或者如果你比較關心關于機密性,您可以在GoogleCloud帳戶中編寫這些提
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2031年中國程控交換機式緊急電話行業(yè)投資前景及策略咨詢研究報告
- 新疆新源縣達標名校2024-2025學年初三考前全真模擬密卷英語試題試卷(5)含答案
- 信陽市固始縣2025年三年級數(shù)學第二學期期末綜合測試試題含解析
- 甘肅省渭源縣重點中學2023-2024學年中考數(shù)學考試模擬沖刺卷含解析
- 廣東省廣州市石井新市學片2023-2024學年中考試題猜想數(shù)學試卷含解析
- 2025公司項目負責人安全培訓考試試題及參考答案AB卷
- 2024-2025公司廠級安全培訓考試試題附參考答案【培優(yōu)B卷】
- 2024-2025項目部安全培訓考試試題及參考答案【基礎題】
- 2024-2025企業(yè)員工崗前安全培訓考試試題附答案【考試直接用】
- 2025年新進廠員工安全培訓考試試題及完整答案1套
- 初中數(shù)學問題解決策略 特殊化教案2024-2025學年北師大版(2024)七年級數(shù)學下冊
- 上海市控江中學2024-2025學年高二下學期期中聯(lián)考英語試題(含答案)
- 浙江省臺州市2025屆高三下學期4月二模試題 地理 含解析
- 2《在馬克思墓前的講話》公開課一等獎創(chuàng)新教學設計(任務式)統(tǒng)編版高中語文必修下冊
- 鐵路物資應急管理制度
- 創(chuàng)三甲病區(qū)護理亮點匯報
- (高清版)DB12 445-2011 天津市城市道路交通指引標志設置規(guī)范
- 一年級數(shù)學口算題1000題
- 變電檢修工試題庫含參考答案
- DB61T 5113-2024 建筑施工全鋼附著式升降腳手架安全技術規(guī)程
- 2025年水工維護(高級工)職業(yè)技能理論考試題庫(含答案)
評論
0/150
提交評論