【微軟中國MSDN】2024年AzureOpenAl?成式??智能??書243mb_第1頁
【微軟中國MSDN】2024年AzureOpenAl?成式??智能??書243mb_第2頁
【微軟中國MSDN】2024年AzureOpenAl?成式??智能??書243mb_第3頁
【微軟中國MSDN】2024年AzureOpenAl?成式??智能??書243mb_第4頁
【微軟中國MSDN】2024年AzureOpenAl?成式??智能??書243mb_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

生成式

AI

成為人工智能領(lǐng)域新的關(guān)鍵詞。吸納從機器智能到機器學(xué)習(xí)、深度學(xué)習(xí)的關(guān)鍵技術(shù),生成式

AI

更進(jìn)一步,能夠根據(jù)提示或現(xiàn)有數(shù)據(jù)創(chuàng)建新的書面、視覺和聽覺內(nèi)容。在此基礎(chǔ)上,大模型和大模型應(yīng)用一時涌現(xiàn),并迅速確立AI

落地新范式。據(jù)data.ai

intelligence

數(shù)據(jù)顯示,2023

年生成式

AI

應(yīng)用激增。2024

AI

將會帶動

10%

的應(yīng)用下載量,包含

GenAI

功能的應(yīng)用下載量將同比增長

40%。面對生成式

AI

及其應(yīng)用落地的迅猛發(fā)展,微軟期待用

AI

重新定義軟件開發(fā)與工作的未來。從Azure

OpenAI、Copilot

Stack、開發(fā)工具到協(xié)作應(yīng)用等領(lǐng)域,微軟將

AI

融入現(xiàn)有的軟件和服務(wù)生態(tài),從提供

AI

工具到構(gòu)筑

AI

平臺和生態(tài),全方位幫助開發(fā)者應(yīng)對技術(shù)革命,予力人們運用

AI,讓每個人都可以在工作和生活中,受益于這些突破性技術(shù),探索全新機遇與無限可能。微軟的

AI

戰(zhàn)略包括三個部分:將

AI

副駕融入每個微軟云解決方案、幫助客戶通過

AI創(chuàng)新和轉(zhuǎn)型以及負(fù)責(zé)任的

AI。前言本白皮書將全面介紹

Microsoft

Azure

生成式人工智能領(lǐng)域的解決方案、工具指南、最佳實踐以及支持

AI的云端算力及架構(gòu)優(yōu)勢,旨在幫助處于

AI

不同階段的客戶選擇適合您戰(zhàn)略的落地路徑,本白皮書介紹的落地方案涵蓋從直接使用微軟Azure

AI

AzureOpenAI

服務(wù),到自建大模型等四層路徑。2前言第一章

Azure

AI

Azure

OpenAl

服務(wù)概括第二章

生成式人工智能落地實踐的四種路徑

路徑一直接使用Azure

OpenAI

模型:

添加您的數(shù)據(jù)至Azure

OpenAl

模型

路徑二

Prompt

engineer

提示工程優(yōu)化

路徑三

基于現(xiàn)有模型進(jìn)行

Fine-tuning

微調(diào)

路徑四

訓(xùn)練您的自有模型

第三章

生成式人工智能落地成功案例參考

汽車行業(yè):

梅賽德斯-

奔馳

零售行業(yè):

沃爾瑪

游戲行業(yè):

完美世界

專業(yè)服務(wù)行業(yè):KPMG

零售行業(yè):CarMax目錄24781112151818202122233第一章AzureAI及Azure

OpenAl服務(wù)概括Azure

AI

服務(wù)AzureAI

服務(wù)包括了

Azure

機器學(xué)習(xí)平臺、認(rèn)知服務(wù)和應(yīng)用

AI

服務(wù)。其中,Azure

認(rèn)知服務(wù)有五大支柱,分別是視覺、語音、語言、決策和Azure

OpenAI

服務(wù)

。Azure

AI

服務(wù)通過現(xiàn)成的預(yù)生成可定制的

API

和模型,幫助開發(fā)人員和組織快速創(chuàng)建智能、前沿、面向市場且負(fù)責(zé)任的應(yīng)用程序,包括對話、搜索、監(jiān)視、翻譯、語音、視覺和決策的自然語言處理。這意味著,您可以使用

AzureAI組合構(gòu)建企業(yè)規(guī)模的智能應(yīng)用,并使用生成式

AI重新構(gòu)想你的業(yè)務(wù)。Azure

AI

組合在Azure

AI

的幫助下,您可以為您的組織構(gòu)建可以立即推向市場的先進(jìn)應(yīng)用程序。以微軟為例,Microsoft產(chǎn)品及應(yīng)用平臺如

Microsoft

365

Copilot、Dynamics

365

Copilot、Power

Platform

都由

Azure

AI

驅(qū)動,為每個人和組織提效生產(chǎn)力。Azure

OpenAI

服務(wù)生成自己的助手和生成式

AI

應(yīng)用程序。AzureAIContent

Safety在應(yīng)用程序和服務(wù)中檢測用戶生成的和

AI生成的有害內(nèi)容。Azure

AI

提示流創(chuàng)建可執(zhí)行的PromptFlow,通過可視化圖形鏈接大型語言模型、提示和

Python

工具。

機器學(xué)習(xí)運營(MLOps)加速機器學(xué)習(xí)工作流的自動化、協(xié)作和可重現(xiàn)性。

負(fù)責(zé)任的AI

儀表板使用統(tǒng)一的儀表板實踐負(fù)責(zé)任、高質(zhì)量的AI,能夠輕松評估和調(diào)試機器學(xué)習(xí)模型。Azure

AI

搜索基于你自己的數(shù)據(jù)構(gòu)建、微調(diào)和訓(xùn)練自定義

AI

模型,獲得獨特的優(yōu)勢。4Azure

OpenAI

目前為各類企業(yè)提供兩類服務(wù)模式:Pay

As

You

Go

即用即付型模式:適合各類

AI

場景的測試及上線應(yīng)用,可在Azure

Portal

后臺直接啟用。

預(yù)配置吞吐容量的專屬模式

:

適合各類追求穩(wěn)定性能及穩(wěn)定延時的AI

生產(chǎn)應(yīng)用。通過提供穩(wěn)定的最大延遲和吞吐量保障穩(wěn)定可預(yù)測的性能預(yù)留專屬的容量成本節(jié)省:

與按消耗Tokens

計費的Pay

As

You

Go

即用即付模式相比,可節(jié)省成本Azure

OpenAI

服務(wù)微軟

Azure

作為

OpenAI

的獨家云服務(wù)提供商,自

2019

年開始便以出色的、面向

AI

時代的領(lǐng)先架構(gòu),為OpenAI

的快速發(fā)展提供助力?;陔p方的戰(zhàn)略合作,現(xiàn)在

Azure

全球版客戶可以通過

Azure

OpenAI

服務(wù)直接調(diào)用

OpenAI

全部模型,包括

ChatGPT、GPT-4、GPT-4

vision、Codex

DALL.E

等模型,并享有

Azure

企業(yè)級

99.9%

的可用性

SLA、企業(yè)級安全保障和為人工智能優(yōu)化的基礎(chǔ)設(shè)施。目前有

18,000

多家組織使用

AzureOpenAI

服務(wù)。微軟

AI

服務(wù)一覽5Microsoft'sResponsibleAl

Principles

負(fù)責(zé)任的人工智能原則在科技行業(yè)里,微軟率先提出了打造負(fù)責(zé)任的人工智能的決心。2016

年,微軟

CEO

薩提亞納德拉發(fā)表了一篇關(guān)于人工共同責(zé)任的專欄文章,幾個月后,第一次公開提出了微軟的人工智能準(zhǔn)則:公平、可靠和安全、隱私和保障、包容、透明、責(zé)任。當(dāng)

AI

進(jìn)入主流產(chǎn)品和服務(wù)時,這些原則對于創(chuàng)建負(fù)責(zé)任且值得信賴的

AI

至關(guān)重要。它們以兩個角度為指導(dǎo):道德和可解釋。閱讀標(biāo)題鏈接可閱讀詳細(xì)細(xì)節(jié)。Privacy

&SecurityToolsand

processesTrainingand

practicesRulesBuildingblocks

toenact

principlesReliability

&SafetyMicrosoft'sResponsibleA

PrinciplesFairnessInclusivenessAccountabilityGovernanceTransparency6第二章生成式人工智能落地實踐的四種路徑其中,90%

的使用場景可以通過前兩層的落地方案實現(xiàn)。在任何路徑下,您都可以通過使用檢索增強生成

(RAG)模式,與預(yù)訓(xùn)練的大型語言模型

(LLM)

和你自己的數(shù)據(jù)配合使用以生成響應(yīng)。同時,也可以通過使用

Azure

大語言模型運營功能

(LLMOps)

實現(xiàn)高效提示工程和開發(fā)部署,以簡化的過程來管理大模型應(yīng)用的端到端生命周期。微軟為各行業(yè)客戶

根據(jù)

AI

戰(zhàn)略階段不同提供四個層次的

AI

創(chuàng)新支持:結(jié)合您的現(xiàn)有數(shù)據(jù)直接使用

Azure

OpenAI

模型:適合各類

AI

場景的實現(xiàn)Prompt

engineer

提示工程優(yōu)化

:提高大語言模型生成響應(yīng)的準(zhǔn)確性訓(xùn)練您的自有模型:AzureAI

Infra

云端大規(guī)模

AI

算力平臺方案1234

基于現(xiàn)有模型進(jìn)行

Fine-tuning

微調(diào):使用示例數(shù)據(jù)重新訓(xùn)練現(xiàn)有的大型語言模型,從而生成使用提供的示例經(jīng)過優(yōu)化的新的“自定義”大型語言模型。7路徑一

直接使用

Azure

OpenAI

模型:

添加您的數(shù)據(jù)至

Azure

OpenAI

模型1.1

Azure

OpenAI

服務(wù)上的可用模型語言模型微軟為各行業(yè)提供四個層次的

AI

創(chuàng)新支持GPT-4-0125-preview:GPT-4-0125-preview

已發(fā)布

,

新模型旨在減少模型未完成任務(wù)的“懶惰”情況,及其他升級。GPT-4:國際版

Azure

OpenAI

服務(wù)的客戶和合作伙伴可以申請訪問

GPT-4,并開始使用

OpenAI

目前最先進(jìn)的模型構(gòu)建應(yīng)用。通過基于

Azure

AI

優(yōu)化的基礎(chǔ)設(shè)施、企業(yè)級可用性、合規(guī)性、數(shù)據(jù)安全和隱私控制提供的支持,以及與其它

Azure

服務(wù)的多種集成,實現(xiàn)您的大模型應(yīng)用架構(gòu)。GPT-4-Turbo:GPT-4

Turbo

功能更強大,模型信息更新到

2023

4

月。它具有

128K

上下文窗口,因此您可以使用

RAG(檢索增強生成)等技術(shù),基于企業(yè)用例所需的自定義數(shù)據(jù)定制應(yīng)用程序。GPT-3.5-Turbo:GPT-3.5-Turbo

現(xiàn)已更新至

1025

版本。8Assistants

API客戶可以開啟

Code

Interpreter,

Function

calling

等工具在自己的應(yīng)用程序內(nèi)構(gòu)建擁有指令的

AI

助手

,

并利用模型、工具和知識來響應(yīng)用戶查詢。AzureAssistantsAPI目前已支持代碼解釋器和函數(shù)調(diào)用,檢索功能將很快發(fā)布。TTS

模型OpenAI

TTS

模型在

AOAI

Azure

AI

Speech

同時上線。新的

TTS模型能生成6

種預(yù)設(shè)不同個性和風(fēng)格的人類品質(zhì)語音。多模態(tài)模型GPT-4-Turbo

with

Vision:GPT-4

Turbo

with

Vision

是由

OpenAI

開發(fā)的大型多模態(tài)模型(LMM),支持圖像分析并能對圖像有關(guān)問題生成文本響應(yīng)。它結(jié)合了自然語言處理和視覺理解能力。GPT-4

Turbo

withVision

達(dá)到了圖像理解的先進(jìn)水平。它不僅僅能夠識別圖片中的對象,更注重理解上下文和細(xì)節(jié),比如創(chuàng)建詳細(xì)的圖像標(biāo)題、提供豐富的上下文描述、回答關(guān)于視覺內(nèi)容的問題或分配智能標(biāo)簽。微調(diào)Azure

OpenAI

服務(wù)推出了三款模型的

Fine-tuning

功能(Babbage-002、Davinci-002

GPT-3.5-Turbo)。用戶可以使用

Azure

OpenAI

服務(wù)或

Azure機器學(xué)習(xí)對

Babbage/Davinci-002

GPT-3.5-Turbo

進(jìn)行

Fine-tuning。GPT-3.5-Turbo

1106

模型已支持

?ne-tuning,

同時

Training

Hosting

的成本比

GPT-3.5-Turbo

都降低

50%。Babbage-002

Davinci-002

支持

completion,Turbo支持對話式交互。通過幾個簡單的命令,您就可以指定基本模型、提供數(shù)據(jù)、進(jìn)行訓(xùn)練和部署。

點擊閱讀關(guān)于微調(diào)的介紹文章圖像DALL·E

3:DALL

·

E3

是一種支持文本提示的圖像生成模型,助力用戶探索創(chuàng)意表達(dá)的新領(lǐng)域,通過語言和視覺藝術(shù)的交融提供獨特的體驗。提示越詳細(xì),圖像效果就越好。您甚至可以在已創(chuàng)建的圖像中添加文本。轉(zhuǎn)錄和翻譯Whisper:Whisper

模型提供轉(zhuǎn)錄和翻譯音頻內(nèi)容的功能,同時支持大規(guī)模高質(zhì)量的批量轉(zhuǎn)錄。91.2

添加您的數(shù)據(jù)Azure

OpenAI

Service

on

your

data,基于這項全新功能,用戶可以使用自己的數(shù)據(jù)驅(qū)動

OpenAI

模型,無需訓(xùn)練或微調(diào),即可釋放全部數(shù)據(jù)潛力。Azure

OpenAI

Service

on

your

data

能夠獲取并打通所有來源的數(shù)據(jù)。無論數(shù)據(jù)是存儲在本地還是云端,該功能將提供無縫連接以解鎖數(shù)據(jù)的全部潛力。借助這一先進(jìn)工具,您可以高效處理、組織、優(yōu)化數(shù)據(jù),獲得有價值、高質(zhì)量的洞察。同時,用戶友好的

API和

SDK,將與您的現(xiàn)有系統(tǒng)輕松集成;定制化示例應(yīng)用程序助力快速部署。此外,數(shù)據(jù)共享和利用也將變得更輕松,您可以在企業(yè)內(nèi)部或面向客戶快速實現(xiàn)信息分發(fā)。Azure

OpenAI

Service

on

your

data連接多個數(shù)據(jù)源,包括:Azure

認(rèn)知搜索索引:您可以將數(shù)據(jù)連接到

Azure認(rèn)知搜索索引,實現(xiàn)與

OpenAI模型的無縫集成。Azure

Blob

存儲容器:將數(shù)據(jù)連接到

Azure

Blob存儲容器,使用

Azure

OpenAI

服務(wù)輕松獲取數(shù)據(jù),用于后續(xù)的分析和對話。本地文件:

連接您的

Azure

AI

門戶文件,

為數(shù)據(jù)連接提供靈活性和便利性。數(shù)據(jù)在攝取、切分之后,將導(dǎo)入

Azure

認(rèn)知搜索索引。txt、md、html、Word

文件、PowerPoint、PDF

等格式的文件都可以用于分析和對話。使用

Azure

OpenAI

服務(wù)數(shù)據(jù)支持的步驟如下:連接數(shù)據(jù)源:使用

Azure

AI

Studio

連接您所需的數(shù)據(jù)源,可通過

Azure

認(rèn)知搜索索引、Blob

存儲容器、上傳本地文件等途徑完成連接?;跀?shù)據(jù)進(jìn)行提問和聊天:

基于數(shù)據(jù)進(jìn)行提問和聊天:連接數(shù)據(jù)源之后,您就可以通過

Azure

AIStudio,向

OpenAI

模型提問和對話。這將使您獲得有價值的洞察,并在大量信息的支撐下做出商業(yè)決策。10本報告來源于三個皮匠報告站(),由用戶Id:549683下載,文檔Id:183465,下載日期:2024-12-041.3

結(jié)合

Azure

OpenAI

Embedding

嵌入向量生成模型將企業(yè)現(xiàn)有的結(jié)構(gòu)化知識庫與提示詞引擎結(jié)合起來,讓

GPT

模型生成更正確、更穩(wěn)定、更可靠的結(jié)果。Embedding

是一種特殊的數(shù)據(jù)表示格式,機器學(xué)習(xí)模型和算法可以輕松使用。

Embedding

是一段文本的語義含義的信息密集表示。Embedding

支持在

Azure

數(shù)據(jù)庫中進(jìn)行矢量相似性搜索,例如

Azure

Cosmos

DB

for

MongoDB

vCore

或Azure

Database

for

PostgreSQL

-

靈活服務(wù)器。路徑二

Prompt

engineer

提示工程優(yōu)化LLMapplication

pro?lesGENERATION

HEAVY在

AI

領(lǐng)域,特別是在大型語言模型中,提示指的是用戶為引起特定類型的響應(yīng)而給出的輸入或指令。要充分利用

GPT-4

等大型語言模型,就必須精心設(shè)計能產(chǎn)生有效結(jié)果的提示。挑戰(zhàn)在于如何選擇詞語、表達(dá)方式、符號和結(jié)構(gòu)的最佳組合,以引導(dǎo)模型生成準(zhǔn)確而貼切的內(nèi)容,包括回答問題、以最喜歡的作家的口吻創(chuàng)作故事、創(chuàng)作詩歌、執(zhí)行代碼相關(guān)的任務(wù)等。提示有助于

AI

明確用戶意圖和對其生成內(nèi)容的期望,更精確的提示會帶來更準(zhǔn)確、相關(guān)性更強的結(jié)果。需要注意的是,相似的提示可能會引發(fā)不同的響應(yīng),這取決于底層模型、訓(xùn)練數(shù)據(jù),甚至是用戶請求措辭的細(xì)微變化。您可以使用本文介紹的

15

個提示工程優(yōu)化技巧,躍升為更好的AI

提示詞工程師。GENERATION

LIGHTContent

creationChatbotSummarizationPROMPT

HEAVYPrompt

engineeringEnterprise

ChatbotPROMPT

LIGHTLLM11路徑三基于現(xiàn)有模型進(jìn)行

Fine-tuning

微調(diào)什么是

Fine-tune微調(diào)Fine-tuning

是開發(fā)人員和數(shù)據(jù)科學(xué)家用來定制大型語言模型,以滿足特定任務(wù)需求的方法之一。與“檢索增強生成”(Retrieval

Augmented

Generation,RAG)和“提示工程”等方法通過在提示中注入正確的信息和指令不同,F(xiàn)ine-tuning

則是通過對大型語言模型本身進(jìn)行個性化定制來實現(xiàn)的。Azure

OpenAI

服務(wù)和

Azure

機器學(xué)習(xí)提供了監(jiān)督式

Fine-tuning,允許您提供自定義數(shù)據(jù)(提示

/

補全或?qū)υ捠搅奶?,具體取決于選擇的模型),以教授基本模型新的技能。何時應(yīng)該使用微調(diào)在開始使用Fine-tuning

之前,我們建議您首先嘗試提示工程或

RAG(檢索增強生成)——這是最快的入手方式。微軟提供了如

Prompt

Flow

On

Your

Data

工具來使此過程變得更簡單。您可以在需要

Fine-tuning

模型的場景下進(jìn)行比較,以選擇從提示工程還是

RAG

開始入手。大多數(shù)模型都會結(jié)合提示工程和

Fine-tuning,從而避免浪費精力。想要了解何時

/

是否應(yīng)該進(jìn)行

Fine-tuning

?一些基本規(guī)則可以為您提供指導(dǎo):1.

如果您希望簡單而快速地獲取結(jié)果,請不要立即開始使用

Fine-tuning:因為這需要大量的數(shù)據(jù)和時間來訓(xùn)練和評估新模型。如果時間有限,通常只需通過提示工程即可取得相當(dāng)大的進(jìn)展。2.

如果您需要最新或域外數(shù)據(jù),這是使用

RAG

和提示工程的完美用例。3.

如果您希望確保您的模型具有良好的基礎(chǔ),避免產(chǎn)生幻覺(hallucinations),那么

RAG

在這方面表現(xiàn)出色??梢钥紤]使用

Fine-tuning

的場景包括:1.

教會模型一項新技能,以便它在特定任務(wù)上表現(xiàn)出色,如分類、摘要或始終以特定格式或語調(diào)進(jìn)行回應(yīng)。有時,通過

Fine-tuning

較小的模型,也能使其在特定任務(wù)上與較大的模型一樣出色。2.

通過示例向模型演示如何執(zhí)行某些操作,但在提示中很難解釋清楚,或者示例太多,上下文窗口中無法容納。這些場景有很多邊緣情況,比如自然語言查詢,或者教模型用特定的聲音或語調(diào)說話。3.

減少延遲。較長的提示可能需要更長的處理時間,而

Fine-tuning

允許您將這些較長的提示集成到模型本身中。12微調(diào)與提示工程、RAG

的使用情景一覽微調(diào)是一種高級技術(shù),需要專業(yè)知識才能正確使用。下面的問題將幫助您評估是否已經(jīng)準(zhǔn)備好使用微調(diào)。2.

您目前嘗試了哪些其他辦法?4.

你打算使用哪些數(shù)據(jù)進(jìn)行微調(diào)?1.

為什么要微調(diào)?3.

這些方法哪些情況下行不通?5.

如何衡量微調(diào)模型的質(zhì)量?如果您可以明確回答以上問題,那么,您可以開始下一步的微調(diào)計劃了。要求開始為什么用幾個示例來引導(dǎo)模型提示工程易于制作和快速實驗,門檻非常低簡單、快速部署提示工程、RAG在AzureOpenAI

上輕松使用您的數(shù)據(jù),使用提示流程,LangChain提升模型相關(guān)性RAG從您自己的數(shù)據(jù)集中檢索相關(guān)信息以插入提示最新數(shù)據(jù)信息RAG從您自己的數(shù)據(jù)庫、搜索引擎等查詢最新信息,以插入提示事實基礎(chǔ)RAG引用和檢查檢索到的數(shù)據(jù)的能力優(yōu)化具體任務(wù)微調(diào)微調(diào)經(jīng)常用于引導(dǎo)模型執(zhí)行特定任務(wù),例如以特定的格式、語調(diào)或聲音總結(jié)數(shù)據(jù)指令無法適應(yīng)提示微調(diào)微調(diào)將少樣本示例移入訓(xùn)練步驟,但增加了訓(xùn)練所需的樣本數(shù)量更低的延遲微調(diào)在提供足夠且高質(zhì)量的數(shù)據(jù)的情況下,可以微調(diào)較小、更快的模型以在特定任務(wù)上提供良好的性能,而不是使用類似

GPT4

的通用模型更低的成本適情況而定提示工程和

RAG

的初始成本較低,但長提示更昂貴;微調(diào)訓(xùn)練是昂貴的,但可能會減少提示長度。選擇始終取決于用例和數(shù)據(jù)。復(fù)雜、新穎的數(shù)據(jù)或領(lǐng)域提示工

+RAG+微調(diào)這是一個高風(fēng)險領(lǐng)域。微調(diào)可以重新訓(xùn)練模型以識別新領(lǐng)域,但需要使用

RAG

來避免合理的混淆。確??蛻舨粐L試為未經(jīng)批準(zhǔn)的用途重新訓(xùn)練133.3

Azure

上進(jìn)行微調(diào)使用

Azure

Open

AI

服務(wù)進(jìn)行

Fine-tuning

將為您帶來雙重優(yōu)勢:您可以自定義先進(jìn)的

OpenAI

大語言模型(LLMs),同時部署在

Azure

的安全、企業(yè)級云服務(wù)上。Azure

的內(nèi)容審查功能讓您使用所需的數(shù)據(jù)進(jìn)行

Fine-tuning

時,可以過濾掉任何有合規(guī)風(fēng)險的數(shù)據(jù)及響應(yīng)。如果您是

Azure

OpenAI

服務(wù)和

LLMs

的新用戶,歡迎您使用微軟提供的簡單易用的

API

來訓(xùn)練和部署模型。如果您更愿意使用

GUI,可以嘗試

Azure

OpenAIStudio。如果您正在從

OpenAI

遷移到

Azure,API

可兩者兼容。Fine-tuning

分為兩個部分:訓(xùn)練

Fine-tuning

模型以及使用新定制的模型進(jìn)行推理。訓(xùn)練指定您的基本模型、訓(xùn)練和驗證數(shù)據(jù),并設(shè)置超參數(shù),就可以開始了!您可以使用

Azure

OpenAI

Studio

進(jìn)行簡單的

GUI

操作,或者對于更高級的用戶,我們還提供了

REST

API

OpenAI

PythonSDK。推理訓(xùn)練完成后,新模型將在您的資源中可用。當(dāng)使用您的模型用于推理時,該定制模型可像任何其他

OpenAILLM

一樣進(jìn)行部署!經(jīng)過

Fine-tuning

的模型部署后將按小時收取托管費用,基于輸入和輸出

token

計價。如果您熟悉使用

Azure

Machine

Learning

Studio

來開發(fā)、監(jiān)控和部署模型,您可以將

Fine-tuning

集成至

AML

工作流程中的現(xiàn)有模型。除了

OpenAI

模型,Azure

機器學(xué)習(xí)還支持對開源模型進(jìn)行

Fine-tuning,例如

LLaMa。YouTube

視頻:Alicia

&

Seth

“如何在

Turbo

上進(jìn)行微調(diào)”14路徑四

訓(xùn)練您的自有模型如果您決定訓(xùn)練您的自有模型,Azure

云端大規(guī)模

AI

算力平臺是您最佳的合作伙伴!先進(jìn)

AI,離不開算力基礎(chǔ)設(shè)施、服務(wù)與專業(yè)知識。我們將微軟過去十年的超級計算經(jīng)驗和支持超大型

AI

訓(xùn)練工作負(fù)載的經(jīng)驗應(yīng)用于搭建具備規(guī)?;咝阅艿?/p>

AI

基礎(chǔ)架構(gòu)。您可以在

AzureAIStudio

中使用預(yù)構(gòu)建和可自定義的

AI模型,開發(fā)生成式

AI

解決方案和自定義

copilot?,F(xiàn)在

Azure

AI

模型目錄中添加了新的基礎(chǔ)和生成式

AI

模型。在

Hugging

Face

中,我們引入了一系列不同的穩(wěn)定擴(kuò)散模型、falcon

模型、CLIP、Whisper

V3、BLIP

SAM

模型。此外,我們還添加了

分別來自

Meta

和NVIDIA

Code

Llama

Nemotron

模型,以及微軟研究的尖端

Phi

模型。模型目錄中新增了

40

個新模型和4

種新模式,包括文本到圖像和圖像嵌入模型。借助我們的模型即服務(wù),專業(yè)開發(fā)人員很快就能輕松集成最新的

AI

模型,例如

Meta

Llama

2、Cohere

的Command、G42

Jais

以及

Mistral

的高級模型作為

API

端點到應(yīng)用程序中。他們還可以使用自己的數(shù)據(jù)微調(diào)這些模型,Azure龐大的

GPU基礎(chǔ)設(shè)施能力,將幫助您降低配置

GPU

資源和管理托管的復(fù)雜性。4.1

Azure

為任何規(guī)模的

AI

提供世界一流的算力Azure

領(lǐng)先的

GPU

和網(wǎng)絡(luò)解決方案的獨特架構(gòu)設(shè)計,為計算最密集的

AI

訓(xùn)練和推理工作負(fù)載提供了一流的性能和規(guī)模。這就是世界領(lǐng)先的

AI

公司(包括

OpenAI、Meta

等)選擇

Azure

來推進(jìn)

AI

創(chuàng)新的原因。Azure

目前位列全球

TOP500

超級計算平臺第三名,是唯一的云服務(wù)提供商。Azure

全堆棧大模型訓(xùn)練優(yōu)勢154.2

Azure

AI

Infra

GPU

虛擬機類型Microsoft

Azure

推出基于

NVIDIA

H100

Tensor

Core

GPU

ND

H100

v5

VM,該虛擬機支持的按需配置可達(dá)8

至上千個通過

Quantum-2

In?niBand

網(wǎng)絡(luò)互連的NVIDIAH100GPU,使得

AI

模型的性能明顯提高。在

2023年

11月份發(fā)布的

MLperf

性能基準(zhǔn)報告里,我們將

175B參數(shù)

GPT-3

模型的訓(xùn)練時間從之前的

10.94分鐘降低到

4.0085

分鐘,使用的算力是

1344

臺通過

In?niBand

互聯(lián)的

Azure

H100

虛機,這只比

Nvidia

裸金屬機器慢了

2%。Azure

ND

H100

v5

系列虛擬機自建大模型的算力加持:

Azure

H100

MLperf

性能基準(zhǔn)NVLINK

高速互聯(lián)的八卡

GPU

虛擬機Quantum-2

In?niBand高速擴(kuò)展的多臺

GPU

集群單卡H100

GPUNVIDIAH100TensorCore

GPUNVSwitch+NVLink

4.0Quantum-2

In?niBand16與

Azure

共同設(shè)計超級計算機對于擴(kuò)展我們苛刻的Al

訓(xùn)練需求至關(guān)重要,

使我們在ChatGPT

等系統(tǒng)上的研究和調(diào)試工作成為可能。——Greg

BrockmanOpenAl

總裁兼聯(lián)合創(chuàng)始人我們對于對話式AI

的關(guān)注促使我們開發(fā)和訓(xùn)練一些最復(fù)雜的大型語言模型。Azure

AI基礎(chǔ)結(jié)構(gòu)為我們提供了必要的性能,以便大規(guī)模、可靠地、高效處理這些模型。我們對Azure

的新

VM

及其將為我們的AI

開發(fā)工作帶來的性能提升感到非常興奮。——Mustafa

SuleymanIn?ection

首席執(zhí)行官此外

Microsoft

Azure

AI

Infra

機型還包括:基于

Nvidia

H100

用于中等規(guī)模模型訓(xùn)練以及推理密集型負(fù)載的

H100

虛擬機類型

NC_H100?;?/p>

Nvidia

H100

用于機密型

AI

應(yīng)用的

H100

機型

NCC

H100v5?;?/p>

Nvidia

H200

用于大模型訓(xùn)練和推理的

ND

H200

v5

機型?;贏MD

MI300X

用于支持大模型的高帶寬內(nèi)存

GPU

機型

ND

MI300X

v5

虛擬機。17第三章生成式人工智能落地成功案例參考01

汽車行業(yè)

梅賽德斯-

奔馳梅賽德斯

-

奔馳(奔馳)是世界知名的汽車品牌,致力于為用戶提供更互聯(lián)、更智能、更個性化的駕駛體驗。為了實現(xiàn)這一目標(biāo),奔馳開發(fā)了

MBUX

語音助手“嘿,梅賽德斯”,讓用戶可以通過自然語音命令控制車內(nèi)的各種功能,如導(dǎo)航、娛樂、空調(diào)等。這種語音助手不僅可以提高用戶的便捷性和生產(chǎn)力,還可以增強用戶的安全性和舒適度。企業(yè)需求1 2 3使用

Azure

OpenAI

服務(wù)微軟

Azure

OpenAI

服務(wù)為奔馳提供了一個集成了

GPT

模型的車載語音助手,讓用戶可以通過自然語言與車輛進(jìn)行交互。這個語音助手可以理解用戶的需求和意圖,提供全面和相關(guān)的回答,還可以集成第三方服務(wù),讓用戶可以在駕駛過程中完成更多的任務(wù)。這個方案通過

Azure

的企業(yè)功能和基礎(chǔ)設(shè)施,保證了語音助手的性能和安全性,同時遵循了微軟的負(fù)責(zé)任的人工智能原則。這個方案正在美國進(jìn)行

Beta

測試,預(yù)計將為奔馳用戶帶來更互聯(lián)、更智能、更個性化的駕駛體驗。奔馳希望盡快將

GPT

模型應(yīng)用到

MBUX

語音助手中,以搶占市場先機,但

GPT

模型的部署和集成需要大量的時間和資源。奔馳需要確保

GPT

模型與MBUX語音助手的兼容性和統(tǒng)的協(xié)調(diào)性。奔馳需要保證

GPT

模型的安全性和可靠性,

以及用戶的穩(wěn)定性,以及與其他車內(nèi)系

隱私和數(shù)據(jù)的保護(hù)。18成功亮點奔馳可以在三個月內(nèi)完成

GPT

模型的

Beta

測試,并根據(jù)用戶的反饋進(jìn)行改進(jìn)和優(yōu)化,從而快速推出增強版的

MBUX

語音助手;奔馳可以使用

Azure

OpenAI

服務(wù)的預(yù)留預(yù)配置吞吐量功能,以便大規(guī)模控制

GPT

模型的配置和性能,從而支持更多的用戶和車型;奔馳可以通過

GPT

模型提供更直觀、更具對話感的語音助手,讓用戶可以通過自然語音命令完成更多的任務(wù)和功能,從而提升用戶的滿意度和忠誠度。1902

零售行業(yè)

沃爾瑪沃爾瑪是全球最大的零售商,以低價和多樣化的商品吸引了數(shù)億消費者。沃爾瑪在

2023

財年實現(xiàn)了超過

820億美元的電子商務(wù)銷售額,并持續(xù)擴(kuò)大其活躍數(shù)字客戶群。該公司的目標(biāo)是為顧客提供最佳的數(shù)字購物體驗,讓他們能夠輕松地找到和購買自己想要的產(chǎn)品。企業(yè)需求使用

Azure

OpenAI

服務(wù)沃爾瑪選擇了微軟

Azure

OpenAI

服務(wù),以訪問世界領(lǐng)先的

AI

模型,同時獲得微軟智能云

Azure

企業(yè)級功能(包括安全性、合規(guī)性和區(qū)域可用性)的支持。結(jié)合沃爾瑪專有數(shù)據(jù)和技術(shù)、大型語言模型以及沃爾瑪建立的零售專用模型,沃爾瑪在

iOS、Android

和自有網(wǎng)站上建立了一個全新的生成式

AI

支持的搜索功能。這項新功能專門用于理解顧客查詢的上下文并生成個性化回復(fù)。很快,顧客將利用該功能獲得更具互動性和對話性的體驗,獲取特定問題的答案,并收到個性化的產(chǎn)品建議。借助這種前沿的生成式

AI

技術(shù),用戶可以從“滾動搜索”轉(zhuǎn)變?yōu)椤澳繕?biāo)搜索”,從而使數(shù)字購物體驗更加流暢和直觀。成功亮點傳統(tǒng)搜索功能無法滿足高度個性化的需求。沃爾瑪致力于提供更個性化的商品推薦和更直觀的購物體驗。1 2生成式

AI

技術(shù)改進(jìn)搜索功能,提供更個性化和直觀的購物體驗;5

萬名非門店員工通過“我的助手”應(yīng)用顯著提升工作效率;沃爾瑪與微軟戰(zhàn)略合作加速了數(shù)字化轉(zhuǎn)型,帶來業(yè)務(wù)創(chuàng)新。沃爾瑪希望通過引入生成式

AI

技術(shù),幫助員工完成各種任務(wù),包括文件總結(jié)和內(nèi)容創(chuàng)建。2004

游戲行業(yè)

完美世界完美世界游戲是中國最早自主研發(fā)

3D

游戲引擎的游戲企業(yè)。作為全球化的游戲開發(fā)商、發(fā)行商、運營商,并在端游、手游、主機游戲、VR

游戲以及云游戲等多個領(lǐng)域進(jìn)行布局,旗下產(chǎn)品出口

100

多個國家和地區(qū),其出品的《誅仙》《天龍八部》《幻塔》等游戲,搭載中國文化,為全球玩家?guī)砹藘?yōu)質(zhì)的游戲體驗。為了在MMO

游戲研發(fā)中實現(xiàn)效能突破,完美世界游戲于

2022

年開始基于

Azure

OpenAI

及其他

Azure

AI

服務(wù)探索GenAI

時代的游戲創(chuàng)新。企業(yè)需求1 2 3提升產(chǎn)品品質(zhì),打造精品游戲。大模型技術(shù)在圖像與文本生產(chǎn)領(lǐng)域的廣泛應(yīng)用為游戲行業(yè)帶來了新的機遇,然而生成式

AI的調(diào)試精度難以滿足游戲文本與美術(shù)資產(chǎn)的創(chuàng)作。升級游戲玩家的

AI

交互體驗。AI

對話缺少與生成文本對應(yīng)的聲畫表現(xiàn),難以直接用在

MMO

項目中,玩家的游戲體驗需要進(jìn)一步升級。革新技術(shù)中臺對工作室的賦能。完美世界游戲內(nèi)部早已成立AI

中心,

但如何將GenAI

的技術(shù)能力落地為各個工作室開箱即用的實用功能也是一項巨大挑戰(zhàn)。使用

Azure

OpenAI

服務(wù)完美世界游戲在生產(chǎn)管線、核心業(yè)務(wù)和開發(fā)工具上實現(xiàn)了全面優(yōu)化。策劃團(tuán)隊引入

GPT

3.5

和GPT-4

AzureOpenAI

模型,為

AI

文本創(chuàng)意、劇情拓展和定制世界觀環(huán)節(jié)提供支持;結(jié)合

GPT

4-8K

模型和

GPT

3.5微調(diào)模型以及基于

Azure

TTS

文本轉(zhuǎn)語音服務(wù),自研自動生成游戲過場動畫的工具

D+,生成角色情緒、動作、分鏡、文本、表情、口型、語音等;在美術(shù)環(huán)節(jié),基于

GPT4

+

DALL-E3

模型和微軟

3D

優(yōu)化工具

Simplygon

實現(xiàn)智能化建模、生成分鏡預(yù)覽;此外,完美世界將

Azure

OpenAI

模型強大的歸納、理解及總結(jié)能力應(yīng)用在量化運營場景與安全維護(hù)場景;并基于

Azure

OpenAI

服務(wù)的

GPT-4、Codex

模型和

GitHub

Copilot

工具,實現(xiàn)了智能代碼生成和智能測試。成功亮點完全基于微軟

Azure

OpenAI

服務(wù)及

GPT-4

模型能力,上線

AI

原生劇本殺游戲。AI

技術(shù)在完美世界游戲在研

MMO

項目組中達(dá)到了全流程應(yīng)用,產(chǎn)品開發(fā)效率提升35%,美術(shù)產(chǎn)出效率提升

23%;目前生產(chǎn)管線優(yōu)化已經(jīng)完成了大于

38%

AI

化,核心業(yè)務(wù)優(yōu)化的

AI

滲透率占比超過60%,技術(shù)中心提供給各個工作室的技術(shù)開

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論