Go語言中的數(shù)據(jù)競爭模式詳解

上傳人：搞*** IP屬地：四川上傳時間：2025-05-12 格式：DOCX 頁數(shù)：11 大?。?3.58KB 積分：15 舉報 版權(quán)申訴

已閱讀5頁，還剩6頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第Go語言中的數(shù)據(jù)競爭模式詳解目錄前言Go在goroutine中通過引用來透明地捕獲自由變量切片會產(chǎn)生難以診斷的數(shù)據(jù)競爭并發(fā)訪問Go內(nèi)置的、不安全的線程映射會導(dǎo)致頻繁的數(shù)據(jù)競爭Go開發(fā)人員常在pass-by-value時犯錯并導(dǎo)致non-trivial的數(shù)據(jù)競爭消息傳遞（通道）和共享內(nèi)存的混合使用使代碼變得復(fù)雜且易受數(shù)據(jù)競爭的影響Add和Done方法的錯誤放置會導(dǎo)致數(shù)據(jù)競爭并發(fā)運(yùn)行測試會導(dǎo)致產(chǎn)品或測試代碼中的數(shù)據(jù)競爭小結(jié)

前言

本文主要基于在Uber的Gomonorepo中發(fā)現(xiàn)的各種數(shù)據(jù)競爭模式，分析了其背后的原因與分類，希望能夠幫助更多的Go開發(fā)人員，去關(guān)注并發(fā)代碼的編寫，考慮不同的語言的特性、以及避免由于自身編程習(xí)慣所引發(fā)的并發(fā)錯誤。

近年來，Uber已經(jīng)開始采用Golang（簡稱Go）作為開發(fā)微服務(wù)的主要編程語言。目前，其Gomonorepo（譯者注：包含多個不同項(xiàng)目的單個倉庫）包含了大約5,000萬行代碼，以及大約2,100個獨(dú)特的Go服務(wù)。而且，它們都還在持續(xù)增長中。

為了實(shí)現(xiàn)并發(fā)，我們通常會使用go關(guān)鍵字，為函數(shù)調(diào)用添加前綴，以實(shí)現(xiàn)異步式的運(yùn)行調(diào)用。在Go中，此類異步函數(shù)調(diào)用被稱為goroutine。開發(fā)人員可以通過創(chuàng)建goroutine（例如，對其他服務(wù)的IO或RPC調(diào)用），來隱藏延遲。不同的goroutine可以通過消息傳遞，以及共享內(nèi)存的方式，來傳遞數(shù)據(jù)。其中，共享內(nèi)存恰好是Go中最常用的數(shù)據(jù)通信方式之一。

由于goroutineGo很容易被程序員創(chuàng)建和使用，因此它被認(rèn)為屬于輕量級。同時，由Go編寫的程序通常會比由其他語言編寫的程序具有更強(qiáng)的并發(fā)性。例如，通過掃描數(shù)十萬個運(yùn)行在數(shù)據(jù)中心的微服務(wù)實(shí)例，我們發(fā)現(xiàn)Go微服務(wù)的并發(fā)性可達(dá)Java微服務(wù)的8倍。

當(dāng)然，更高的并發(fā)性也意味著更多潛在的并發(fā)錯誤。我們常用數(shù)據(jù)競爭（datarace）來描述當(dāng)兩個或多個goroutine訪問相同的數(shù)據(jù)，而且至少有一個處于寫入狀態(tài)時，由于它們之間并沒有排序，因此就會發(fā)生并發(fā)錯誤。總的來說，根據(jù)Go自身的相互作用等特點(diǎn)，數(shù)據(jù)競爭之類的隱蔽錯誤非常容易出現(xiàn)，因此我們應(yīng)該盡量避免。

最近，我們使用動態(tài)數(shù)據(jù)競爭檢測技術(shù)開發(fā)了一個系統(tǒng)，專門用來檢測Uber的數(shù)據(jù)競爭。它在上線的六個月時間內(nèi)，在我們的Go代碼庫中，檢測到了大約2,000個數(shù)據(jù)競爭。其中已被開發(fā)人員著手修復(fù)了的數(shù)據(jù)競爭約有1,100個。下面，我將向您展示我們已發(fā)現(xiàn)的各種常見數(shù)據(jù)競爭模式。

Go在goroutine中通過引用來透明地捕獲自由變量

Go中的嵌套函數(shù)（又名closure）通過引用的方式，透明地捕獲所有自由的變量。程序員通常無需明確指定在closure語法中，需要捕獲哪些自由變量。

這種方式是有別于Java和C++的。Java的lambda僅會根據(jù)數(shù)值去捕獲，而且他們會有意識地避免并發(fā)缺陷。而C++則要求開發(fā)人員明確地指明是使用數(shù)值、還是引用的捕獲方式。

當(dāng)closure較大時，開發(fā)人員并不知道closure內(nèi)使用的變量是否自由，可否通過引用來捕獲。而由于引用的捕獲、以及goroutine都是并發(fā)的，因此Go程序最終可能會因?yàn)闆]能顯式地執(zhí)行同步，而對自由變量進(jìn)行無序的訪問。我們可以通過如下三個示例來證明這一點(diǎn)：

示例1：由循環(huán)索引的變量捕獲，而導(dǎo)致數(shù)據(jù)競爭

圖1A中的代碼顯示了迭代Go的切片作業(yè)，并通過ProcessJob函數(shù)來處理每個元素的作業(yè)。

圖1A：由循環(huán)索引的變量捕獲，而導(dǎo)致數(shù)據(jù)競爭。

在此，開發(fā)人員會將厚重的ProcessJob包裝在一個匿名的goroutine中。但是，循環(huán)索引變量的作業(yè)是通過goroutine內(nèi)部被引用捕獲的。當(dāng)goroutine為首次循環(huán)迭代而啟動，并訪問作業(yè)的變量時，父goroutine中的for循環(huán)將在切片中更新相同的循環(huán)索引變量作業(yè)，并指向切片中的第二個元素，這就會導(dǎo)致數(shù)據(jù)競爭的出現(xiàn)。此類數(shù)據(jù)競爭可能發(fā)生在數(shù)值和引用類型上；切片、數(shù)組和映射上；以及循環(huán)體中的讀和寫的訪問中。為此，Go推薦了一種編碼習(xí)慣，來隱藏和私有化循環(huán)體中循環(huán)索引的變量。不過，開發(fā)人員并不總是能夠遵循這一點(diǎn)。

示例2：由err變量的捕獲，所導(dǎo)致的數(shù)據(jù)競爭

圖1B：由err變量的捕獲，所導(dǎo)致的數(shù)據(jù)競爭。

Go一直提倡函數(shù)有多個返回值。圖1B展示了一種常見的通過返回實(shí)際值和錯誤對象，來指示是否存在錯誤的用法?？梢姡?dāng)且僅當(dāng)錯誤值為nil（空）時，實(shí)際的返回值才會被認(rèn)為是有意義的。因此，我們的通常做法是：將返回的錯誤對象，分配給名為err的變量，然后檢查其是否為空（nilness）。不過，由于我們可以在函數(shù)體內(nèi)調(diào)用多個返回錯誤的函數(shù)，因此程序每次都會對err變量進(jìn)行多次賦值，然后進(jìn)行是否為空的檢查。當(dāng)開發(fā)人員將這個習(xí)慣用法與goroutine混合使用時，錯誤變量就會在closure中被引用捕獲。結(jié)果，程序?qū)τ趃oroutine中err的讀寫訪問，與隨后對封閉函數(shù)（或goroutine的多個實(shí)例）中相同的err變量的讀寫操作，就會同時運(yùn)行。這便導(dǎo)致了數(shù)據(jù)競爭。

示例3：由已命名的返回變量捕獲，所導(dǎo)致的數(shù)據(jù)競爭

圖1C：由已命名的返回變量捕獲，所導(dǎo)致的數(shù)據(jù)競爭。

Go引入了一種被稱為已命名返回值的語法塊。已命名的返回變量被視為在函數(shù)頂部定義的變量，其作用域超出了函數(shù)體。而沒有參數(shù)的return語句，被稱為裸命名返回值。由于closure的存在，如果將正常（非裸）的返回與已命名的返回相混合、或在具有命名返回的函數(shù)中使用延遲返回，那么就可能會引發(fā)數(shù)據(jù)競爭。

在上圖1C中的NamedReturnCallee函數(shù)返回了一個整數(shù)，而且返回變量被命名為result。根據(jù)該語法，函數(shù)體的其余部分可以對結(jié)果進(jìn)行直接讀寫，而無需額外聲明。如果函數(shù)在第4行返回的是一個裸返回，而由于在第2行被賦值為result=10，那么第13行的調(diào)用者將看到其返回值為10。編譯器則會安排將結(jié)果復(fù)制到retVal。同時，已命名的返回函數(shù)也可以使用如第9行所示的標(biāo)準(zhǔn)返回語法。該語法會讓編譯器復(fù)制return語句中的返回值20，以分配給已命名的返回變量結(jié)果。第6行創(chuàng)建了一個goroutine，它會捕獲已命名的返回變量的結(jié)果。在設(shè)置該goroutine時，即使是并發(fā)專家也可能認(rèn)為讀取第7行的結(jié)果中是安全的，畢竟不存在對同一變量的寫入，而且第9行的語句返回的20是一個常量，它似乎并沒有觸及到已命名的返回變量結(jié)果。不過，如前所述，代碼在生成的過程中，會將return20的語句轉(zhuǎn)換為寫入結(jié)果。此時，一旦我們突然對共享的結(jié)果變量進(jìn)行并發(fā)讀寫，就會產(chǎn)生數(shù)據(jù)競爭的情況。

切片會產(chǎn)生難以診斷的數(shù)據(jù)競爭

切片（Slices）實(shí)際上是一些動態(tài)數(shù)組和引用類型。在其內(nèi)部，切片包含了一個指向底層數(shù)組的指針、它的當(dāng)前長度、以及底層數(shù)組可以擴(kuò)展的最大容量。為了便于討論，我們將這些變量統(tǒng)稱為切片的元字段（metafield）。切片上的一種常見操作便是通過追加操作（appendoperation）來使其增長。當(dāng)達(dá)到其容量限制時，代碼會進(jìn)行新的分配（例如，對當(dāng)前的容量翻倍），并更新其對應(yīng)的元字段。而當(dāng)一個切片被goroutine并發(fā)訪問時，Go會通過互斥鎖（mutex），來保護(hù)對它的訪問。

圖2：即使使用鎖，切片仍會出現(xiàn)數(shù)據(jù)競爭。

在圖2中，開發(fā)人員往往以為已經(jīng)對第6行的切片進(jìn)行了鎖定保護(hù)，便可防止數(shù)據(jù)競爭的出現(xiàn)。而實(shí)際上，當(dāng)?shù)?4行將切片作為參數(shù)傳遞給沒有鎖保護(hù)的goroutine時，就會產(chǎn)生數(shù)據(jù)競爭。具體而言，goroutine的調(diào)用導(dǎo)致了切片中的元字段從調(diào)用處（第14行）被復(fù)制到被調(diào)用者（第11行）處?？紤]到切片屬于引用類型，我們認(rèn)為在將其傳遞（復(fù)制）到被調(diào)用者時，會導(dǎo)致數(shù)據(jù)競爭的發(fā)生。不過，由于切片與指針類型不同，畢竟元字段是按照數(shù)值復(fù)制的，因此該數(shù)據(jù)競爭的發(fā)生概率非常低。

并發(fā)訪問Go內(nèi)置的、不安全的線程映射會導(dǎo)致頻繁的數(shù)據(jù)競爭

哈希表(或稱映射)是Go中的內(nèi)置語言功能。不過，它對于線程是不安全的。如果多個goroutine同時訪問同一張哈希表，而且其中至少有一個試圖去修改哈希表（插入或刪除某項(xiàng)）的話，就會產(chǎn)生數(shù)據(jù)競爭。開發(fā)人員往往認(rèn)為他們可以同時訪問哈希表中的不同項(xiàng)。而實(shí)際上，與數(shù)組或切片不同，映射（哈希表）是一種稀疏的數(shù)據(jù)結(jié)構(gòu)，訪問某一個元素就可能會導(dǎo)致訪問另一個元素，如果在同一過程中發(fā)生了另一種插入或刪除，那么它將會因?yàn)樾薷牧讼∈璧臄?shù)據(jù)結(jié)構(gòu)，而導(dǎo)致了數(shù)據(jù)競爭。

我們甚至觀察到了更為復(fù)雜的、由并發(fā)映射訪問產(chǎn)生的數(shù)據(jù)競爭。其原因是同一個哈希表被傳遞到了深度調(diào)用路徑，而開發(fā)人員忘記了這些調(diào)用路徑是通過異步goroutine去改變哈希表的事實(shí)。圖3便顯示了此類數(shù)據(jù)競爭的示例。

圖3：由于并發(fā)映射訪問導(dǎo)致的數(shù)據(jù)競爭。

雖然導(dǎo)致數(shù)據(jù)競爭的哈希表并非Go獨(dú)有，但是以下原因會讓Go更容易發(fā)生數(shù)據(jù)競爭：

由于映射是一種內(nèi)置的語言結(jié)構(gòu)，因此Go開發(fā)人員會比其他語言的開發(fā)者更頻繁地使用映射。例如，在我們的Java存儲庫中，每MLoC（MillionsofLinesOfCode，數(shù)百萬行代碼）里有4,389個映射結(jié)構(gòu)；而在Go中，每MLoC里就有5,950個映射，足足高出了1.34倍。不同于Java的get和putAPI，哈希表的訪問語法類似數(shù)組訪問語法，雖然易于使用，但是也會意外地與隨機(jī)訪問數(shù)據(jù)結(jié)構(gòu)相混淆。在Go中，我們可以使用table[key]的語法，輕松查詢那些不存在（non-existing）的映射元素。該語法能夠簡單地返回默認(rèn)值，而不會產(chǎn)生任何錯誤。這種容錯性對于開發(fā)者在使用Go的映射時是非常友好的。

Go開發(fā)人員常在pass-by-value時犯錯并導(dǎo)致non-trivial的數(shù)據(jù)競爭

Go建議使用pass-by-value的語義，以簡化逃逸分析，并為變量提供更好的棧上分配的機(jī)會，進(jìn)而減少垃圾收集器的壓力。

與所有對象皆為引用類型的Java不同，在Go中，對象可以是數(shù)值類型（如：結(jié)構(gòu)），也可以是引用類型（如：接口）。由于沒有了語法差異，這會導(dǎo)致諸如：sync.Mutex和sync.RWMutex等數(shù)值類型，在同步構(gòu)造中被錯誤地使用。如果一個函數(shù)創(chuàng)建了一個互斥體結(jié)構(gòu)，并通過數(shù)值傳遞（pass-by-value）給多個goroutine調(diào)用，那么這些goroutine在并發(fā)執(zhí)行時，不同的互斥對象是不會在操作過程中共享內(nèi)部狀態(tài)的。這也就破壞了對于受保護(hù)的共享內(nèi)存區(qū)域的互斥訪問特性。請參見如下圖4所示的代碼。

圖4A：

由by-reference或by-pointer的方法調(diào)用所引起的數(shù)據(jù)競爭

圖4B：sync.Mutex的Lock/Unlock簽名。

由于Go語法在指針和數(shù)值上調(diào)用方法是相同的，因此開發(fā)人員往往會忽視m.Lock()正在處理互斥鎖的副本并非指針這一問題。調(diào)用者仍然可以在互斥的數(shù)值上調(diào)用這些API。而且編譯器也會透明地安排傳遞數(shù)值的地址。相反，如果沒有此類透明度，該錯誤就能夠會被檢測到，并認(rèn)定為編譯器類型不匹配的錯誤。

據(jù)此，當(dāng)開發(fā)人員意外地實(shí)現(xiàn)了一個方法，其中的接收者是指向結(jié)構(gòu)的指針，而不是結(jié)構(gòu)的數(shù)值或副本時，那么就會發(fā)生與此相反的情況。也就是說，調(diào)用該方法的多個goroutine，最終會意外地共享結(jié)構(gòu)相同的內(nèi)部狀態(tài)。而且，調(diào)用者也不會意識到數(shù)值類型在接收者處被透明地轉(zhuǎn)換為了指針類型。顯然，這都是開發(fā)人員所不愿發(fā)生的。

消息傳遞（通道）和共享內(nèi)存的混合使用使代碼變得復(fù)雜且易受數(shù)據(jù)競爭的影響

圖5：將消息傳遞與共享內(nèi)存混合時的數(shù)據(jù)競爭。

圖5展示了開發(fā)人員使用一個專門為信號和等待準(zhǔn)備的通道，通過Future來實(shí)現(xiàn)的示例。我們可以通過調(diào)用Start()方法來啟動Future，并通過調(diào)用Future的Wait()方法，來阻止Future的完成。Start()方法會創(chuàng)建一個goroutine，以執(zhí)行一個注冊到Future的函數(shù)，并記錄其返回值（如：response和err）。如第6行所示，goroutine通過在通道ch上發(fā)送一條消息，以向Wait()方法發(fā)出Future完成的信號。對稱地，如第11行所示，Wait()方法塊會從通道中獲取相應(yīng)的消息。

在Go中，上下文攜帶了跨越API邊界和進(jìn)程之間的截止日期、取消信號和其他請求范圍的數(shù)值。這是在微服務(wù)中為任務(wù)設(shè)置時間線的常見模式。由此，Wait()阻止了被取消（第13行）的上下文、或已完成的Future（第11行）。此外，Wait()被包裝在一個select語句（第10行）中，并處于阻止?fàn)顟B(tài)，直到至少有一個選擇arm準(zhǔn)備就緒。

如果上下文超時，則相應(yīng)的案例將Future的err字段，在第14行上記錄為ErrCancelled。此時，對于err的寫入與第5行對Future的相同變量的寫入操作，便形成了競爭。

Add和Done方法的錯誤放置會導(dǎo)致數(shù)據(jù)競爭

sync.WaitGroup結(jié)構(gòu)是Go的組同步結(jié)構(gòu)。與C++的barrier的barrier、以及l(fā)atch的構(gòu)造不同，WaitGroup中參與者的數(shù)量不是在構(gòu)造時被確定的，而是動態(tài)更新的。在WaitGroup對象上，Go允許進(jìn)行Add(int)、Done()和Wait()三種操作。其中，Add()會增加參與者的計數(shù)，而Wait()會處于阻止?fàn)顟B(tài)，直到Done()被調(diào)用為count的次數(shù)（通常每個參與者一次）。由于在Go中，組同步的使用程度比Java高出1.9倍，因此WaitGroup在Go中常被廣泛地使用。

在下圖6中，開發(fā)人員打算創(chuàng)建與切片itemId里的元素數(shù)量相同的goroutine，且并發(fā)處理它們。每個goroutine在不同索引的結(jié)果切片、以及在第12行對父功能塊中，記錄其成功或失敗的狀態(tài)，直到所有的goroutine已完成。接著，它會依次訪問結(jié)果中的所有元素，以計算出被成功處理的數(shù)量。

圖6A：

由于WaitGroup.Add()的錯誤放置，導(dǎo)致了數(shù)據(jù)競爭

為了使該代碼能夠正常工作，我們需要在第12行調(diào)用Wait()時，保證wg.Add(1)在調(diào)用wg.Wait()之前所執(zhí)行的次數(shù)，也就是注冊參與者的數(shù)量，必須等于itemIds的長度。這就意味著wg.Add(1)應(yīng)該在每個goroutine之前被放置在第5行調(diào)用。但是，如果開發(fā)人員在第7行錯誤地將wg.Add(1)放置在了goroutine的主體中，它就無法保證在外部函數(shù)WaitGrpExample調(diào)用Wait()時，完整地執(zhí)行。據(jù)此，在調(diào)用Wait()時，被注冊到WaitGroup的itemId的長度就可能會變短。正是出于該原因，Wait()會被提前解除阻止。據(jù)此，WaitGrpExample函數(shù)則可以從切片結(jié)果中開始讀取（即：第13行），而一些goroutine則開始并發(fā)寫入同一個切片。

此外，我們還發(fā)現(xiàn)過早地在Waitgroup上調(diào)用wg.Done()，也會導(dǎo)致數(shù)據(jù)競爭。下圖6B展示了wg.Done()與Go的defer語句交互的結(jié)果。當(dāng)遇到多個defer語句時，代碼會按照后進(jìn)先出的順序去執(zhí)行。其中，第9行的wg.Wait()會在doCleanup()運(yùn)行之前完成。即，父goroutine會在第10行去訪問locationErr，而子goroutine可能仍然在延遲的doCleanup()函數(shù)內(nèi)寫入locationErr（為簡潔起見，在此并未顯示）。

人人文庫> 全部分類> 辦公材料 > 辦公文檔

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

Go語言中的數(shù)據(jù)競爭模式詳解

文檔簡介

溫馨提示

最新文檔

評論

Go語言中的數(shù)據(jù)競爭模式詳解

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔