海天瑞聲-國內(nèi)AI訓(xùn)練數(shù)據(jù)龍頭提供商自動(dòng)駕駛業(yè)務(wù)打開成長空間_第1頁
海天瑞聲-國內(nèi)AI訓(xùn)練數(shù)據(jù)龍頭提供商自動(dòng)駕駛業(yè)務(wù)打開成長空間_第2頁
海天瑞聲-國內(nèi)AI訓(xùn)練數(shù)據(jù)龍頭提供商自動(dòng)駕駛業(yè)務(wù)打開成長空間_第3頁
海天瑞聲-國內(nèi)AI訓(xùn)練數(shù)據(jù)龍頭提供商自動(dòng)駕駛業(yè)務(wù)打開成長空間_第4頁
海天瑞聲-國內(nèi)AI訓(xùn)練數(shù)據(jù)龍頭提供商自動(dòng)駕駛業(yè)務(wù)打開成長空間_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

海天瑞聲:國內(nèi)AI訓(xùn)練數(shù)據(jù)龍頭提供商,自動(dòng)駕駛業(yè)務(wù)打開成長空間1、AI進(jìn)入數(shù)據(jù)智能時(shí)代,質(zhì)量+規(guī)模拉動(dòng)數(shù)據(jù)標(biāo)注需求快速成長1.1、人工智能發(fā)展,算法+算力+數(shù)據(jù)三輪驅(qū)動(dòng)移動(dòng)互聯(lián)網(wǎng)時(shí)代的到來為AI發(fā)展提供數(shù)據(jù)資源,結(jié)合算力和模型持續(xù)迭代,AI呈現(xiàn)爆發(fā)式成長。數(shù)據(jù)爆炸、算力提升和新算法出現(xiàn)引導(dǎo)了AI近十年來的發(fā)展浪潮。AI研究領(lǐng)域逐步擴(kuò)大到專家系統(tǒng)、機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺、自然語言處理等,并與金融、政府、教育等行業(yè)結(jié)合愈發(fā)緊密。AI迭代帶動(dòng)商業(yè)化進(jìn)程加速,應(yīng)用場(chǎng)景日漸豐富,行業(yè)空間有望打開。德勤數(shù)據(jù)顯示,2021年中國人工智能市場(chǎng)規(guī)模達(dá)2058億元,預(yù)計(jì)到2025年將達(dá)到5460億元,2021-2025年復(fù)合增長率約27.63%。隨著AI從感知智能逐步走向認(rèn)知智能,未來有望有效賦能人的效率提升,創(chuàng)造更大的商業(yè)價(jià)值。AI進(jìn)入“大模型+小模型”時(shí)代,大規(guī)模參數(shù)設(shè)置與輸入為AI解決復(fù)雜推理問題提供可行方案,為人工智能發(fā)展創(chuàng)造空間。大模型通過超大規(guī)模的參數(shù)設(shè)置和數(shù)據(jù)輸入,具有基礎(chǔ)、通用和綜合的特點(diǎn),而小模型基于實(shí)際任務(wù)場(chǎng)景的需求,通過高質(zhì)量場(chǎng)景數(shù)據(jù)的輸入和訓(xùn)練,使AI能夠出色完成特定任務(wù)。在NLP領(lǐng)域,以Google發(fā)布的BERT模型和OpenAI提出的GPT模型為典型代表。AI通過大模型的預(yù)訓(xùn)練,能夠在處理語言、推理、人機(jī)交互等領(lǐng)域任務(wù)上的表現(xiàn)實(shí)現(xiàn)極大提升,打開了AI滲透到各行業(yè)進(jìn)行商業(yè)應(yīng)用路徑。國內(nèi)外大廠相繼發(fā)布AI大模型,巨頭發(fā)力布局人工智能有望主導(dǎo)行業(yè)發(fā)展與市場(chǎng)格局。2018年以來,以Google、Meta、微軟、阿里巴巴為代表的國內(nèi)外科技巨頭相繼發(fā)布自研AI大模型,為人工智能的商用奠定良好基礎(chǔ),未來各細(xì)分賽道公司有望從AI生態(tài)擁抱產(chǎn)業(yè)變革。我國算力規(guī)模持續(xù)擴(kuò)大,保證AI大模型訓(xùn)練算力需求?!笆濉逼陂g我國算力規(guī)模保持高速增長態(tài)勢(shì),單臺(tái)算力設(shè)備的性能也不斷提升。前瞻產(chǎn)業(yè)研究院數(shù)據(jù)顯示,截至2021年底我國算力總規(guī)模達(dá)到140EFlops(每秒140京次浮點(diǎn)運(yùn)算次數(shù)),占全球總算力約31%。截至2022H1,我國算力總規(guī)模超過150EFlops,僅次于美國。AI模型訓(xùn)練需要大量高質(zhì)量數(shù)據(jù)作支撐。在語音交互、智能駕駛等領(lǐng)域,國內(nèi)外廠商除了自有的AI數(shù)據(jù)團(tuán)隊(duì)對(duì)公司業(yè)務(wù)中產(chǎn)生的數(shù)據(jù)進(jìn)行采集和標(biāo)注,還需要購買大量外部數(shù)據(jù)作為AI模型訓(xùn)練的養(yǎng)料。根據(jù)Cognilytica數(shù)據(jù)統(tǒng)計(jì)顯示,2021年全球AI訓(xùn)練數(shù)據(jù)市場(chǎng)需求約為42億美元,并預(yù)計(jì)到2027年這一需求將增長到220億美元,2021-2027年復(fù)合增長率達(dá)32%。1.2、AI進(jìn)入商業(yè)化時(shí)代,與行業(yè)和場(chǎng)景的緊密結(jié)合催化高質(zhì)量訓(xùn)練數(shù)據(jù)需求近年來,隨著新技術(shù)模型出現(xiàn)、各行業(yè)應(yīng)用場(chǎng)景價(jià)值打磨與海量數(shù)據(jù)積累下的產(chǎn)品效果提升,人工智能應(yīng)用已從消費(fèi)、互聯(lián)網(wǎng)等泛C端領(lǐng)域,向制造、能源、電力等傳統(tǒng)行業(yè)輻射。各行業(yè)企業(yè)在設(shè)計(jì)、采購、生產(chǎn)、管理、營銷等經(jīng)濟(jì)生產(chǎn)活動(dòng)主要環(huán)節(jié)的人工智能技術(shù)與應(yīng)用成熟度在不斷提升,加速人工智能在各環(huán)節(jié)的落地覆蓋,逐漸將其與主營業(yè)務(wù)相結(jié)合,以實(shí)現(xiàn)產(chǎn)業(yè)地位提高或經(jīng)營效益優(yōu)化,進(jìn)一步擴(kuò)大自身優(yōu)勢(shì)。AI技術(shù)創(chuàng)新應(yīng)用的大規(guī)模落地,帶動(dòng)了大數(shù)據(jù)智能市場(chǎng)的蓬勃發(fā)展,同樣也為底層的數(shù)據(jù)治理服務(wù)注入了市場(chǎng)活力。信息化和數(shù)字化基礎(chǔ)較好的行業(yè)及環(huán)節(jié)將率先擁抱AI商業(yè)化進(jìn)程。根據(jù)艾瑞咨詢數(shù)據(jù)顯示,目前人工智能技術(shù)已滲透進(jìn)各行業(yè)的經(jīng)濟(jì)生產(chǎn)活動(dòng)主要環(huán)節(jié)中,并在政府、金融、互聯(lián)網(wǎng)等領(lǐng)域的質(zhì)控、窗口服務(wù)、遠(yuǎn)程辦公等環(huán)節(jié)進(jìn)入規(guī)?;涞仉A段。未來隨著各垂直行業(yè)數(shù)字化信息化的持續(xù)推進(jìn),人工智能技術(shù)作為效率提升的重要手段將會(huì)加速滲透到各個(gè)環(huán)節(jié)中,作為底層模型支撐的訓(xùn)練數(shù)據(jù)需求將加速成長。人工智能模型和算法的發(fā)展帶動(dòng)數(shù)據(jù)標(biāo)注的需求不斷成長。實(shí)際業(yè)務(wù)場(chǎng)景中大量的數(shù)據(jù)只有在經(jīng)過處理之后才能被用于部署、訓(xùn)練以及調(diào)試對(duì)應(yīng)的機(jī)器學(xué)習(xí)或深度學(xué)習(xí)模型,這便是數(shù)據(jù)標(biāo)注的價(jià)值所在,根據(jù)AI分析公司Cognilytica研究數(shù)據(jù)顯示,在AI項(xiàng)目中,對(duì)數(shù)據(jù)相關(guān)的處理過程可占據(jù)超過80%的時(shí)間,其中數(shù)據(jù)標(biāo)注環(huán)節(jié)的耗時(shí)占比可達(dá)25%。1.3、數(shù)據(jù)標(biāo)注行業(yè)發(fā)展迅速,智能化+數(shù)據(jù)安全將決定公司競(jìng)爭(zhēng)力AI行業(yè)應(yīng)用場(chǎng)景延伸及模型迭代,帶來增量數(shù)據(jù)需求,AI基礎(chǔ)數(shù)據(jù)市場(chǎng)規(guī)模有望加速成長?!吨袊鴶?shù)據(jù)標(biāo)注行業(yè)發(fā)展趨勢(shì)與投資前景研究報(bào)告(2022-2029年)》數(shù)據(jù)顯示,2021年我國數(shù)據(jù)標(biāo)注行業(yè)市場(chǎng)規(guī)模達(dá)到43.3億元,同比增長約19.2%,預(yù)計(jì)到2029年市場(chǎng)規(guī)模將達(dá)到204.3億元,CAGR約為21.4%。AI訓(xùn)練數(shù)據(jù)標(biāo)注需求以語音和計(jì)算機(jī)視覺為主,對(duì)數(shù)據(jù)質(zhì)量的要求提升拉動(dòng)產(chǎn)品服務(wù)價(jià)格不斷升高。觀研天下數(shù)據(jù)統(tǒng)計(jì)顯示,2021我國人工智能數(shù)據(jù)標(biāo)注市場(chǎng)中,計(jì)算機(jī)視覺類、智能語音類和NLP類需求占比分別為45.3%、40.5%和14.2%,未來隨著自動(dòng)駕駛向L3及以上級(jí)別迭代,傳感器數(shù)量的增加將帶動(dòng)數(shù)據(jù)需求量的增加,而深度人機(jī)交互的發(fā)展

(虛擬人、機(jī)器人)也將拉動(dòng)語音和自然語言類數(shù)據(jù)的需求量。市場(chǎng)需求驅(qū)動(dòng)AI訓(xùn)練數(shù)據(jù)質(zhì)量的提升,數(shù)據(jù)價(jià)格有望持續(xù)升高。根據(jù)觀研天下數(shù)據(jù)中心采用的相對(duì)價(jià)格指數(shù)表示各類數(shù)據(jù)標(biāo)注產(chǎn)品和服務(wù)的價(jià)格水平,并以2021年價(jià)格為基準(zhǔn)(100),可以發(fā)現(xiàn)近年來數(shù)據(jù)標(biāo)注價(jià)格逐年上升,從2017年的96.4提高到2021年的100,并預(yù)計(jì)在未來幾年持續(xù)升高,預(yù)計(jì)到2029年達(dá)到112.3。國內(nèi)數(shù)據(jù)標(biāo)注行業(yè)仍以定制化服務(wù)為主,標(biāo)準(zhǔn)化產(chǎn)品占比較低。根據(jù)智研咨詢統(tǒng)計(jì)數(shù)據(jù)顯示,2021年我國數(shù)據(jù)標(biāo)注及審核市場(chǎng)中定制化服務(wù)的占比達(dá)到85.41%,而標(biāo)準(zhǔn)化的數(shù)據(jù)集產(chǎn)品僅占13.33%。我們認(rèn)為隨著行業(yè)的發(fā)展和AI商業(yè)化應(yīng)用的加速,賽道內(nèi)的企業(yè)能否形成智能化標(biāo)注的平臺(tái)能力及標(biāo)準(zhǔn)化的數(shù)據(jù)產(chǎn)品,將有助于提升盈利能力及行業(yè)核心競(jìng)爭(zhēng)力。數(shù)據(jù)安全合規(guī)要求提高,數(shù)據(jù)標(biāo)注行業(yè)門檻提升。以智能汽車行業(yè)為例,近幾年我國汽車數(shù)據(jù)處理能力增強(qiáng)和數(shù)據(jù)規(guī)模成長,汽車數(shù)據(jù)安全問題和風(fēng)險(xiǎn)隱患也日益突出。今年八月底,自然資源部發(fā)布《關(guān)于促進(jìn)智能網(wǎng)聯(lián)汽車發(fā)展維護(hù)測(cè)繪地理信息安全的通知》,對(duì)智能網(wǎng)聯(lián)汽車的測(cè)繪主體和測(cè)繪活動(dòng)的開展提出明確要求,我們認(rèn)為在政策指引下,測(cè)繪資質(zhì)將提升自動(dòng)駕駛艙外數(shù)據(jù)采集和標(biāo)注的門檻,在這方面,海天瑞聲于2022年6月份獲批乙級(jí)測(cè)繪資質(zhì)。2、自動(dòng)駕駛滲透率提升,公司智能駕駛數(shù)據(jù)業(yè)務(wù)有望迎來爆發(fā)2.1、智能駕駛從L2向更高級(jí)別過渡,AI數(shù)據(jù)訓(xùn)練需求將加速成長自動(dòng)駕駛技術(shù)向L3+發(fā)展,滲透率不斷提升拉動(dòng)AI訓(xùn)練數(shù)據(jù)需求。根據(jù)IDC數(shù)據(jù)統(tǒng)計(jì)顯示,我國L2級(jí)自動(dòng)駕駛乘用車滲透率從2021年Q1的7.5大幅提升至2022年Q1的23.2%,未來隨著自動(dòng)駕駛技術(shù)向L3+發(fā)展,自動(dòng)駕駛滲透率將不斷提升。根據(jù)華經(jīng)產(chǎn)業(yè)研究院預(yù)測(cè),到2030年全球L2級(jí)別自動(dòng)駕駛滲透率將達(dá)到57%,L3及更高級(jí)別自動(dòng)駕駛滲透率將達(dá)到10%。自動(dòng)駕駛技術(shù)發(fā)展將推動(dòng)車輛對(duì)傳感器,進(jìn)而帶動(dòng)訓(xùn)練數(shù)據(jù)需求。車載傳感器需求不斷擴(kuò)大,高級(jí)別自動(dòng)駕駛技術(shù)對(duì)訓(xùn)練數(shù)據(jù)需求將顯著提高。隨著L2、L3及以上自動(dòng)駕駛滲透率不斷提升,無論是視覺路線還是激光雷達(dá)路線,單車搭載傳感器的數(shù)量都將顯著增長。奧迪威招股說明書顯示,L3級(jí)別自動(dòng)駕駛單車傳感器數(shù)量將達(dá)到17-34顆。根據(jù)英特爾測(cè)算,L3+級(jí)自動(dòng)駕駛每輛汽車每天產(chǎn)生的數(shù)據(jù)高達(dá)4000GB,作為自動(dòng)駕駛技術(shù)應(yīng)用落地的必要條件,數(shù)據(jù)采集、數(shù)據(jù)標(biāo)注服務(wù)已成為支撐自動(dòng)駕駛熱潮必不可少的一環(huán)。智能駕駛訓(xùn)練數(shù)據(jù)標(biāo)注從2D點(diǎn)云向3D點(diǎn)云發(fā)展,激光雷達(dá)成為重要數(shù)據(jù)來源。傳統(tǒng)的2D圖像數(shù)據(jù)通過攝像頭進(jìn)行采集,涉及到的數(shù)據(jù)標(biāo)注包含點(diǎn)標(biāo)注、線標(biāo)注、框標(biāo)注以及語義分割。3D標(biāo)注需要實(shí)時(shí)分析大量數(shù)據(jù),對(duì)數(shù)據(jù)標(biāo)注要求更高。3D點(diǎn)云數(shù)據(jù)通過激光雷達(dá)進(jìn)行采集,對(duì)目標(biāo)進(jìn)行外輪廓3D拉框,可精確地“描繪”出周邊環(huán)境,不受外界環(huán)境、光照等因素干擾,更好的感知汽車周邊道路環(huán)境,為感知系統(tǒng)提供決策依據(jù)。主要用于算法做3D目標(biāo)檢測(cè)以及3D目標(biāo)跟蹤,由于近年來激光雷達(dá)成本降低,3D點(diǎn)云數(shù)據(jù)的量級(jí)呈現(xiàn)爆發(fā)式增加。高級(jí)別自動(dòng)駕駛數(shù)據(jù)需求爆發(fā)式成長,驅(qū)動(dòng)感知技術(shù)持續(xù)迭代,未來4D點(diǎn)云標(biāo)注有望成為主流方案。根據(jù)英特爾計(jì)算,L3+級(jí)自動(dòng)駕駛每輛汽車每天產(chǎn)生的數(shù)據(jù)高達(dá)4000GB,而根據(jù)美國蘭德公司研究,自動(dòng)駕駛汽車需要在真實(shí)或者虛擬環(huán)境中至少進(jìn)行110億英里的里程測(cè)試,才能證明自動(dòng)駕駛系統(tǒng)比人類駕駛員更可靠。數(shù)據(jù)標(biāo)注需求的成長拉動(dòng)標(biāo)注技術(shù)迭代,4D點(diǎn)云標(biāo)注技術(shù)逐漸成熟?;?D點(diǎn)云標(biāo)注的基礎(chǔ)上,通過對(duì)感知物體進(jìn)行物體的追蹤與運(yùn)動(dòng)屬性檢測(cè),并加入時(shí)序信息,由此獲得4D點(diǎn)云標(biāo)注信息。將當(dāng)前已收集到的多維度、多角度的點(diǎn)云信息進(jìn)行壓縮,在提升現(xiàn)有點(diǎn)云稠密度的同時(shí),再進(jìn)行物體檢測(cè)可獲得更精確的點(diǎn)云標(biāo)注信息。2.2、公司智能駕駛業(yè)務(wù)快速發(fā)展,智能標(biāo)注平臺(tái)技術(shù)優(yōu)勢(shì)顯著公司積極布局智能駕駛業(yè)務(wù),產(chǎn)品服務(wù)矩陣持續(xù)完善。公司于2022年上半年成立智能駕駛事業(yè)部,并著重在智能駕駛數(shù)據(jù)標(biāo)注平臺(tái)上發(fā)力,結(jié)合業(yè)務(wù)實(shí)際需求和行業(yè)未來發(fā)展趨勢(shì),精心設(shè)計(jì)與實(shí)現(xiàn)了多個(gè)功能的新增和優(yōu)化,在圖像標(biāo)注、數(shù)據(jù)管理、供應(yīng)鏈管理等方面有大幅度提升,于6月發(fā)布了第三代智能駕駛標(biāo)注平臺(tái),目前公司正在研發(fā)第四代智能駕駛標(biāo)注平臺(tái),推出后有望進(jìn)一步提升公司的3D功能與數(shù)據(jù)服務(wù)能力。算法迭代賦能數(shù)據(jù)標(biāo)注的效率和準(zhǔn)確度,平臺(tái)化服務(wù)打開業(yè)務(wù)規(guī)?;砷L空間。公司的第三代智能駕駛標(biāo)注平臺(tái),覆蓋了自動(dòng)駕駛場(chǎng)景下不同類型數(shù)據(jù)的標(biāo)注工具,支持3D點(diǎn)云標(biāo)注、3D點(diǎn)云連續(xù)幀標(biāo)注、3D連續(xù)幀與2D聯(lián)合的標(biāo)注和3D語義分割等,還可以根據(jù)客戶的個(gè)性化需求對(duì)平臺(tái)工具進(jìn)行二次開發(fā),在行業(yè)內(nèi)優(yōu)勢(shì)顯著。公司持續(xù)提升平臺(tái)自動(dòng)化、智能化水平,以人機(jī)交互為核心出發(fā)點(diǎn)迭代產(chǎn)品服務(wù)。智能標(biāo)注平臺(tái)在用戶標(biāo)注過程中會(huì)提供智能輔助以提高標(biāo)注效率和準(zhǔn)確度,例如平臺(tái)包含的

“輔助構(gòu)建物體腦補(bǔ)框”工具,可自動(dòng)就同一個(gè)連續(xù)幀的前后幾幀內(nèi)容進(jìn)行預(yù)測(cè),并給出參考。同時(shí),一體化數(shù)據(jù)處理平臺(tái)簡(jiǎn)化并統(tǒng)一了訓(xùn)練數(shù)據(jù)生產(chǎn)流程,模塊式的項(xiàng)目生成和管理方式,使得生產(chǎn)人員可以根據(jù)實(shí)際項(xiàng)目需求有機(jī)結(jié)合、靈活調(diào)整,有效提升用戶采集和加工數(shù)據(jù)的效率。2.3、對(duì)標(biāo)海外廠商,公司發(fā)展前景廣闊2.3.1、對(duì)標(biāo)Sacle.AI,基于AI輔助工具大幅提升數(shù)據(jù)標(biāo)注效率Scale.AI創(chuàng)立于2016年,先后服務(wù)于Waymo、Toyota、Lyft等公司,為客戶公司提供用于機(jī)器學(xué)習(xí)的數(shù)據(jù)標(biāo)注服務(wù)。公司于2020年9月和美國軍方達(dá)成合作,拿下9100萬美元的大單,協(xié)助美國軍方開發(fā)、更新用于訓(xùn)練人工智能的數(shù)據(jù)集。公司成立至今已完成7輪融資(2021年8月融資金額未披露),總計(jì)融資6.03億美元,最新估值達(dá)73億美元。Scale.AI借助AI工具,大幅提升數(shù)據(jù)標(biāo)注效率,并在實(shí)際業(yè)務(wù)中不斷提升標(biāo)注工具的準(zhǔn)確率和效率。Scale.AI將AI應(yīng)用到數(shù)據(jù)標(biāo)注業(yè)務(wù)中,經(jīng)過AI識(shí)別的任務(wù)由人工校對(duì)其中的錯(cuò)誤,再用來訓(xùn)練AI工具,讓下一次標(biāo)注更精準(zhǔn)。經(jīng)過反復(fù)的實(shí)際業(yè)務(wù)訓(xùn)練,AI標(biāo)注工具在提升業(yè)務(wù)效率的同時(shí),可逐步降低人工參與的比例,實(shí)現(xiàn)降本增效。2.3.2、對(duì)標(biāo)海外龍頭廠商Appen,公司盈利能力占優(yōu)前景廣闊Appen(澳鵬)面向機(jī)器學(xué)習(xí)和人工智能開發(fā)提供高質(zhì)量人工標(biāo)注數(shù)據(jù)集。Appen成立于1996年,是全球領(lǐng)先的圖像、文本、語音、音頻、視頻等AI訓(xùn)練數(shù)據(jù)服務(wù)提供商,擁有業(yè)內(nèi)先進(jìn)的人工智能輔助數(shù)據(jù)標(biāo)注平臺(tái)和一體化AI數(shù)據(jù)及資源管理平臺(tái),支持235多種語言和方言,來自全球170多個(gè)國家和70,000個(gè)地區(qū)。Appen為全球科技、汽車、金融服務(wù)、零售、醫(yī)療和政府等行業(yè)賦能,助力AI項(xiàng)目的研發(fā)及商業(yè)化。公司通過兩個(gè)運(yùn)營部門提供服務(wù):相關(guān)性(前內(nèi)容相關(guān)性)部門,提供數(shù)據(jù)注釋以提高搜索引擎搜索結(jié)果的相關(guān)性和準(zhǔn)確性,包括網(wǎng)頁、電子商務(wù)和社交參與技術(shù)。語音和影像(前語音和數(shù)據(jù)收集)部門,為計(jì)算機(jī)算法提供培訓(xùn)數(shù)據(jù)以開發(fā)包括語音識(shí)別器、機(jī)器翻譯和語音合成器在內(nèi)的產(chǎn)品,用于互聯(lián)網(wǎng)連接設(shè)備、車載汽車和消費(fèi)電子產(chǎn)品。公司自研MatrixGo企業(yè)級(jí)AI數(shù)據(jù)標(biāo)注平臺(tái)。平臺(tái)集成了豐富高效的標(biāo)注工具、支持點(diǎn)、檢測(cè)框、屬性等內(nèi)容的標(biāo)注和自定義連線、自動(dòng)順滑及填充等多種功能,具備強(qiáng)大的工作流調(diào)度能力。平臺(tái)可通過對(duì)自有及供應(yīng)商團(tuán)隊(duì)及百萬級(jí)眾包資源進(jìn)行資源整合,可支持豐富場(chǎng)景海量數(shù)據(jù)的各種類型標(biāo)注項(xiàng)目。Appen公司規(guī)模較大,營收高于海天瑞聲,但毛利率、凈利率指標(biāo)不占優(yōu)勢(shì)。根據(jù)YahooFinance數(shù)據(jù)顯示,Appen在2018年-2020年?duì)I業(yè)規(guī)??焖俪砷L,2021年受全球疫情影響,實(shí)現(xiàn)營業(yè)總收入4.47億美元。從毛利率和凈利率來看,Wind數(shù)據(jù)統(tǒng)計(jì)顯示,2020年海天瑞聲的毛利率、凈利率分別為67.70%和35.17%,而Appen僅為42.74%和8.33%。相比于Appen,我們認(rèn)為海天瑞聲在定制化的服務(wù)中不斷沉淀技術(shù)經(jīng)驗(yàn),逐漸積累標(biāo)準(zhǔn)化產(chǎn)品集,使得公司盈利能力要明顯優(yōu)于Appen。3、持續(xù)布局語音語義賽道,多語種為公司核心技術(shù)壁壘3.1、公司在智能語音領(lǐng)域積累深厚,技術(shù)優(yōu)勢(shì)顯著國內(nèi)智能語音市場(chǎng)規(guī)模持續(xù)成長。根據(jù)中商產(chǎn)業(yè)研究院數(shù)據(jù)顯示,2022年我國智能語音市場(chǎng)規(guī)模預(yù)計(jì)達(dá)到401.55億元,同比增長13.6%,2018-2022年復(fù)合增長率約27.60%,未來隨著虛擬人、智能座艙、機(jī)器人等行業(yè)發(fā)展,智能語音應(yīng)用空間不斷打開,將帶動(dòng)語音數(shù)據(jù)標(biāo)注和處理的需求加速成長。公司智能語音服務(wù)包含語音識(shí)別、語音合成兩大業(yè)務(wù)模塊。公司通過設(shè)計(jì)(設(shè)計(jì)訓(xùn)練數(shù)據(jù)集結(jié)構(gòu)、供發(fā)音人朗讀錄制的語料文本或?qū)υ拡?chǎng)景、發(fā)音人分布、錄音設(shè)備場(chǎng)景等)、采集(定義合適的發(fā)音人、選取錄音設(shè)備及軟件、組織發(fā)音人朗讀錄制音頻)、加工(對(duì)音頻文件進(jìn)行切分、標(biāo)注各類聲音特征,形成帶時(shí)間戳和特征標(biāo)簽的文本和標(biāo)注文件等)、質(zhì)檢(對(duì)數(shù)據(jù)集進(jìn)行質(zhì)量檢測(cè),如音字一致性、標(biāo)注準(zhǔn)確率檢查等)等訓(xùn)練數(shù)據(jù)集生產(chǎn)環(huán)節(jié);或者針對(duì)客戶提供的原料音頻文件執(zhí)行加工和質(zhì)檢工作,最終形成客戶所需的智能語音訓(xùn)練數(shù)據(jù)。公司基于多年語音識(shí)別及合成領(lǐng)域的技術(shù)積累,在多語種領(lǐng)域構(gòu)筑深厚技術(shù)壁壘。公司在語音語言學(xué)研究領(lǐng)域儲(chǔ)備了豐富和專家團(tuán)隊(duì)資源,持續(xù)研究創(chuàng)新發(fā)音詞典構(gòu)建技術(shù)以及流程技術(shù)。公司半年報(bào)顯示,截至2022年上半年,公司擁有190個(gè)語種/方言的覆蓋能力,除英語、法語、德語、西班牙語等常見語種外,在希伯來語、阿姆哈拉語、烏爾都語等小語種也以實(shí)現(xiàn)覆蓋,公司累積詞條數(shù)超過1000萬,在高質(zhì)量智能語音訓(xùn)練數(shù)據(jù)領(lǐng)域建立了深厚的技術(shù)壁壘。3.2、持續(xù)布局海外市場(chǎng),標(biāo)準(zhǔn)化產(chǎn)品賦能盈利能力提升公司持續(xù)布局海外市場(chǎng),2022年境外簽單數(shù)量大幅提升。近年來公司持續(xù)布局海外市場(chǎng),2020-2021年受海外疫情影響,公司境外業(yè)務(wù)收入占比有所回落,分別為35.86%和27.75%。2022年以來,公司從品牌、團(tuán)隊(duì)、營銷等多維度發(fā)力布局海外,公司公告顯示,2022年上半年境外收入占總收入達(dá)57.14%,境外市場(chǎng)簽單額同比增長近2.5倍,前三季度境外基礎(chǔ)訓(xùn)練數(shù)據(jù)業(yè)務(wù)收入同比增長近140%。公司境外收入以標(biāo)準(zhǔn)化產(chǎn)品集為主,毛利率明顯高于境內(nèi)業(yè)務(wù)。2021年公司境外業(yè)務(wù)的毛利率達(dá)到82.90%,明顯高于境內(nèi)業(yè)務(wù)的56.75%。公司境外業(yè)務(wù)中標(biāo)準(zhǔn)化的數(shù)據(jù)產(chǎn)品銷售占比較高,并且境外客戶為定制化服務(wù)的付費(fèi)意愿也更高。我們認(rèn)為隨著公司海外業(yè)務(wù)的加速布局,能夠更好地發(fā)揮公司在語音和自然語言領(lǐng)域的多語種優(yōu)勢(shì),打開公司廣闊成長空間。4、海天瑞聲,國內(nèi)AI訓(xùn)練數(shù)據(jù)提供商龍頭4.1、深耕行業(yè)近二十年,成為AI產(chǎn)業(yè)核心價(jià)值提供者深耕AI數(shù)據(jù)標(biāo)注行業(yè)近20年,發(fā)展成為全球AI訓(xùn)練數(shù)據(jù)優(yōu)質(zhì)提供商。公司成立于2005年,致力于為AI產(chǎn)業(yè)鏈上各類廠商提供算法模型訓(xùn)練所需要的高質(zhì)量專業(yè)數(shù)據(jù)集及數(shù)據(jù)標(biāo)注服務(wù)。公司業(yè)務(wù)涵蓋智能語音、計(jì)算機(jī)視覺、自然語言理解等領(lǐng)域,形成了智能駕駛、智能家居、智慧金融、智能安防等多業(yè)務(wù)場(chǎng)景解決方案體系。截至2022年上半年,公司已累計(jì)為740家客戶提供產(chǎn)品服務(wù),并持續(xù)完善業(yè)務(wù)體系,不斷增強(qiáng)綜合數(shù)據(jù)服務(wù)能力競(jìng)爭(zhēng)優(yōu)勢(shì)。公司產(chǎn)品服務(wù)覆蓋AI多個(gè)核心領(lǐng)域,實(shí)現(xiàn)標(biāo)準(zhǔn)化產(chǎn)品、定制化服務(wù)、相關(guān)應(yīng)用服務(wù)全覆蓋。公司所提供的訓(xùn)練數(shù)據(jù)服務(wù)已獲得字節(jié)跳動(dòng)、阿里巴巴、騰訊、百度、科大訊飛、海康威視、微軟、亞馬遜、三星、中國科學(xué)院、清華大學(xué)等國內(nèi)外客戶的認(rèn)可,應(yīng)用于其研發(fā)的個(gè)人助手、智能音箱、語音導(dǎo)航、搜索服務(wù)、短視頻、虛擬人、智能駕駛、機(jī)器翻譯等多種產(chǎn)品相關(guān)的算法模型訓(xùn)練過程中。4.2、公司結(jié)構(gòu)穩(wěn)定,核心團(tuán)隊(duì)背景奠定行業(yè)競(jìng)爭(zhēng)優(yōu)勢(shì)公司核心團(tuán)隊(duì)行業(yè)經(jīng)驗(yàn)豐富。公司創(chuàng)始人賀琳女士曾任職于中國科學(xué)院聲學(xué)研究所,從事語音識(shí)別、語音合成、漢語語言理解、語音心理測(cè)試等方面的研究工作,公司核心管理團(tuán)隊(duì)擁有多年人工智能科研、從業(yè)經(jīng)驗(yàn),未來有望引領(lǐng)公司不斷成長。公司規(guī)模持續(xù)成長,核心技術(shù)團(tuán)隊(duì)加速擴(kuò)充,未來有望助力業(yè)務(wù)規(guī)模拓展。公司在研發(fā)(算法、基礎(chǔ)研究)、技術(shù)等重要崗位持續(xù)引進(jìn)高級(jí)人才,優(yōu)化人員結(jié)構(gòu),截至2022H1,公司人員數(shù)量達(dá)272人,同比增長47.83%,其中研發(fā)人員93人,同比增加72.22%,研發(fā)人員占比超過三分之一,公司研發(fā)人員中本科及以上占比達(dá)94.6%。未來隨著業(yè)務(wù)規(guī)模成長,公司將持續(xù)擴(kuò)充研發(fā)團(tuán)隊(duì)規(guī)模,提升技術(shù)實(shí)力,保持研發(fā)領(lǐng)先優(yōu)勢(shì)。4.3、疫情影響下公司營收承壓,智能化平臺(tái)有望驅(qū)動(dòng)公司快速成長受國內(nèi)外疫情影響,公司2020-2021年?duì)I收承壓,未來有望隨著疫情好轉(zhuǎn)步入快速成長階段。公司受國內(nèi)外疫情影響,2020-2021年實(shí)現(xiàn)營業(yè)總收入2.33和2.06億元,同比減少1.76%和11.52%,2022年前三季度,公司在疫情反復(fù)的情況下拓展智能駕駛業(yè)務(wù),營業(yè)總收入實(shí)現(xiàn)1.67億元,同比增長27.82%。公司2020-2021年實(shí)現(xiàn)歸母凈利潤0.82和0.32億元,同比減少0.61%和61.49%,2022年前三季度歸母凈利潤0.19億元,公司加大研發(fā)投入力度導(dǎo)致利潤顯著承壓。公司毛利率短期承壓,未來隨著標(biāo)準(zhǔn)化產(chǎn)品積累有望回升。公司2022年前三季度綜合毛利率為62.59%,較前幾年有所下降,但維持的60%以上的高位,主要系行業(yè)競(jìng)爭(zhēng)態(tài)勢(shì)加劇,以及公司承接部分戰(zhàn)略性項(xiàng)目所致。我們認(rèn)為隨著公司技術(shù)不斷積累和自有知識(shí)產(chǎn)權(quán)的訓(xùn)練數(shù)據(jù)集產(chǎn)品持續(xù)儲(chǔ)備,以及海外高毛利收入項(xiàng)目的回升,公司業(yè)務(wù)盈利能力有望實(shí)現(xiàn)加速成長。公司持續(xù)加大研發(fā)投入,銷售、管理費(fèi)用率穩(wěn)中有升。公司2022年前三季度研發(fā)費(fèi)用率達(dá)到38.37%,較2021年有較大提升。公司在2022年持續(xù)加大研發(fā)投入和團(tuán)隊(duì)擴(kuò)充,完成第三代智能駕駛標(biāo)注平臺(tái)并上線,同時(shí)布局第四代智能駕駛標(biāo)注平臺(tái)的研發(fā)工作,持續(xù)儲(chǔ)備智能語音、計(jì)算機(jī)視覺等業(yè)務(wù)的訓(xùn)練數(shù)據(jù)集,未來隨著相關(guān)業(yè)務(wù)規(guī)模的擴(kuò)張,有望進(jìn)一步釋放公司技術(shù)產(chǎn)品儲(chǔ)備的商業(yè)價(jià)值。公司2022年前三季度銷售費(fèi)用率和管理費(fèi)用率分別為7.88%和21.34%,較2021年小幅上升。5、盈利預(yù)測(cè)營業(yè)收入:公司是國內(nèi)AI訓(xùn)練數(shù)據(jù)優(yōu)質(zhì)提供商,主營業(yè)務(wù)覆蓋智能語音、計(jì)算機(jī)視覺、自然語言(NLP)以及智能駕駛等核心領(lǐng)域,全面服務(wù)于人機(jī)交互、智能家居、智能駕駛、智慧金融、智能安防等應(yīng)用場(chǎng)景。受國內(nèi)外疫情影響,2020年以來公司經(jīng)營承壓,2021年實(shí)現(xiàn)營業(yè)收入2.06億元。隨著疫情好轉(zhuǎn)疊加下游企業(yè)對(duì)AI訓(xùn)練數(shù)據(jù)需求的持續(xù)成長,以及公司對(duì)智能駕駛業(yè)務(wù)的加速布局,我們預(yù)測(cè)公司2022-2024年?duì)I收將持續(xù)提升,增長率分別為29.36%、49.67%、37.00%,對(duì)應(yīng)營收為2.67億元、4.00億元、5.48億元。智能語音類產(chǎn)品服務(wù):根據(jù)中商產(chǎn)業(yè)研究院數(shù)據(jù),2022年我國智能語音市場(chǎng)規(guī)模預(yù)計(jì)達(dá)到401.55億元,同比增長13.6%,2018-2022年復(fù)合增長率約27.60%;同時(shí)根據(jù)觀研天下數(shù)據(jù)中心數(shù)據(jù)預(yù)計(jì),在未來幾年數(shù)據(jù)標(biāo)注平均價(jià)格指數(shù)將持續(xù)升高,預(yù)計(jì)到2029年達(dá)到112.3(2021年=100),2021-2029年CAGR約為1.46%。公司在多語種智能語音領(lǐng)域技術(shù)積累深厚,可滿足國內(nèi)外客戶的數(shù)據(jù)需求,未來有望受益行業(yè)的持續(xù)成長,公司預(yù)計(jì)2022-2024年智能語音類產(chǎn)品服務(wù)業(yè)務(wù)收入增速為7.15%、24.67%、27.98%。計(jì)算機(jī)視覺類產(chǎn)品服務(wù):公司在人臉檢測(cè)和識(shí)別、物體識(shí)別、光學(xué)字符識(shí)別、場(chǎng)景分割等領(lǐng)域持續(xù)積累核心技術(shù),構(gòu)建競(jìng)爭(zhēng)壁壘,數(shù)據(jù)產(chǎn)品服務(wù)在安防、智能家居等領(lǐng)域廣泛應(yīng)用。對(duì)標(biāo)國外數(shù)據(jù)標(biāo)注龍頭廠商Appen,其業(yè)務(wù)在2018-2020財(cái)年實(shí)現(xiàn)營業(yè)收入2.57/3.75/4.61億美元,復(fù)合增長率達(dá)34.03%,未來隨著國內(nèi)外疫情好轉(zhuǎn)疊加下游客戶需求成長,公司計(jì)算機(jī)視覺類產(chǎn)品業(yè)務(wù)有望迎來快速成長,結(jié)合數(shù)據(jù)標(biāo)注產(chǎn)品服務(wù)平均價(jià)格指數(shù)上漲趨勢(shì),公司預(yù)計(jì)2022-2024年相關(guān)業(yè)務(wù)收入增速為15.67%、46.87%、35.78%。自然語言類產(chǎn)品營收:公司基于在智能語音領(lǐng)域的長期積累,積極探索自然語言處理領(lǐng)域產(chǎn)品及服務(wù),公司在發(fā)音詞典數(shù)據(jù)、手語語料數(shù)據(jù)、機(jī)器翻譯等方向上逐漸積累核心技術(shù),持續(xù)提升業(yè)務(wù)競(jìng)爭(zhēng)力。根據(jù)艾瑞統(tǒng)計(jì)數(shù)據(jù),2021年,中國NLP核心產(chǎn)品和帶動(dòng)市場(chǎng)規(guī)模分別為171億元和450億元,預(yù)計(jì)到2026年規(guī)模將分別達(dá)到459億元和1061億元,2021-2026年核心產(chǎn)品和帶動(dòng)市場(chǎng)規(guī)模CAGR分別為24.8%和22.3%。結(jié)合數(shù)據(jù)標(biāo)注產(chǎn)品服務(wù)平均價(jià)格指數(shù)上漲趨勢(shì),我們認(rèn)為公司基于智能語音方向的深厚積累,有望受益自然語言賽道的行業(yè)成長,預(yù)計(jì)2022-2024年自然語言類產(chǎn)品營收增速為28.46%、28.49%、27.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論