




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、字幕提取所需要用的軟件:Esrxp,尚書7號,word等。廢話少說,讓我們進入正題1. 軟件的安裝過于簡單本節(jié)省略2準(zhǔn)備工作 你需要準(zhǔn)備一臺電腦,還有用來提取字幕的rmvb。3Esrxp軟件的介紹與調(diào)整Esr的使用是提取字幕的關(guān)鍵,識別出來的字幕越完美。你后期所需要的時間就越少Esr里面的其他設(shè)置建議使用我提供的下載里默認(rèn)的,如有需要改動設(shè)置的地方,我會在文說明。首先我們依次點 文件 打開影片(快捷鍵為工具欄第2個)本文使用TSKS的聚光燈12集的rmvb版本作為例子Rmvb文件載入后,依次點 字幕 過濾器(快捷鍵為工具欄第6個)出現(xiàn)如下界面拉一下進度欄(這個應(yīng)該不需要
2、我告訴你在哪里了吧) 找到有字幕的地方進行調(diào)整字幕截取的邊框要根據(jù)影片字幕的位置來設(shè)置,一般字幕為2行。所以截取的時候注意一下上下邊框可以用鼠標(biāo)來調(diào)整 也可以使用 區(qū)域 內(nèi)的上下數(shù)值來調(diào)整完整寬度 請勾選上(一般設(shè)置好后,下次啟動軟件時候會使用上次設(shè)置)過濾器設(shè)置 請鉤上 這樣我們才能調(diào)整一些參數(shù)便于識別出完美的字幕請選擇“顏色和邊線”字幕顏色 設(shè)置成和rmvb中字幕的主顏色的同色(如何正確知道字幕的顏色:可以把鼠標(biāo)移動到字體上,在設(shè)置的左下角會出現(xiàn)當(dāng)前鼠標(biāo)所在處的RGB值)邊線顏色 設(shè)置成和rmvb中字幕的邊線顏色的同色(一般都是白色字體,其他的邊線顏色都可以用黑色來代替)后處理設(shè)置請按照下
3、圖設(shè)置,這個基本是固定的,不需要按照影片設(shè)置,除非rmvb字體太小。進階設(shè)置(此處很重要,為識別的核心部分,識別出來的字幕完美不完美就靠它了)點擊如下圖所示大家可參考我圖中的設(shè)置說明:沒有打勾的不生效,意味著隨便什么數(shù)值都可以(軟件自動默認(rèn)為最高或者最低) 不要隨便勾選其他的,除非你研究了很透徹了 需要調(diào)整的地方有2個:邊線里的最高光度和最后階段的RGB差距(圖中2處的數(shù)值無參考意義,需自行根據(jù)影片設(shè)置) 最高光度需要根據(jù)不同的rmvb設(shè)置不同的值,調(diào)整到識別出來的字幕不丟字,也無
4、太多的雜點即可。當(dāng)然最好識別出來和我圖中的字幕那樣完美. RG差距為字幕的清晰度,越高越清晰,但是也同時會帶來非字幕地方出現(xiàn)雜點,影響到后面的OCR識別。所以我們的原則是:只要能看了比較清楚,OCR軟件能夠順利識別就可以了。 此處設(shè)置的時候可以拖動進度欄,觀察總體字幕識別情況,不要總是盯著一出字幕來設(shè)置。那樣容易會出現(xiàn)本處字幕識別了完美,其他時間字幕出現(xiàn)丟字或者雜點太多的情況設(shè)置完畢后我們可以開始識別了,返回到軟件的主界面。點左下角的開始,讓軟件自己開始識別吧。識別時間需要看機器的配制和字幕的多與少。為了節(jié)約時間,本文
5、中只識別的影片的前幾分鐘?,F(xiàn)在我們會發(fā)現(xiàn)識別出來會多很多無用的字幕(到底會多多少,這個要看你設(shè)置的情況了一般設(shè)置了比較好的話,基本沒有太多的無用字幕)我們需要手動刪除他們依次點 字幕 字幕管理 (快捷鍵為工具欄第8個)出現(xiàn)如下界面刪除的時候可以點最縮小的那個放大鏡 這樣屏幕可以同時顯示更多字幕,提高刪除效率刪除的方法:最基本的是用鼠標(biāo)點,點一次選中,再點一次不選中。 下面再告訴大家?guī)讉€技巧:點好鼠標(biāo)左鍵后不放,放下拖,鼠標(biāo)所過之處會自動選上。選擇多行無字幕的圖象時(就是有一大段都沒有字幕,是亂七八糟的雜點)可以在開
6、始字幕處點右鍵選中,結(jié)束字幕處點左鍵。這樣這一大段的字幕就全部被選中了。合并重復(fù)字幕:有時候會出現(xiàn)這樣的情況,多行字幕為同一字幕,我們需要合并之,方法為在重復(fù)字幕的第一個字幕處點右鍵選中,在重復(fù)字幕結(jié)束處點右鍵。無用字幕選擇好之后,我們點字幕管理中的刪除(下圖紅圈所示)關(guān)閉字幕管理,返回軟件主界面?,F(xiàn)在我們開始輸出OCR所需要使用的bmp圖片。依次打開 文件 保存OCR影象(快捷鍵為工具欄第5個)說明:先建立一個文件夾用來保存ocr圖片,選擇好圖片輸出位置后,出現(xiàn)下圖設(shè)置。請按照本圖設(shè)置,每張圖片不宜太大,否則OCR軟件無法識別輸出圖片結(jié)束后,我們需要把剛才提供的esr文件另存為一下。這個習(xí)慣
7、要養(yǎng)成,不然會很麻煩。下面我們開始介紹OCR軟件:尚書7號的使用打開軟件,打開圖片。(這里需要提醒的是,一集字幕我們按60行字幕一張圖片的話會出現(xiàn)10多張圖片,我們在打開圖片時候需要一次性選擇全部圖片,而且第一張選種的圖片必須是編號最后的圖片,最后選種的圖片必須是編號為1的圖片,這樣在尚書7號里面才會按照1 2 3 4這樣的順序排列,否則是反過來的)圖片全部打開之后,我們先點全選圖片(快捷鍵為工具欄第5個)然后開始識別(快捷鍵為工具欄第6個)識別很快,幾秒一個圖片。識別結(jié)束后,再按一次全選(快捷鍵為工具欄第5個)然后依次點 輸出 輸出到指定文件(把識別出來的文字存為一個txt文件)到了這里我們
8、會發(fā)現(xiàn),文中提示所需要的word還沒派上用場,這個時候我們就需要用上它了。因為識別出來的文字,偶爾有幾個會有識別錯誤,而且是批量的,我們需要用到word的全部替換功能,把一些常用字的識別錯誤給修正(不要問我有哪些常用字會識別錯誤,基本很少。做過這么一兩個字幕后你就會知道那些字需要全部替換下)OK現(xiàn)在我們所需要做的是把word里調(diào)整過文字復(fù)制到exrxp軟件的左邊的文字框里去注意,一行對應(yīng)一行哦??梢园盐淖值淖煮w大小該大點,這樣眼睛不累減少錯字。- -|然后開始我們最為辛苦的校對過程,結(jié)束后如下圖現(xiàn)在我們又需要用到word的排版功能,這些字幕有的開頭有空格,有的無空格,我們先把他全選,然后復(fù)制到word里面去,然后在word里面再次全選文字,使用“居中”功能然后再復(fù)制到esrxp里去,我們會發(fā)現(xiàn)文字刷刷的全部對齊了,如下圖不推薦使用WPS,因為那個居中根本就無效果現(xiàn)在我們的工作差不多結(jié)束了可以輸出為了srt ssa等格式的字幕了(推薦srt)。具體方法是另存為的時候選擇 srt類型
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年食品與飲料行業(yè)休閑食品市場細分領(lǐng)域研究報告
- 智慧港口自動化裝卸設(shè)備在港口智能化改造中的應(yīng)用報告
- 2025年元宇宙社交平臺社交內(nèi)容質(zhì)量評估與用戶體驗研究
- 2025年醫(yī)院信息化建設(shè):電子病歷系統(tǒng)智能藥物市場趨勢優(yōu)化報告
- 2025年醫(yī)藥行業(yè)研發(fā)投入與成果轉(zhuǎn)化研究報告
- 江蘇省揚州市邗江區(qū)2025屆英語八年級第二學(xué)期期末調(diào)研試題含答案
- 咨詢工程師2025教材課件
- 2025年醫(yī)藥企業(yè)CRO模式下的臨床試驗監(jiān)測與數(shù)據(jù)質(zhì)量控制報告
- 周末假期安全課件
- 汕頭市重點中學(xué)2025屆英語七下期中學(xué)業(yè)水平測試模擬試題含答案
- 廣東省廣州市花都區(qū)2022-2023學(xué)年三年級下學(xué)期語文期末試卷
- 人工智能倫理導(dǎo)論- 課件 第3、4章 人工智能倫理、人工智能風(fēng)險
- 工業(yè)管道技術(shù)交底
- ?;钒踩芾砼嘤?xùn)模板如何正確穿戴和使用防護裝備
- 基于單片機的多路數(shù)據(jù)采集系統(tǒng)設(shè)計(附源程序及原理圖)
- 《跨部門溝通與協(xié)調(diào)》課件
- 2023年哈密市伊吾縣社區(qū)工作者招聘考試真題
- 國開期末考試《建筑工程質(zhì)量檢驗》機考試題及答案(第6套)
- 簡歷篩選技巧培訓(xùn)
- 氧化還原反應(yīng)的基本規(guī)律及其應(yīng)用
- 全國工會財務(wù)知識競賽題庫及答案
評論
0/150
提交評論