【畢業(yè)學(xué)位論文】(Word原稿)數(shù)字媒體內(nèi)容管理系統(tǒng)的研究與開發(fā)-軟件工程_第1頁
【畢業(yè)學(xué)位論文】(Word原稿)數(shù)字媒體內(nèi)容管理系統(tǒng)的研究與開發(fā)-軟件工程_第2頁
【畢業(yè)學(xué)位論文】(Word原稿)數(shù)字媒體內(nèi)容管理系統(tǒng)的研究與開發(fā)-軟件工程_第3頁
【畢業(yè)學(xué)位論文】(Word原稿)數(shù)字媒體內(nèi)容管理系統(tǒng)的研究與開發(fā)-軟件工程_第4頁
【畢業(yè)學(xué)位論文】(Word原稿)數(shù)字媒體內(nèi)容管理系統(tǒng)的研究與開發(fā)-軟件工程_第5頁
已閱讀5頁,還剩62頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

學(xué)位論文版權(quán)使用授權(quán)書 本人完全了解同濟大學(xué)關(guān)于收集、保存、使用學(xué)位論文的規(guī)定,同意如下各項內(nèi)容:按照學(xué)校要求提交學(xué)位論文的印刷本和電子版本;學(xué)校有權(quán)保存學(xué)位論文的印刷本和電子版,并采用影印、縮印、掃描、數(shù)字化或其它手段保存論文;學(xué)校有權(quán)提供目錄檢索以及提供本學(xué)位論文全文或者部分的閱覽服務(wù);學(xué)校有權(quán)按有關(guān)規(guī)定向國家有關(guān)部門或者機構(gòu)送交論文的復(fù)印件和電子版;在不以贏利為目的的前提下,學(xué)??梢赃m當復(fù)制論文的部分或全部內(nèi)容用于學(xué)術(shù)活動。 學(xué)位論文作者簽名: 年 月 日 同濟大學(xué)學(xué)位論文原創(chuàng)性聲明 本人鄭重聲明:所呈交的學(xué)位論文,是本人在導(dǎo)師指導(dǎo)下,進行研究工作所取得的成果。除文中已經(jīng)注明引用的內(nèi)容外,本學(xué)位論文的研究成果不包含任何他人創(chuàng)作的、已公開發(fā)表或者沒有公開發(fā)表的作品的內(nèi)容。對本論文所涉及的研究工作做出貢獻的其他個人和集體,均已在文中以明確方式標明。本學(xué)位論文原創(chuàng)性聲明的法律責任由本人承擔。 學(xué)位論文作者簽名: 年 月 日 數(shù)字媒體內(nèi)容管理系統(tǒng)的研究與開發(fā) I 目錄 摘要 . I . 1章 前言 . 1 題背景 . 1 題來源及意義 . 3 題的內(nèi)容和任務(wù) . 3 第 2章 數(shù)字媒體內(nèi)容管理關(guān)鍵技術(shù) . 5 視頻數(shù)據(jù)的編目 . 5 數(shù)據(jù)概念 . 6 數(shù)據(jù)的應(yīng)用目的 . 6 數(shù)據(jù)結(jié)構(gòu)定義方式 . 7 用元數(shù)據(jù)標準 . 8 于廣播電視音像資料編目規(guī)范的視音頻編 目 . 9 儲技術(shù) . 11 接連接存儲 . 12 絡(luò)連接存儲 . 12 儲區(qū)域網(wǎng)絡(luò) . 13 儲模式 . 15 據(jù)備份和災(zāi)難恢復(fù) . 15 據(jù)備份 . 15 份系統(tǒng)的架構(gòu) . 16 難恢復(fù) . 17 索技術(shù) . 17 文檢索 . 17 像檢索 . 17 頻檢索 . 20 頻檢索 . 21 布技術(shù) . 21 性化信息服務(wù)技術(shù) . 22 第 3章 系統(tǒng)需求分析 . 24 統(tǒng)目標 . 24 向服務(wù)的架構(gòu) . 26 數(shù)字媒體內(nèi)容管理系統(tǒng)的研究與開發(fā) 4章 系統(tǒng)概要設(shè)計 . 28 于 . 28 據(jù)庫 . 29 目數(shù)據(jù)項 . 29 據(jù)庫平臺安全設(shè)計 . 31 據(jù)庫服務(wù)器 . 32 體數(shù)據(jù)存儲系統(tǒng) . 32 問效率 . 33 線存儲陣列 . 33 線磁帶存儲 . 33 視頻編碼格式轉(zhuǎn)換 . 34 地容災(zāi)系統(tǒng) . 34 第 5章 系統(tǒng)詳細設(shè)計與實現(xiàn) . 36 準化服務(wù)接口的實現(xiàn) . 36 務(wù)注冊 . 37 務(wù)調(diào)用 . 37 知服務(wù)時的調(diào)用流程 . 38 符合規(guī)范的系統(tǒng)如何調(diào)用服務(wù) . 38 目系統(tǒng)模塊 . 39 碼格式轉(zhuǎn)換模塊 . 41 入模塊 . 45 碼模塊 . 46 出模塊 . 47 據(jù)庫實現(xiàn) . 47 儲系統(tǒng) . 56 存儲為中心的分級存儲 . 56 移策略 . 57 第 6章 總結(jié)與展望 . 59 參考文獻 . 60 致謝 . 錯誤 !未定義書簽。 個人簡歷 在讀期間發(fā)表的學(xué)術(shù)論文與研究成果 . 錯誤 !未定義書簽。 附主要模塊代碼 . 錯誤 !未定義書簽。 數(shù)字媒體內(nèi)容管理系統(tǒng)的研究與開發(fā) I 摘要 數(shù)字 媒體 內(nèi)容 的計算機 管理 是 廣播電視數(shù)字化的必然要求。隨 著 媒體數(shù)據(jù)的日益增加, 廣播電視部門 的 媒體內(nèi)容管理的復(fù)雜度也在急劇增加; 觀眾對媒體內(nèi)容的 瀏覽和檢索的需 求也在不斷升級。本文從如何實現(xiàn) 媒體內(nèi)容的高效管理 、 快速 檢索 和廉價存儲媒體等目標 出發(fā),對媒體內(nèi)容管理的關(guān)鍵技術(shù)進行了分析,并提出了技術(shù)方案和實現(xiàn)方法 。 媒體數(shù)字化技術(shù) 對 歷史模擬數(shù)據(jù)和模擬設(shè)備制作的節(jié)目進行 數(shù)字化采樣和編碼壓縮 實現(xiàn)方法; 元數(shù)據(jù)編目技術(shù) 對媒體數(shù)據(jù)進行全面和準確的描述,并利用元數(shù)據(jù)進行檢索和元數(shù)據(jù)的交換標準; 海量數(shù)據(jù)存儲技術(shù)采用三級存儲方法; 檢索技術(shù) 討論了利用元數(shù)據(jù)和基于內(nèi)容的方法。論文重點分析了電視節(jié) 目的元數(shù)據(jù) 編目和相關(guān)技術(shù),給出了編目流程; 介紹了視音頻數(shù)據(jù)的編目壓縮技術(shù) ,具體分析了當前主流編碼算法不同的碼率下質(zhì)量對比,并給出了具有工程指導(dǎo)意義的實際結(jié)果 。 在此基礎(chǔ)上,以 杭州文廣集團數(shù)字媒體管理系統(tǒng)的開發(fā)為例, 詳細分析 了 數(shù)字 媒體 內(nèi)容管理的功能需求,介紹了面向服務(wù)的系統(tǒng)架構(gòu)、系統(tǒng)功能框架; 詳細說明了服務(wù)注冊和服務(wù)調(diào)用的基本原理和實現(xiàn)方法;最后給出了數(shù)據(jù)庫系統(tǒng)、存儲系統(tǒng)的數(shù)據(jù)安全容錯 等 媒體內(nèi)容管理系統(tǒng)的主要模塊的設(shè)計 和實現(xiàn) 方法 。 關(guān)鍵字: 元數(shù)據(jù);多級存儲;編目; 媒體 內(nèi)容 管理 ;視頻編碼 數(shù)字媒體內(nèi)容管理系統(tǒng)的研究與開發(fā) he of is of V of is of of on to of of on of to of of is of on of V of On of as an a of a of of 1 章 前言 1 第 1章 前言 隨著廣播電視事業(yè)的發(fā)展和現(xiàn)代傳媒技術(shù)的快速發(fā)展,視頻音像資料已經(jīng)成為記錄歷史、承載信息的主流載 體形式。音像資料這種媒體資源也具有越來越廣泛的應(yīng)用前景,構(gòu)成了廣播電視無形資產(chǎn)的重要組成部分,是一筆巨大的財富,急需加以保存 并 供 節(jié)目生產(chǎn) 重復(fù) 使用。傳統(tǒng)的錄像帶或磁帶存儲管理模式造價和維護成本 高,管理 不便, 檢索 調(diào)用 效率低下 。此外, 廣播 電視行業(yè)在系統(tǒng)建設(shè)中,各個業(yè)務(wù)系統(tǒng)是 獨立建設(shè),各業(yè)務(wù) 子 系統(tǒng)在功能設(shè)計上存在重合的地方, 造成 各系統(tǒng)之間不能互聯(lián)互通,無法實現(xiàn) 資源和 數(shù)據(jù) 共享。因此, 建立一個高效的,能夠融合現(xiàn)有多個系統(tǒng)的多系統(tǒng)互聯(lián)方案顯得 尤為重要!隨著數(shù)字技術(shù)與網(wǎng)絡(luò)技術(shù)的日漸成熟,催生了 數(shù)字媒體內(nèi)容管理系統(tǒng) 的規(guī)劃、開 發(fā)與應(yīng)用。通過對媒體資產(chǎn)進行科學(xué) 規(guī)劃和 有效管理,用現(xiàn)代科技技術(shù)手段進行數(shù)字存儲, 可以 讓無形資產(chǎn)產(chǎn)生有形效益,從而更好地開發(fā)出它的衍生價值和創(chuàng)造它的增值效益。 題背景 中國廣播電視經(jīng)過幾十年的發(fā)展和積累,已擁有大量專業(yè)的音像節(jié)目資料,這些音像資料見證了中國經(jīng)濟和社會發(fā)展的歷史軌跡,其中不乏關(guān)于城市變遷、特色景觀、歷史名人的珍貴影像留存。 隨著廣播影視事業(yè)的迅速發(fā)展, 尤其是視聽新媒體業(yè)態(tài)的 蓬勃 發(fā)展, 這些 音像 節(jié)目資料 的 歷史價值和經(jīng)濟價值 日益彰顯。如何通過科學(xué)有效的管理,運用現(xiàn)代科技技術(shù)手段進行存儲,讓無形資產(chǎn)產(chǎn)生 有形效益,從而更好地開發(fā)出它的衍生價值和創(chuàng)造它的增值效益,是當前國內(nèi) 廣電媒體亟待解決的問題,這也是 各級廣電機構(gòu)音像資料管理部門所承擔的主要職能。 傳統(tǒng)的音像資料,以磁性材料為載體,其特點是化學(xué)成分復(fù)雜、質(zhì)地脆弱,受光、熱、污物等環(huán)境因素的影響較大,記錄在其上的聲像會隨載體的損壞而減弱甚至消失,致使許多極為珍貴的歷史資料得不到有效保存。而且,由于電視臺對資料的重復(fù)利用較多,每次使用都會使磁帶的信號受到損失。廣播影視業(yè)在發(fā)展的過程中,亟需用數(shù)字化網(wǎng)絡(luò)系統(tǒng)提高節(jié)目制作水平和節(jié)目生產(chǎn)效率,傳統(tǒng)的以磁帶為介質(zhì)的保存、 管理方式不便于查看、操作,難以適應(yīng)高效率的制作環(huán)境,無法滿足大容量的服務(wù)需要。因此,廣電機構(gòu)建立面向內(nèi)容生產(chǎn) 的媒體資料體系迫在眉睫。 第 1 章 前言 2 近年來,國內(nèi)外有實力的廣電機構(gòu)和大型傳媒集團紛紛斥資建設(shè)已數(shù)字化、網(wǎng)絡(luò)化為特點的 數(shù)字媒體內(nèi)容管理系統(tǒng) ,利用計算機技術(shù),將音視頻模擬信號數(shù)字化,存儲于計算機系統(tǒng)中,實現(xiàn)視頻的實時查看、點播 ,大大提高效率和互動性,并形成了多 樣的 數(shù)字媒體內(nèi)容管理系統(tǒng) 管理模式。 從上世紀末開始, 數(shù)字媒體內(nèi)容管理系統(tǒng) 共享中心”,將 數(shù)字媒體內(nèi)容管理系統(tǒng) 管 理視為新的核心競爭力,在數(shù)字化管理的基礎(chǔ)上 逐步 形成了三種基本 建設(shè)思路和管理 模式。一是以資料管理、共享為目標的資料館模式。比如 比特”工程,就是以分布式網(wǎng)絡(luò)為基礎(chǔ)的新聞檔案和編輯系統(tǒng),整合組織內(nèi)部各種數(shù)據(jù),并針對外部進入數(shù)據(jù)進行自動化處理,實現(xiàn)視頻轉(zhuǎn)換的自動識別,自動語音識別,自動 編目 系統(tǒng)等功能 19。二是以多渠道快速共享為核心的多媒體分發(fā)模式。 該模式在資料管理的基礎(chǔ)上,為適合播出渠道迅速增加的需求,進一步向播出環(huán)節(jié)延伸,實現(xiàn)了不同頻道或網(wǎng)站等新媒體發(fā)布出口,按不同要求對 數(shù)字媒體內(nèi)容管理系統(tǒng) 內(nèi) 容進行快速加工和發(fā)布。具有代表性的是美國 過該模式, 字媒體內(nèi)容管理系統(tǒng) 升級為內(nèi)容產(chǎn)品制播流程的中心 ,并支持多出口發(fā)布,在支持傳統(tǒng)廣播電視內(nèi)容生產(chǎn)的同時,也實現(xiàn)了向新媒體 的 滲透。 最后一種是以數(shù)字媒體內(nèi)容管理系統(tǒng) 為基礎(chǔ)的生產(chǎn)、營銷結(jié)合為目標的全流程模式。 在這一模式中,廣電機構(gòu)的地采、編、播、銷各個環(huán)節(jié)均以內(nèi)容管理為基礎(chǔ)展開。日本 電視節(jié)目 在電視終端和節(jié)目網(wǎng)站同步播出 ,并提供 觀眾、手機用戶互動渠道。通過互動渠道,觀眾可以即時參與劇情設(shè)計,相應(yīng)信息回傳 數(shù)字媒體內(nèi)容管理 系統(tǒng) 庫 并作出回應(yīng) 7。 2003年 , “媒體資產(chǎn)管理”的概念開始被 引進 國內(nèi)廣電 行業(yè), 隨著傳媒業(yè)競爭的日趨激烈, 媒體資產(chǎn)的價值和功能也日益得到重視。中央電視臺、上海文廣集團、江蘇電視臺、深圳電視臺等 實力較強的廣電機構(gòu)先后建立自己的 數(shù)字媒體內(nèi)容管理系統(tǒng) 管理系統(tǒng)。 總體來看,國內(nèi)大多數(shù)廣電機構(gòu) 數(shù)字媒體內(nèi)容管理 系統(tǒng)仍然扮演“內(nèi)容庫”的角色,其 功能訴求仍然是以資料的存儲、檢索、調(diào)用為主 。隨著電視臺非線性編輯設(shè)備的普及, 一些電視臺的 數(shù)字媒體內(nèi)容管理系統(tǒng) 為節(jié)目生產(chǎn)提供內(nèi)容服務(wù),各個非編站點可以通過網(wǎng)絡(luò)共享庫內(nèi)資源,進行在線 編輯。另外,以上海文廣為代表的少數(shù)大型傳媒集團, 圍繞媒體資源進行統(tǒng)一規(guī)劃,其數(shù)字媒體內(nèi)容管理系統(tǒng) 集內(nèi)容管理平臺、生產(chǎn)平臺、播出平臺、信息發(fā)布平臺、節(jié)目運營平臺于一體,形成一個統(tǒng)一的內(nèi)容采集、加工、存儲、發(fā)送平臺 20。 十年來,隨著科學(xué)技術(shù)的不斷升級換代,音像資料管理早已超越“卡片索引+手工檢索”的原始階段,模擬制式 逐步 被數(shù)字制式 所取代 , 未來數(shù)字流載體和數(shù)字化存儲將成為節(jié)目保存的主流,這將大大提高節(jié)目保存和播出的質(zhì)量,而海量存儲技術(shù) 的發(fā)展 也為音像資料的數(shù)字化 保存 提供了 必要的 物理 基礎(chǔ)。 第 1 章 前言 3 對于眾多廣電機構(gòu)來說 , 數(shù)字媒體內(nèi)容管理系統(tǒng) 的建設(shè)和實施不僅是作為音像資料的倉庫, 更重要的是為一線節(jié)目制作、加工甚至營銷提供 資料服務(wù),建立面向內(nèi)容生產(chǎn)的 數(shù)字媒體內(nèi)容管理系統(tǒng) 服務(wù)體系。一般來說,該體系具有如下特點: ( 1)必須 與 廣電機構(gòu) 生產(chǎn)系統(tǒng)緊密 連接 ,為生產(chǎn)業(yè)務(wù) 各 環(huán)節(jié)提供存儲、檢索、遷移服務(wù); ( 2) 能夠為業(yè)務(wù)系統(tǒng)的多個環(huán)節(jié)提供資料入庫、 數(shù)字媒體內(nèi)容管理系統(tǒng) 檢索和遷移服務(wù); ( 3) 作為生產(chǎn)系統(tǒng)的二級存儲,能夠提供自動歸檔遷移和回遷功能, 迅速響應(yīng); ( 4) 簡化編目流程,部分元數(shù)據(jù)可以從制作系統(tǒng)的業(yè)務(wù)單元直接繼承; ( 5) 通過 數(shù)字媒 體內(nèi)容管理系統(tǒng) 平臺能夠?qū)崿F(xiàn)各制作網(wǎng)之間的素材檢索和資源共享; ( 6)嚴格限制敏感 素材的 共享范圍 和 用戶 權(quán)限 。 題來源及意義 本人在杭州文廣集團長期從事音像資料的管理工作,從 1999 年開始,杭州文廣集團 著手 對電視節(jié)目資料管理進行變革,由視聽中心音像資料部對集團內(nèi)各電視庫房的資料管理員進行業(yè)務(wù)培訓(xùn),統(tǒng)一操作規(guī)范,并完善了資料存儲 、 使用的相關(guān)制度 。 同時,集團技術(shù)中心按照音像資料管理的要求,招標設(shè)計管理軟件。2002 年,音像資料部又著手對 數(shù)字媒體內(nèi)容 管理系統(tǒng)進行升級,杭州文廣電視資料管理全面步入計算機 管理時代 。 目 前 , 杭州文廣集團 初步 完成 了媒體 節(jié)目 內(nèi)容數(shù)字化存儲和檢索系統(tǒng) 建設(shè) ,但 由于 硬件設(shè)備 、工作機制 等 多種原因 , 數(shù)字媒體內(nèi)容管理系統(tǒng) 仍難以為 各個頻道頻率 的 節(jié)目生產(chǎn)、存儲和營銷提供全面 、深入的 服務(wù) 。 建立 面向生產(chǎn)型的 數(shù)字媒體內(nèi)容管理系統(tǒng) , 通過研究 數(shù)字媒體 處理技術(shù)在 數(shù)字媒體內(nèi)容管理系統(tǒng) 的應(yīng)用,開發(fā)一套針對該特定行業(yè)應(yīng)用的軟件,將極大降低數(shù)字媒體內(nèi)容管理的難度,對于 杭州文廣集團 未來數(shù)字化條件下 提高 廣播電視生產(chǎn) 效率, 拓展新媒體業(yè)態(tài),形成全媒體產(chǎn)業(yè)鏈 , 具有極為重要的意義。 題的內(nèi)容和任務(wù) 本文針對高清電視、網(wǎng)絡(luò)多媒體、 手機電視移動電視等新媒體對海量內(nèi)容的需求,以數(shù)字音視頻處理技術(shù)和網(wǎng)絡(luò)通信技術(shù)為核心,研究數(shù)字媒體內(nèi)容第 1 章 前言 4 管理、高清電視節(jié)目關(guān)鍵技術(shù)、網(wǎng)絡(luò)和移動新媒體 的音視頻編目、檢索等相關(guān)技術(shù)。主要內(nèi)容和關(guān)鍵技術(shù)包括:適應(yīng)傳統(tǒng)電視、網(wǎng)絡(luò)視頻和 移動 多媒體 媒體 等 應(yīng)用要求的快速分布式智能編碼和格式轉(zhuǎn)換技術(shù);基于媒體內(nèi)容分析的音視頻結(jié)構(gòu)化技術(shù)和新聞節(jié)目的單元自動劃分技術(shù)。 本文擬通過對國內(nèi)外 數(shù)字媒體內(nèi)容管理系統(tǒng) 的比較和分析,以杭州文廣集團數(shù)字媒體內(nèi)容管理系統(tǒng) 管理需求出發(fā),研究媒體處理技術(shù)在 數(shù)字媒體內(nèi)容管理系統(tǒng) 的應(yīng)用,最終提出杭州文廣集 團媒體資產(chǎn)系統(tǒng)的技術(shù)方案,開發(fā)原型系統(tǒng)驗證相關(guān)技術(shù)和技術(shù)方案的合理性。 論文共分為 六 個部分:第一章主要概括國內(nèi)外數(shù)字媒體內(nèi)容相關(guān)技術(shù)的發(fā)展現(xiàn)狀和應(yīng)用情況,介紹本論文的應(yīng)用背景和現(xiàn)實意義;第二章闡述數(shù)字媒體管理系統(tǒng)的關(guān)鍵技術(shù)的基本原理,包括媒體元數(shù)據(jù)編目的 相關(guān) 技術(shù)、數(shù)據(jù)檢索技術(shù)、內(nèi)容存儲和備份技術(shù);第三章以杭州文廣集團為應(yīng)用環(huán) 境,對杭州文廣的數(shù)字媒體內(nèi)容管理系統(tǒng)做了系統(tǒng)分析 ;第四章給出了 概要設(shè)計;第 五 章 給介紹了杭州文廣集團數(shù)字媒體內(nèi)容管理系統(tǒng)詳細設(shè)計和實現(xiàn)方法;第 六 章對本文做了總結(jié) ,并探討了數(shù)字媒體內(nèi)容管理技 術(shù)的發(fā)展方向和趨勢。 第 2 章 數(shù)字媒體內(nèi)容管理關(guān)鍵技術(shù) 5 第 2章 數(shù)字媒體內(nèi)容管理關(guān)鍵技術(shù) 數(shù)字媒體內(nèi)容管理是以計算機技術(shù)、多媒體技術(shù)和網(wǎng)絡(luò)技術(shù)為核心的綜合應(yīng)用系統(tǒng),涉及信息技術(shù)的多個方面。其中核心技術(shù)包括以音視頻為主的媒體內(nèi)容的描述,海量內(nèi)容的存儲、數(shù)據(jù)檢索和數(shù)據(jù)安全等。 視頻數(shù)據(jù)的編目 編目一般分為 主題 編目 和分類 編目 ,是信息資源加工中的一個重要的環(huán)節(jié),編目 工作質(zhì)量的好壞影響信息資源的最終使用效果。主題 編目 是采用主題詞 編目規(guī)則,賦予信息記錄語詞標識的過程。具體而言,主題 編目 是在分析主題的基礎(chǔ)上,以主題詞表或 編目 規(guī)則作為依據(jù),將信息資源中具有 檢索意義的特征轉(zhuǎn)換成相應(yīng)的主題詞或采用自然語言的詞語標識主題內(nèi)容,并將其組織成表達信息資源內(nèi)容特征標識系統(tǒng)的過程。而分類 編目 是依據(jù)一定的分類體系,對信息記錄的內(nèi)容特征進行分析、判斷,賦予分類標識的過程。人工 編目 是直接由 編目 人員對信息記錄進行分類 編目 或主題 編目 ,賦予特定檢索標識的工作,但是由于 編目 人員水平的不同和信息資源所存在的語義的歧義,造成同一篇文獻不同人員 編目 的 編目 不一致。自動 編目 技術(shù)以主題詞表和分類表為基礎(chǔ),為 編目 人員自動生成主題和分類,并且可以對人工 編目 進行校對。 視頻信息屬于時變媒體,是最復(fù)雜的多 媒體信息,依據(jù)信息管理原理,信息的組織是信息處理系統(tǒng)中所有技術(shù)實現(xiàn)的基礎(chǔ)。只有科學(xué)有效地組織和構(gòu)建視頻信息索引結(jié)構(gòu),才能實現(xiàn)快速檢索與獲取。視頻的文字 編目 分手工 編目 和機器自動 編目 兩種。 手工 編目 需要先觀看視頻資料,然后用文字描述它的外部特征 (如視頻播放長度、制作日期等 ),用主題詞 編目 其內(nèi)容特征。這種手段易于實現(xiàn),許多電視臺以及早期的多媒體數(shù)據(jù)庫多采用這種形式。 自動視頻 編目 可分為完全自動和半自動兩種。視頻信息的 編目 開始從人工 編目 向機器的單一模型 (視頻、音頻、文本 )和多重特征模型 (視、音、文本緊密結(jié)合 )自動 編 目 發(fā)展。 自動視頻圖像 編目 :視頻信息 編目 正在逐步從文字 編目 向關(guān)鍵幀可視信息 編第 2 章 數(shù)字媒體內(nèi)容管理關(guān)鍵技術(shù) 6 目 或關(guān)鍵幀可視信息與文字混合 編目 的方向發(fā)展。將一個完整的視頻資料 (新聞報道、電視故事等 )分割成若干片段 (鏡頭 ),從鏡頭中分析出關(guān)鍵幀作為后備 編目 幀,最后對后備幀進行分析對比得到 編目 幀,將這些 編目 幀 (靜態(tài)圖像 )作為 編目 內(nèi)容存入數(shù)據(jù)庫,以保證可以直接進行圖像檢索 (模式匹配 )獲取視頻信息。 數(shù)據(jù)概念 元數(shù)據(jù)( 常被定義為“關(guān)于數(shù)據(jù)的數(shù)據(jù)( 。具體來說,元數(shù)據(jù)是用來描述數(shù)據(jù)本身的內(nèi)容特征和 其它特征的數(shù)據(jù),其目的是加強對網(wǎng)絡(luò)信息資源的發(fā)現(xiàn)、識別、開發(fā)、組織和評價,而且對相關(guān)的信息資源進行選擇、定位、調(diào)用,追蹤資源在使用過程中的變化,實現(xiàn)信息資源的整合、有效管理和長期保存。 元數(shù)據(jù)為各種形態(tài)的數(shù)字化信息單元和資源集合提供規(guī)范、普遍的描述方法和檢索工具;為分布的、由多種數(shù)字化資源有機構(gòu)成的信息體系提供整合的工具與紐帶 。如傳統(tǒng)的電視臺卡片, 片目錄、磁盤的標簽等都是元數(shù)據(jù),一張電視臺卡片上羅列的內(nèi)容有用于查找書籍的信息,如作者、書名、分類、摘要等;用于管理書籍的信息,如開本、規(guī)格、附件;用于描述保存書籍的信息,如位置、復(fù)本數(shù)等。由此可見,無論是在數(shù)字化環(huán)境還是非數(shù)字化環(huán)境,元數(shù)據(jù)都廣泛存在。隨著計算機技術(shù)的不斷推進,采用元數(shù)據(jù)來描述容量巨大、難以或無法進行人工管理的信息資源已成為一種發(fā)展趨勢。 數(shù)據(jù) 的應(yīng)用目的 元數(shù)據(jù)的基本用途就是管理數(shù)據(jù),從而實現(xiàn)查詢閱讀交換和共享。元數(shù)據(jù)是使數(shù)據(jù)發(fā)揮作用的重要條件之一,它幫助數(shù)據(jù)生產(chǎn)單位有效地管理和維護數(shù)據(jù),提供通過網(wǎng)絡(luò)對數(shù)據(jù)進行查詢檢索的方法或途徑以及與數(shù)據(jù)交換和傳輸有關(guān)的幫助信息,幫助用戶了解數(shù)據(jù),以便就數(shù)據(jù)是否滿足其需求做出正確判斷,提供有關(guān)信息以便用戶 處理和轉(zhuǎn)換,接受外部數(shù)據(jù)提供數(shù)據(jù)生產(chǎn)單位數(shù)據(jù)存貯、分類內(nèi)容、質(zhì)量交換網(wǎng)絡(luò)及數(shù)據(jù)銷售等方面的信息,便于用戶查詢檢索 13。因此,在哈佛大學(xué)數(shù)字電視臺項目里,元數(shù)據(jù)被定義為元數(shù)據(jù)描述信息資源或數(shù)據(jù)對象,其目的在于使用戶能夠發(fā)現(xiàn)資源、識別資源、評價資源,而且對相關(guān)的信息資源進行選擇定位和調(diào)用、追蹤資源。在使用過程中的變化實現(xiàn)信息資源的整合有效管理和長期保存。其應(yīng)用目的包括: ( 1)確認和檢索( 主要致力于如何幫助人們檢索和確認所需要的資源,數(shù)據(jù)元素往往限于作者、 標題、主題、位置等簡單信息, 第 2 章 數(shù)字媒體內(nèi)容管理關(guān)鍵技術(shù) 7 ( 2)著錄描述( 用于對數(shù)據(jù)單元進行詳細、全面的著錄描述,數(shù)據(jù)元素囊括內(nèi)容、載體、位置與獲取方式、制作與利用方法、甚至相關(guān)數(shù)據(jù)單元方面等,數(shù)據(jù)元素數(shù)量往往較多, ( 3)資源管理( 支持資源的存儲和使用管理,數(shù)據(jù)元素除比較全面的著錄描述信息外,還往往包括權(quán)利管理( 、 電 子簽 名 ( 、 資 源 評鑒( 使用管理( 支付審計( 方面的信息。 ( 4)資源保護與長期保存( 支持對資源進行長期保存,數(shù)據(jù)元素除對資源進行描述和確認外,往往包括詳細的格式信息、制作信息、保護條件、轉(zhuǎn)換方式( 保存責任等內(nèi)容。 數(shù)據(jù) 結(jié)構(gòu)定義方式 一個 元數(shù)據(jù) 格式由多層次的結(jié)構(gòu)予以定義: 內(nèi)容結(jié)構(gòu)( 對該 構(gòu)成元素及其定義標準進行描述。 句法結(jié)構(gòu)( 定義 構(gòu)以及如何描述這種結(jié)構(gòu)。 語義結(jié)構(gòu)( 定義 ( 1) 內(nèi)容結(jié)構(gòu)定義 術(shù)性、管理性 和 結(jié)構(gòu)性 元數(shù)據(jù) 。 管理型元數(shù)據(jù):用來管理與支配信息資源的元數(shù)據(jù),如數(shù)據(jù)存放地點、位置、排架號、訪問次數(shù),以及信息收集、 版權(quán)與翻版跟蹤、版本控制等。 描述型元數(shù)據(jù):用來描述與識別信息資源的元數(shù)據(jù),如作者、分類、摘要、關(guān)鍵幀、特征等基本信息,以及記錄編目、尋找?guī)椭?、專題索引、資源鏈接、用戶注釋等。 保存型元數(shù)據(jù):與信息資源保存管理有關(guān)的元數(shù)據(jù),如資源的物質(zhì)條件、數(shù)字資源的保存行為、數(shù)據(jù)更改與遷移等。 技術(shù)型元數(shù)據(jù):與系統(tǒng)怎樣運行有關(guān)的元數(shù)據(jù),如硬件與軟件、數(shù)字化信息的格式、壓縮比率、定標例程、系統(tǒng)響應(yīng)跟蹤、數(shù)據(jù)驗證與安全(如加密鍵、密碼)等。 這些數(shù)據(jù)元素很可能依據(jù)一定標準來選取,因此元數(shù)據(jù)內(nèi)容結(jié)構(gòu)中需要對此進行說明。 ( 2) 句法結(jié)構(gòu)定義格式結(jié)構(gòu)及其描述方式,例如 : 元素的分區(qū)分段組織、第 2 章 數(shù)字媒體內(nèi)容管理關(guān)鍵技術(shù) 8 元素選取使用規(guī)則、元素描述方法、元素結(jié)構(gòu)描述方法、結(jié)構(gòu)語句描述語言等。 ( 3) 語義結(jié)構(gòu)定義元素的具體描述方法,例如 : 描述元素時所采用的標準、最佳實踐或自定義的描述要求。 在元數(shù)據(jù)發(fā)展初期人們常使用自定義的記錄語言(例如 數(shù)據(jù)庫 記錄結(jié)構(gòu)(如 ),但隨著元數(shù)據(jù)格式的增多和互操作的要 求,人們開始采用一些標準化的 描述元數(shù)據(jù),例如 中以 有潛力。 元數(shù)據(jù)標準的制定需要從多個方面考慮 : 從檢索角度出發(fā),必須具有準確性、一致性和有效性;從技術(shù)角度出發(fā),要易于電子化、網(wǎng)絡(luò)化并且便于處理和表達;從成本的角度考慮,則應(yīng)該簡單并易于生成 14。 用 元數(shù)據(jù)標準 根據(jù)不同領(lǐng)域的數(shù)據(jù)特點和應(yīng)用需要, 90 年代以來,許多 元數(shù)據(jù) 格式在各個不同領(lǐng)域出現(xiàn) , 例如: 網(wǎng)絡(luò)資源: 文獻資料: 56 政府信息: 地理空間信息: 數(shù)字圖像: 檔案庫與資源集合: 技術(shù)報告: 807; 連續(xù)圖像: 等 與數(shù)字音視頻編目相關(guān)的元數(shù)據(jù)標準主要有 ,下面以 例介紹元數(shù)據(jù)的特點和格式。 簡稱, 都柏林核心 元數(shù)據(jù) 適合電子資源的編目, 主要特點是簡潔易用, 編目 人員不需要過多的專業(yè)培訓(xùn) ; 可擴展性較強,允許對 15 元素及其修飾詞進行擴展 ; 有利于揭示各類型信息資源的內(nèi)容和其它特性 ; 5種語言,其用戶遍及世界各地,日趨成為各國都能接受的國際標準。 簡單: 15個基本標記元素通俗易懂; 靈活:既可以用于規(guī)范資源描述領(lǐng)域,也可以用于非專業(yè)領(lǐng)域 , 適應(yīng)網(wǎng)絡(luò)化、電子化發(fā)展趨勢 ; 易于擴展:用戶還可以根據(jù)自己的需要,附加一些額外的結(jié)構(gòu)或者對語義進第 2 章 數(shù)字媒體內(nèi)容管理關(guān)鍵技術(shù) 9 行精確的定義; 一致性:己經(jīng)成為一種國際范圍內(nèi)通用的適用于資源發(fā)現(xiàn)系統(tǒng)的元數(shù)據(jù)標準。 類別 名稱 標示 說明 內(nèi)容 (標題名 (予資源的名稱 主 題 詞 或 關(guān) 鍵 詞(容的主題描述 描述 (源內(nèi)容的說明 類型 (源內(nèi)容 的特征或類型 來源 (當前資源來源的參照 與其他資源的關(guān)系 (相關(guān)資源的參照 覆蓋范圍 (源內(nèi)容所涉及的外延與覆蓋范圍 知識產(chǎn)權(quán) (作者或創(chuàng)建者 (建資源內(nèi)容的主要責任者 出版者 (資源成為可以獲得并可用的責任者 有貢獻的其他人員 (資源的內(nèi)容作出貢獻的其他實體 你 版權(quán)管理 (關(guān)資源本身所有的或被賦予的權(quán)限信息 實例 (日期 (資源生命周期中的一個事件相關(guān)的時間 資源格式 (源的物理或數(shù)字表現(xiàn)形式 語言 (述資源知識內(nèi)容的語種 資源標識 (特定的范圍內(nèi)給予資源的一個明確的標識 表 5 個元數(shù)據(jù)標記元素 于 廣播電視音像資料編目規(guī)范 的視音頻編目 視音頻數(shù)據(jù)由自身的特點,隨著電臺電視臺網(wǎng)絡(luò)化、數(shù)字化的推廣普及,電臺、電視臺的每天產(chǎn)生的以及歷史的視音頻數(shù)據(jù)的編目成為當前最大量的視音頻編目數(shù)據(jù)。當前編目標準和編目系統(tǒng)種類繁多,但我國電視節(jié)目的編目都以 廣第 2 章 數(shù)字媒體內(nèi)容管理關(guān)鍵技術(shù) 10 播電視音像資料編目規(guī)范第 1部分:電視資料 ( 基準,而廣播電臺的音頻節(jié)目的編目則以 廣播電視音像資料編目規(guī)范第 2部分:廣播資料 ( 基準。該 標準的制定和實施使得音像資料編目數(shù)據(jù)庫有 了 統(tǒng)一的設(shè)計依據(jù),同時也為編目數(shù)據(jù)的加工生產(chǎn)提供指導(dǎo)性依據(jù) ,對媒體資產(chǎn)管理具有重要意義 。 在電視音像資料中,具有獨立主題意義的、已經(jīng)制作完成的完整的視音頻資料稱之節(jié)目;具有使用價值的、可用于制作節(jié)目的視音頻資料稱之為素材;節(jié)目或素材中一段連續(xù)的視音頻,由一個以上互相關(guān)聯(lián)的場景構(gòu)成的為片段;節(jié)目或素材中背景或場面不變的一段連續(xù)的視音頻部分,由時間或空間上相關(guān)的一個或多個鏡頭構(gòu)成的為場景;同一臺攝像機一次攝錄的連續(xù)畫面,稱之鏡頭 畫面;最基本的元素 是畫面幀 。 但是由于每 段視頻 對象所包含的畫面幀數(shù)量非常巨大, 視頻資料的 編目 的范圍劃不涉及到 畫面幀 層次。而根據(jù)上述的情況來看,不同層面上制作的手法、表達的內(nèi)容大相徑庭,如果把節(jié)目 概要內(nèi)容的描述信息與鏡頭技術(shù)細節(jié)的描述信息混雜在一起,對編目和檢索再利用非常不利。 分層編目是解決視頻編目的理想方案 3。 廣播電視音像資料編目規(guī)范第 1部分:電視資料 ( 定義了電視節(jié)目資料編目的元數(shù)據(jù)框架 。 電視資料部分的元數(shù)據(jù) 總體上分為四個層次,從上到下分別是節(jié)目層、片段層、場景層、鏡 頭層。每個層次分別包含相應(yīng)的元素類,在元素類下面是各層對象的具體編目元數(shù)據(jù)項。 其中節(jié)目層包含 15個 元素類 100個描述屬性,片 段 層有 14個 元素類 52個描述屬性,場景層為 5個元素類 11個描述屬性,鏡頭層分為 6個 元素類 14個描述屬性。 例如場景層包括了“ 題名 ” 、 “ 主題 ” 、 “ 描述 ” 、 “ 格式 ” 、和 “ 關(guān)聯(lián) ” 5 種元素類, 每個元素類又有自己的描述屬性,如“ 描述 ” 元素類包含 “ 內(nèi)容描述 ” 、 “ 事件發(fā)生日期 ” 、 “ 現(xiàn)場同期聲 ” 等 3個具體的 描述屬性,這種描述屬性就是 編目元數(shù)據(jù)項。 根據(jù) 這些 編目項目 都必須定義 元數(shù)據(jù)項 的名稱、英文標識、是否必須選用、是否可多值。 互相關(guān)系如 表 2根據(jù)表中所述相互關(guān)系可見 ,元數(shù)據(jù)框架按層次逐漸細分,每個層次包含的元素類有所不同,每個元素類又由不同的具體的編目元數(shù)據(jù)項構(gòu)成。每層中即便元素類名稱相同,但其具體的編目元數(shù)據(jù)也有可能不同。如每個層次上都有的“主題”元素類,在節(jié)目層“主題”元素類有分類名、主題詞、關(guān)鍵詞三個具體編目元數(shù)據(jù)項,而在鏡頭層中,“主題”元素類只有主題詞、關(guān)鍵詞二個具體編目元數(shù)據(jù)項。 第 2 章 數(shù)字媒體內(nèi)容管理關(guān)鍵技術(shù) 11 節(jié)目層 片段層 場景層 鏡頭層 題名 主題 描述 責任者 出版者 版權(quán) 語種 日期 類型 格式 來源 關(guān)聯(lián) 題名 主題 描述 責任者 版權(quán) 語種 日期 類型 格式 題名 主題 描述 格式 關(guān)聯(lián) 題名 主題 描述 日期 格式 關(guān)聯(lián) 表 視節(jié)目分層相互關(guān)系表 規(guī)定 了分層次的 元 數(shù)據(jù)框架后,就可以對數(shù)字媒體內(nèi)容管理系統(tǒng)數(shù)據(jù)進行編目編目。 在對 這些視頻 資料進行編目時,必須從節(jié)目層開始著錄,片段層、場景層和鏡頭層的著錄可以根據(jù)實際需要靈活選擇。既可嚴格按節(jié)目層、片段層、場景層、鏡頭層逐層著錄,也可跳過任意中間層直接進行下位層的著錄,每一層都可根據(jù)需要切分出任意多個下位層。 分層的編 目方式比較靈活,可以滿足不同層次的編目需求。用戶可根據(jù)自己的業(yè)務(wù)需要來確定編目深度,如只做第一層次的編目以滿足基本檢索的需要,或進行非常細致的編目工作,以提高資源的再利用效率,減少制作成本。另外,還可以根據(jù)不同的節(jié)目類型確定不同的編目深度。例如,新聞中可能會包含比較多的具有再利用價值的鏡頭,對新聞類節(jié)目進行編目時就可以深入到鏡頭層。 儲技術(shù) 當前,隨著網(wǎng)絡(luò)技術(shù)的日趨成熟和數(shù)字 電視臺 的全面建設(shè), 電視臺 的數(shù)據(jù)存儲量急劇膨脹,數(shù)字化資源呈幾何級數(shù)增長,特別是各種全文文獻和多媒體信息資源大量增加,使得數(shù)字資源的存 儲容量需求以一種跳躍方式增長。 在現(xiàn)有的存儲系統(tǒng)中,主要有三種主流網(wǎng)絡(luò)存儲技術(shù)可供選擇: 第 2 章 數(shù)字媒體內(nèi)容管理關(guān)鍵技術(shù) 12 接連接存儲 直接連接存儲 (一個單純以共享文件訪問為目的,通過 口或光纖通道將存儲設(shè)備與服務(wù)器直接連接起來的系統(tǒng)。術(shù)和 術(shù)是當前直接連接存儲的主流技術(shù),傳輸速率可達到每通道 320Mb/s。 (1) 客戶端向服務(wù)器發(fā)送數(shù)據(jù)庫檢索的請求時,服務(wù)器接受請求并給存儲器發(fā)送訪問指 令,存儲器將讀取的數(shù)據(jù)發(fā)送至服務(wù)器內(nèi)存,最終由服務(wù)器把檢索結(jié)果傳送給客戶機,服務(wù)器實際上起到存儲轉(zhuǎn)發(fā)的作用。 應(yīng)用服務(wù)器往往同時承擔數(shù)據(jù)庫檢索和文件級信息操作的雙重任務(wù)。當并發(fā)訪問的用戶數(shù)量達到 500個時,系統(tǒng)會收到大量文件系統(tǒng)的 I/系統(tǒng)只能將其 20% 源用于響應(yīng)客戶端的 I/O 請求。在這個情況下,服務(wù)器響應(yīng)的速度變慢,勢必會影響 觀眾 的查詢速度,嚴重情況下甚至?xí)?dǎo)致系統(tǒng)的崩潰。 前期投入較少,連接在 口上的磁盤陣列。一般采用 術(shù),存儲數(shù)據(jù)本身的安全性還是比 較可靠的。但是在這種連接方式下,每臺服務(wù)器單獨擁有自己的存儲設(shè)備,任何一臺服

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論