av日韩亚洲,一本一本a久久,亚洲一区二区三区,亚洲一区二区三区免费视频

分析分布式網絡信息資源重構系統實現模式

來源:期刊VIP網所屬分類:土木工程時間:瀏覽:

  【內容提要】網絡信息資源在數量和復雜程度上的同步增長使機械遍歷式的信息搜集和檢索技術越來越難以滿足大部分用戶的信息需求。這些信息的最終用戶需要對信息個體的準確定位,對信息源的權威導航和評估,個性化的主動信息提供服務以及基于信息內容的跨平臺鏈接,而且實現這一切是以一個繁復、無序和龐大的信息世界為基礎和前提的。任何純粹基于人工智能的軟件或算法都難以提供一個完美的解決,本文試圖提出一個由分布式人機交互環境組成的網絡信息資源收集、組織和發布機制,通過這個機制,人的知識和智慧在被用來使紛繁復雜的網絡信息資源有序化的同時,又成為其中不可或缺的組成部分。

  一、網絡信息資源重構的概念和方法

  網絡信息資源是由信息組織或個人建立的以網絡為傳播媒體的數字信息生成、管理和發布系統,是微觀有序化和宏觀無序化的有機統一體。每一個網絡信息資源個體都是有序的,其所含信息內容是有組織和可訪問的;而作為一個整體,網絡信息資源又具有高度的系統復雜性,難以從整體上加以充分的利用。這就是要對網絡信息資源進行重新組織的主要原因。

  所謂網絡信息資源的重構就是針對網絡信息源及其內容,按照特定的線索化方式,由人工或計算機軟件實施的信息收集、組織、整理和傳播工作的總和。經過重構后,網絡信息資源整體(或某個局部)上成為有序化結構,并且為訪問者提供獲得其所需信息的充分檢索手段,同時,在一定程度上,不同信息源之間的物理界限在邏輯上被屏蔽。

  如果說網絡信息資源宏觀的無序化是實施其重構的主要原因的話,網絡信息資源微觀的有序化則是實施其重構的必要條件。換句話說,網絡信息資源個體有序化程度和水平,盡管不能直接導致網絡信息資源整體的有序化,但卻可以影響通過重構以實現其有序化的方式和難易。例如,一個信息源如果在信息描述、數據庫定義和訪問方式等方面遵守一定的國際標準,它就更容易成為一個網絡信息資源集合的有機組成部分。

  一個網絡信息資源集合是由若干信息源組成(如數據庫),而一個信息源又是由若干同序的信息實體組成(如數據庫記錄)。[1]因此,對于網絡信息資源的重構可以分為兩個層次:針對信息源的重構和針對信息實體的重構。針對信息源的重構將導致一種導引性的信息組織及相應的服務方式,其功能是滿足用戶對于獲知信息存放位置或信息來源的需求。針對信息實體的重構將導致一種實體性的組織方式和推送式的服務方式,其功能是直接滿足用戶對獲得信息本身的需求。前者的實例包括一些網絡資源導航、資源鏈接目錄和信息源數據庫等。而后者則正是我們正在或將要實現的。在本系統中,邏輯上信息源和信息實體被統一視為某個信息對象來加以描述、整序和管理。

  利用人工和計算機是實現網絡信息資源重構的主要手段,尤其是后者,由于其高效率和全面的信息覆蓋能力而在近幾年逐漸成為主流。[2]大型的信息導航網站(如Yahoo等)和檢索引擎(如Google等)都是利用軟件自動搜索網上的信息資源并加以組織和整理,然后供用戶檢索和使用的。人工的手段由于成本、規模和效率的限制被迫處于輔助性地位,只能應用在一些局部性的系統中。然而,由于人工智能技術的局限,計算機軟件在對信息形式和內容(尤其是內容)進行辨別、理解、描述和分析時所能達到的質量還遠遠不能和人的智力相提并論[3],特別是計算機軟件無法對信息內容的學術質量加以權威性的鑒定和評估(顯然,只有人,而且是具有一定學術背景的人才能完成這個工作)。[4]

  于是,問題被歸結為:如何在網絡信息資源的重構過程中使人的智力與計算機技術有效的結合起來。這里的“有效”應該包含三個方面的意義:可以接受的成本;足夠大的規模;充分滿足特定用戶群的信息需求。而本文提出的解決方案則可以歸結為:通過建立具有分布式網絡信息資源組織和管理功能的技術平臺,為專業學術研究人員收集、整理、組織和發布其相關學科的信息資源提供方便、科學和高效的技術手段,從而實現人的智力和計算機技術在網絡信息資源重構過程中的有機結合。

  二、分布式信息收集、組織和管理模式的實現

  分布式的網絡信息資源重構模式由三個層次組成:(1)第一層次是按學科分類組織和發布信息資源內容的學科信息服務網站群平臺,它是由信息服務中介機構(如圖書館)實施組織和管理的集中式網絡學科信息資源目錄體系和系統技術支持機制。(2)第二層次是實施分布式信息收集、組織和管理的內容管理員群體及其工具平臺,它是由具有較高學術背景和網絡信息資源獲取能力的專業研究人員,如高校教師或在讀博士生組成內容管理員群體,利用相關工具平臺建設各自專業的學科信息服務網站。(3)第三層次是提供信息交互和反饋功能的信息用戶應用平臺,它是用戶獲得由內容管理員收集、組織和發布的信息的渠道,同時用戶可以通過該平臺向相應內容管理員推薦信息資源、進行學術咨詢和其他信息交互。

  其中支持分布式內容管理的內容管理員工作平臺,即網絡資源管理系統是實現該模式主要功能的關鍵。

  網絡資源管理系統是由圖書館實施建設和管理的一個通過Web發布和展示信息資源的服務體系,由圖書館所屬高校相關教學科研人員負責收集、整理、組織和管理Internet上相應學科、專業領域的信息資源,加以評估、介紹和研究并通過圖書館的信息服務系統在網上發布,從而共同構成具有學科特點的專業信息服務網站群。

  內容管理員是在網絡資源管理系統中具有學科背景的信息收集者、組織者和發布者,對某個學科領域具有一定學術背景和興趣(最好在該領域正在從事相關教學或科研工作),具有一定的圖書館學和信息處理的學術水平,熟練掌握網絡信息搜索和獲取的技術,具有一定的協調和管理能力,并且能夠隨時監測相關信息源的信息更新情況。內容管理員是分布式內容管理機制的核心。他們把信息收集、組織和整理作為其教學科研工作的一個部分來完成,這決定了他們與一般的圖書館學科館員的主要區別。

  信息資源重構的質量很大程度上取決于對構成它的諸信息源內容的理解深度,或者使用程度。學科信息資源服務不必刻意去追求所選信息源的數量的眾多和種類的齊全,而更看重這些信息源是否最適合相關學術領域的使用需要,并具有足夠的權威性。而能夠對信息源的質量進行可靠的判斷的人,必須具有足夠的學術背景,并且在相關學科的研究前沿具有一定的活躍程度。這就對選擇和組織內容管理員隊伍提出了較高的要求。

  內容管理員介入信息收集、組織和整理工作的方式是把它作為其教學科研工作的一個部分(盡管很可能是一個從屬的部分)來完成。之所以要實現分布式的內容管理模式的主要原因也正在于此,不如此就無法充分而有效地利用高校學科專業人員從事信息服務工作的潛力。在教學科研工作過程中,信息的收集和組織本來就是一項必不可少的工作,對于本學科相關網絡信息資源的了解和使用水平也越來越成為高校教師研究能力的重要標志之一。利用分布式的內容管理機制,把分散于學校各個角落的學科信息服務力量組織起來,無疑是高校圖書館建設網絡信息資源的有效途徑。

  傳統圖書館(包括高校圖書館)在信息服務過程中主要起到信息資源指引中介的作用,而較少起到信息咨詢中介作用,尤其是當這種咨詢具有較強的學科特點和學術深度時。而在本文所構建的模式中,內容管理員利用其優越的學術背景和分布式、交互式的信息組織和發布工具,可以最大限度地將其智力和學科知識體現在相關學科的信息服務中。這種體現既表現為對靜態的和外部的信息資源收集、組織和評價的質量與深度,還表現為內容管理員可以通過系統的信息交互平臺直接解答讀者的學術問題,也就是將其大腦中的智力和知識動態化地提供給讀者。這也就是前文中提到過的通過這個機制,人的知識和智慧在被用來使紛繁復雜的網絡信息資源有序化的同時,又成為其中不可或缺的組成部分。在這里,內容管理員既是學科信息的收集者和組織者,很可能同時又是某些信息的生成者。

  網絡應用的日益普及為分布式內容管理提供了技術上的可行性,而網絡資源管理系統則為它的實施提供了管理上的可行性。[5]同時,隨著電子文獻在數量和質量上的迅速增長,人們在教學科研過程中對電子信息資源的依賴程度和掌握能力也同步地增長,這就為內容管理員群體提供了越來越充分的人力資源背景。

  三、網絡資源管理系統的設計和開發網絡信息資源重構的工具平臺

  設計和開發網絡資源管理系統是實現分布式網絡信息資源重構模式的核心任務,一個功能完善的網絡資源管理系統能夠起到以下作用:

  ·向讀者提供網絡信息資源的宏觀和微觀視圖以及相應的訪問方式;

  ·向內容管理員提供便利、高效的信息收集、組織和發布工具平臺;

  ·向系統管理員提供用戶管理、資源監測、資源評估等系統管理功能。

  以下筆者將根據在主持清華大學圖書館“985”電子圖書館建設項目的課題“網絡資源管理系統的開發和應用”過程中的思路和經驗,對網絡資源管理系統的結構和功能加以概括。如圖1所示:

  附圖

  圖1 網絡資源導航系統總體結構

  網絡資源管理系統包括5個方面的內容:

  (一)網絡資源的描述。網絡資源的描述是通過對相關元數據的制訂來實施的,經過調研,確定以專門用來組織網絡資源并且易于操作的都柏林元數據核心元素集(Dublin Metadata Core Element Set,簡稱DC)為基本集合,結合用戶的檢索要求、網絡資源的特點以及系統的信息挖掘、資源監測和評估等高級功能,增加了相應的屬性,制定出一套用以幫助識別、描述、定位、組織和管理網絡資源的元數據集合:網絡資源管理元數據(Network Resource Management Metadata,簡稱NRMM)。

  (二)網絡資源收集、整理、組織和發布工具。工具平臺包括各級用戶注冊模塊、內容管理員資源添加、管理和維護模塊、內容管理員站務管理模塊和普通用戶推薦資源模塊。在網絡信息導航系統平臺上,系統的功能分為兩種:

  第一種是需要人工參與的,包括面向系統管理員、內容管理員和普通用戶等三種參與者的相應功能。其中,系統管理員具有最高權限,包括管理內容管理員和用戶的屬性信息、設置學科等;內容管理員負責分布式地收集、標引、組織和發布網絡信息資源,以及審查由用戶推薦的資源;普通用戶可以瀏覽系統內現有資源和推薦新資源供內容管理員審查,同時還可進行信息反饋和交互。

  另一種系統功能是由系統自動執行的,具體包括網絡信息源的自動監測和質量評估、網絡信息挖掘和提供。

  (三)網絡信息源的自動監測和質量評估。網絡信息導航庫的資源質量控制是通過人工審核和自動監測相結合來實現的,網絡資源管理系統主要提供自動監測和基于自動獲取指標數據的質量評估機制。[6][7]由于網上資源的變動性很大,因此,為了保證系統中資源的可用性和新穎性,這種定期監測評估是必需的。

  針對學術性資源,主要著眼于網站的內容和它的結構與系統機能進行評估。由于本系統所收集的網站信息資源已經十分龐雜,采取人工方式進行評估耗時耗力,因此,采取軟件實時測試的自動評估方式。目前,將測試指標定為網站的鏈接狀態和特征頁面信息提取等幾項,同時會記錄每一個被監測對象的監測時間和監測周期,通過系統定時執行監測程序并保存監測結果。監測結果最終會向系統的內容管理員發出監測報告的通知,從而起到保持和維護信息資源系統的監督作用。

  (四)網絡信息挖掘和提供。采用內容管理員模式來收集專業網絡資源,提高了資源的精度和深度,但是,網絡資源浩如煙海,光靠內容管理員人工查找是無法達到廣度要求的。因此,采用自動抓取和人工過濾相結合的方式,即用非結構化的數據挖掘技術獲取更有價值的信息。

  數據挖掘一般包含如下幾個步驟:(1)理解相應的問題領域;(2)準備相關數據子集;(3)發現模式(數據挖掘);(4)所發現模式的后處理;(5)應用發現結果。本系統中數據挖掘部分的工作流程主要分以下幾步:建立關鍵詞表、源文檔采集、信息過濾、用戶瀏覽信息。[8]

  數據挖掘部分是一個人機結合的部分,它通過分工使人和計算機的特長都得到了充分的發揮。數據挖掘功能大大減輕了內容管理員的工作負擔,增加了系統中網絡資源的深度和廣度,并且有一定智能性,可以對搜索到的數據進行剔重、加權等處理。

  (五)讀者信息反饋和交互。網絡信息資源導航的最終目的是幫助網絡信息用戶更充分,更有效地利用各種網絡信息資源,服務于用戶的學術研究、教學和學習。用戶與系統之間、用戶與用戶之間的信息交互會在達成上述目的的過程中起到重要的作用。網絡資源管理系統主要提供以下5種信息交互模式:用戶網上調查、用戶留言、電子公告版、網上傳呼和在線討論區。除了上述用戶主動信息提供方式外,系統還會在用戶使用系統各種功能和資源的過程中自動收集、整理和分析用戶的操作信息,如點擊頁面、鏈接選擇、輸入檢索詞等,從中了解用戶的需求和學科興趣,為向用戶提供個性化服務收集相關信息。

  用戶信息反饋和交互是網絡資源管理系統的重要功能,它的實現被分散在系統的各種模塊中,使系統更加友好和智能化。

主站蜘蛛池模板: 五莲县| 军事| 修文县| 连州市| 沙河市| 同心县| 大悟县| 金山区| 沂南县| 福州市| 涞源县| 疏附县| 镇安县| 武定县| 高碑店市| 大庆市| 扬州市| 滦平县| 兴山县| 旬邑县| 杭锦后旗| 深州市| 康保县| 伽师县| 平果县| 雅江县| 洞头县| 永寿县| 贵州省| 宣恩县| 洪江市| 岫岩| 全椒县| 灵川县| 云安县| 义马市| 南开区| 阜平县| 克山县| 山西省| 崇州市|