《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 通信與網(wǎng)絡(luò) > 設(shè)計(jì)應(yīng)用 > 治安信息五要素智能搜索引擎研究及應(yīng)用
治安信息五要素智能搜索引擎研究及應(yīng)用
來(lái)源:微型機(jī)與應(yīng)用2011年第14期
楊令省1,,唐金文2
(1.曲靖師范學(xué)院 數(shù)學(xué)與信息科學(xué)學(xué)院,云南 曲靖655011,; 2.曲靖師范學(xué)院 計(jì)算機(jī)科學(xué)與工程
摘要: 如何把分散的信息有效組織起來(lái),,實(shí)現(xiàn)跨部門,、跨地區(qū)的信息共享,,是金盾工程建設(shè)必須解決的一個(gè)關(guān)鍵問(wèn)題,。主要介紹如何圍繞“人,、地,、物,、事件、組織”治安信息五要素的業(yè)務(wù)模型,,利用Web Services,、UDDI等技術(shù)創(chuàng)建智能搜索引擎,實(shí)現(xiàn)全省范圍內(nèi)治安信息五要素關(guān)聯(lián)查詢及異構(gòu)系統(tǒng)間的全網(wǎng)漫游,。
Abstract:
Key words :

摘  要: 如何把分散的信息有效組織起來(lái),,實(shí)現(xiàn)跨部門、跨地區(qū)的信息共享,,是金盾工程建設(shè)必須解決的一個(gè)關(guān)鍵問(wèn)題,。主要介紹如何圍繞“人、地,、物,、事件、組織”治安信息五要素的業(yè)務(wù)模型,,利用Web Services,、UDDI等技術(shù)創(chuàng)建智能搜索引擎,,實(shí)現(xiàn)全省范圍內(nèi)治安信息五要素關(guān)聯(lián)查詢異構(gòu)系統(tǒng)間的全網(wǎng)漫游。
關(guān)鍵詞: 治安信息五要素,;關(guān)聯(lián)查詢,;異構(gòu)系統(tǒng);數(shù)據(jù)漫游

    近年來(lái),,公安信息系統(tǒng)從簡(jiǎn)單的信息處理向以數(shù)據(jù)為中心的數(shù)據(jù)共享和關(guān)聯(lián)的復(fù)雜應(yīng)用轉(zhuǎn)變,治安信息五要素智能搜索引擎就是采用先進(jìn)的計(jì)算機(jī)技術(shù)如Web Services,、SOAP,、UDDI、XML,、WSDL,、分布式技術(shù)等構(gòu)建的應(yīng)用系統(tǒng),旨在實(shí)現(xiàn)全省范圍內(nèi)人,、地,、物、組織,、事件的關(guān)聯(lián)查詢及異構(gòu)系統(tǒng)間的全網(wǎng)漫游,;實(shí)現(xiàn)分布在全省不同地方的不同系統(tǒng)間或系統(tǒng)本身的五要素關(guān)聯(lián)查詢,并能實(shí)現(xiàn)定義與發(fā)現(xiàn)異構(gòu)數(shù)據(jù)源,,能自定義搜索條件與搜索結(jié)果的展現(xiàn)方式,,容易和其他系統(tǒng)對(duì)接。治安信息智能搜索引擎的成功實(shí)施推動(dòng)全省公安信息化的發(fā)展,。
1 治安信息五要素模型
1.1 五要素關(guān)系模型

    隨著全國(guó)公安信息化建設(shè)的深入,,國(guó)內(nèi)各級(jí)公安在實(shí)踐的基礎(chǔ)上,總結(jié)出治安信息的五要素模型為[1]:人,、地,、物、組織,、事件,。人指自然人;地指地理位置,;物指生物或非生物,;組織是一種社會(huì)實(shí)體,它是人,、地,、物等要素之間的一種穩(wěn)態(tài)關(guān)系;事件是導(dǎo)致人,、地,、物,、組織等要素關(guān)系發(fā)生變化的特殊要素,即事件使各要素從一種相對(duì)穩(wěn)態(tài)關(guān)系轉(zhuǎn)變?yōu)榱硪环N相對(duì)穩(wěn)態(tài)關(guān)系,。事件是體現(xiàn)動(dòng)態(tài)和關(guān)聯(lián)的重要環(huán)節(jié),,只有處理好事件的表述方式,才可以將五要素信息進(jìn)行有機(jī)的組織,,達(dá)到體現(xiàn)“動(dòng)態(tài)全息”的目的,。五要素關(guān)系模型見(jiàn)圖1。

    理想情況下,,同一實(shí)體在全省公安系統(tǒng)(甚至在全國(guó)公安系統(tǒng))中應(yīng)只有一個(gè)對(duì)應(yīng)要素,,所有要素可以唯一標(biāo)識(shí),要素之間的各種聯(lián)系是有機(jī)和完整的,。但在實(shí)際條件約束下,,由于種種原因?qū)е乱氐闹貜?fù)創(chuàng)建:公安不同的應(yīng)用系統(tǒng)可能對(duì)同一實(shí)體分別在本系統(tǒng)內(nèi)重復(fù)創(chuàng)建對(duì)應(yīng)要素;以地市級(jí)為中心建立治安信息系統(tǒng)時(shí),,導(dǎo)致同一實(shí)體在不同城市系統(tǒng)內(nèi)創(chuàng)建對(duì)應(yīng)要素等,。所以,為簡(jiǎn)單起見(jiàn),,這里假定治安管理信息“五要素”業(yè)務(wù)模型為:地市內(nèi)各治安業(yè)務(wù)之間做到要素唯一創(chuàng)建,、唯一標(biāo)識(shí)、末態(tài)屬性唯一,、有機(jī)關(guān)聯(lián),;地市之間,要素可以重復(fù)創(chuàng)建,,通過(guò)唯一標(biāo)識(shí)彼此識(shí)別,,進(jìn)一步獲取要素的各方面信息;提供與數(shù)據(jù)庫(kù),、文件服務(wù)器間的交互支持,,提供數(shù)據(jù)存儲(chǔ)與業(yè)務(wù)對(duì)象的映射,通過(guò)“五要素”業(yè)務(wù)模型協(xié)助解決數(shù)據(jù)庫(kù)在性能與訪問(wèn)平衡中的問(wèn)題,,實(shí)現(xiàn)數(shù)據(jù)庫(kù)組織策略調(diào)整對(duì)業(yè)務(wù)系統(tǒng)的無(wú)關(guān)性,。
1.2 五要素?cái)?shù)據(jù)分布
    目前全省范圍內(nèi)治安信息系統(tǒng)分布在省廳、各地州,、各縣區(qū)和各派出所,。有些系統(tǒng)是使用省中心庫(kù),如省級(jí)人口信息系統(tǒng),;有些是使用地市集中庫(kù),,如重點(diǎn)人口系統(tǒng);有些是工作數(shù)據(jù)庫(kù)分布在派出所,,再將數(shù)據(jù)庫(kù)集中到區(qū)縣庫(kù)和地州庫(kù),,如現(xiàn)有的實(shí)有人口管理系統(tǒng),。五要素?cái)?shù)據(jù)分布網(wǎng)絡(luò)結(jié)構(gòu)模型見(jiàn)圖2。
    從圖2可以看出,,五要素?cái)?shù)據(jù)可能分布在不同的地理位置和存儲(chǔ)于不同的系統(tǒng)中,,公安機(jī)關(guān)各職能部門通常都有自己的應(yīng)用系統(tǒng),而且建設(shè)模式基本上覆蓋了省,、地市,、區(qū)縣、派出所四級(jí)應(yīng)用,。智能搜索引擎就是要實(shí)現(xiàn)跨部門,、跨區(qū)域和異構(gòu)數(shù)據(jù)的漫游查詢,以Web Service的方式為治安工作人員提供統(tǒng)一的操作界面,,屏蔽平臺(tái)的差異性。

 

 

2 治安信息五要素智能搜索引擎體系結(jié)構(gòu)
    從上述模型來(lái)看,,如此龐大的治安管理信息系統(tǒng),,各自的實(shí)現(xiàn)方式是不同的,如何有效地控制調(diào)用這些不存在主從關(guān)系的子系統(tǒng),、事務(wù)和模塊,,如何組織動(dòng)態(tài)的鏈接、模塊之間如何通信等,,是智能搜索引擎需解決的主要問(wèn)題,,因此提出如圖3所示的體系結(jié)構(gòu)。

    整個(gè)搜索引擎分為3個(gè)層次:用戶層,、應(yīng)用層和數(shù)據(jù)層,。其中,用戶層只和用戶交互,,不進(jìn)行任何業(yè)務(wù)處理,,實(shí)際上就是只有客戶端。應(yīng)用層包含系統(tǒng)中業(yè)務(wù)邏輯的實(shí)現(xiàn)和數(shù)據(jù)訪問(wèn)控制,。應(yīng)用層由.net程序及XML Web Services 實(shí)現(xiàn),,并使用SOAP協(xié)議與客戶端連接。應(yīng)用層中的事務(wù)日志,、用戶狀態(tài)管理,、五要素?cái)?shù)據(jù)源與數(shù)據(jù)表現(xiàn)定義、管理工具,、主搜索引擎,、五要素資源注冊(cè)中心等都在省中心應(yīng)用服務(wù)器上運(yùn)行,搜索數(shù)據(jù)庫(kù)分布在省中心數(shù)據(jù)庫(kù)服務(wù)器上運(yùn)行,。智能搜索引擎中,,應(yīng)用層的主要功能如下[2],。
    (1)單點(diǎn)登錄和用戶狀態(tài)管理:用戶只需一次登錄系統(tǒng),就能操作權(quán)限范圍內(nèi)的功能菜單,,并為每一個(gè)登錄的用戶保存狀態(tài)信息和記錄用戶的查詢操作信息,。
    (2)五要素?cái)?shù)據(jù)源配置與數(shù)據(jù)表現(xiàn)自定義管理:對(duì)新接入的系統(tǒng)進(jìn)行數(shù)據(jù)源配置,系統(tǒng)不用修改程序代碼便可掛接新系統(tǒng),,用戶可自定義查詢結(jié)果展現(xiàn)方式,。
    (3)分析處理器:接收并分析用戶的查詢請(qǐng)求,訪問(wèn)UDDI注冊(cè)中心,,調(diào)用搜索引擎,,并返回?cái)?shù)據(jù)。
    (4)主搜索引擎:搜索任務(wù)分配的中心調(diào)度器,。系統(tǒng)從客戶端接收到查詢請(qǐng)求后,,主搜索引擎便對(duì)查詢請(qǐng)求進(jìn)行分析,把任務(wù)分發(fā)到對(duì)應(yīng)的子搜索引擎,,從子搜索引擎接收數(shù)據(jù),,并返回客戶端數(shù)據(jù)。主搜索引擎與各子搜索引擎定時(shí)互發(fā)路由消息,,以便主搜索引擎掌握各子搜索引擎的路由情況,。
    (5)子搜索引擎:實(shí)現(xiàn)用戶定義系統(tǒng)的接入,并把相關(guān)信息發(fā)送到中心,;承擔(dān)主搜索引擎發(fā)送來(lái)的查詢?nèi)蝿?wù),,并返回主搜索引擎所需數(shù)據(jù);定時(shí)發(fā)送路由信息給主搜索引擎,,以便主搜索引擎掌握各子搜索引擎的路由情況,。
    (6)五要素同級(jí)分布搜索:對(duì)該子搜索引擎管轄范圍內(nèi)的同一地區(qū)級(jí)的數(shù)據(jù)庫(kù)進(jìn)行搜索。
    (7)系統(tǒng)間和子系統(tǒng)五要素關(guān)聯(lián)查詢:系統(tǒng)與系統(tǒng)間的關(guān)聯(lián)查詢,,統(tǒng)一系統(tǒng)內(nèi)五要素的關(guān)聯(lián)查詢,,并返回?cái)?shù)據(jù)。
    (8)數(shù)據(jù)源適配器:調(diào)用與目標(biāo)數(shù)據(jù)庫(kù)對(duì)應(yīng)的驅(qū)動(dòng)程序,,直接與數(shù)據(jù)庫(kù)打交道,,向數(shù)據(jù)庫(kù)發(fā)送查詢命令,并取得數(shù)據(jù)的模塊,。
    (9)五要素漫游搜索:有異步返回?cái)?shù)據(jù)功能,,當(dāng)子搜索引擎接收到漫游查詢后,啟動(dòng)五要素漫游搜索線程,,在足夠多的時(shí)間內(nèi)搜索目標(biāo)數(shù)據(jù)庫(kù),,將搜索所得的數(shù)據(jù)放入漫游數(shù)據(jù)隊(duì)列,并返回給主搜索引擎,。
    (10)五要素資源注冊(cè)中心:對(duì)主搜索引擎注冊(cè),,使得主搜索引擎通過(guò)注冊(cè)中心被系統(tǒng)程序發(fā)現(xiàn)和調(diào)用,。
    采用Web Services[3,4]技術(shù)將功能組件封裝成一個(gè)整體的服務(wù),以UDDI的方式注冊(cè)發(fā)布,。通過(guò)五要素引擎把所有的程序組織起來(lái),,把物理位置分布不同、運(yùn)行環(huán)境不同,、功能相對(duì)獨(dú)立的系統(tǒng)信息統(tǒng)一起來(lái),,模塊之間的搭線連接由搜索引擎去實(shí)現(xiàn);系統(tǒng)對(duì)用戶而言以瀏覽器為表現(xiàn)方式,,網(wǎng)絡(luò)就是一個(gè)面向服務(wù)的大計(jì)算機(jī),,這就突破了傳統(tǒng)的分布式計(jì)算模型在通信、應(yīng)用范圍等方面的限制,。這就是五要素智能搜索引擎“無(wú)所不在的計(jì)算”的核心思想,。
3 智能搜索引擎關(guān)鍵技術(shù)介紹
3.1 分布式數(shù)據(jù)適配器

    治安信息智能搜索引擎涉及的業(yè)務(wù)數(shù)據(jù)量大,而且這些數(shù)據(jù)廣泛分布在不同的應(yīng)用系統(tǒng)中,,每個(gè)系統(tǒng)采用的數(shù)據(jù)庫(kù)可能不相同,,要訪問(wèn)這些數(shù)據(jù)庫(kù),不可能為每種數(shù)據(jù)庫(kù)分別編寫數(shù)據(jù)訪問(wèn)代碼,,而且搜索引擎有時(shí)需要同時(shí)訪問(wèn)多種數(shù)據(jù)庫(kù)。為此,,專門設(shè)計(jì)實(shí)現(xiàn)了一個(gè)數(shù)據(jù)適配器,,用于訪問(wèn)分布式的異構(gòu)數(shù)據(jù)庫(kù)[5],其實(shí)現(xiàn)框架如圖4所示,。

    分布式數(shù)據(jù)適配器綜合利用線程技術(shù),、Web Service技術(shù)和搜索引擎提供的統(tǒng)一數(shù)據(jù)訪問(wèn)器和路由表服務(wù)實(shí)現(xiàn)五要素信息的漫游查詢。
3.2 系統(tǒng)之間接口標(biāo)準(zhǔn)和五要素元數(shù)據(jù)標(biāo)準(zhǔn)
    系統(tǒng)把各種異構(gòu)數(shù)據(jù)按五要素模型標(biāo)準(zhǔn)建模,由各種異構(gòu)數(shù)據(jù)自身體現(xiàn)五要素的內(nèi)外聯(lián)系,使得搜索引擎以統(tǒng)一的接口處理各種異構(gòu)業(yè)務(wù)數(shù)據(jù),。首先,,將各種系統(tǒng)按五要素分類,并以某些關(guān)鍵字的組合關(guān)聯(lián)起來(lái),;再次,,將系統(tǒng)中的各種表信息按五要素分類,并以系統(tǒng)內(nèi)部的某些關(guān)鍵字關(guān)聯(lián)起來(lái),;最后,,用特定的標(biāo)準(zhǔn)描述各種系統(tǒng)需要表現(xiàn)的具體信息,并予以定義,。
3.3 分布式數(shù)據(jù)庫(kù)處理技術(shù)
    搜索引擎提供通用數(shù)據(jù)訪問(wèn)適配技術(shù)解決分布式異構(gòu)數(shù)據(jù)庫(kù)訪問(wèn)難題,,本技術(shù)可以有效、安全地訪問(wèn)部署在防火墻后的各種異構(gòu)數(shù)據(jù)庫(kù),,并支持統(tǒng)一的標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)語(yǔ)言,,使系統(tǒng)在統(tǒng)一數(shù)據(jù)庫(kù)語(yǔ)言標(biāo)準(zhǔn)下,,從而簡(jiǎn)化了開(kāi)發(fā)難度。采用同步和異步Web Service提取數(shù)據(jù)的技術(shù)來(lái)實(shí)現(xiàn),。
3.4 搜索算法
    搜索引擎算法主要有:關(guān)鍵字搜索,、智能搜索路徑、智能搜索深度優(yōu)化算法等,。關(guān)鍵字搜索就是利用系統(tǒng)間的關(guān)聯(lián)關(guān)鍵字對(duì)相關(guān)系統(tǒng)進(jìn)行分布式抓取數(shù)據(jù),,并在主搜索引擎重組數(shù)據(jù)并表現(xiàn);智能搜索路徑是基于系統(tǒng)之間的關(guān)聯(lián),,如??谙到y(tǒng)與派出所綜合系統(tǒng)的關(guān)聯(lián),派出所綜合系統(tǒng)與重點(diǎn)人口的關(guān)聯(lián)等,,也就是說(shuō)可以形成很多關(guān)系鏈,,而這些關(guān)系鏈也許是閉合的,也許是開(kāi)放的,,錯(cuò)綜復(fù)雜,,所以采用智能搜索路徑,從主搜索系統(tǒng)開(kāi)始,,排列不同的分支系統(tǒng),,并按順序搜索數(shù)據(jù);智能搜索深度優(yōu)化根據(jù)系統(tǒng)的多少和執(zhí)行快慢,,自由定義分支系統(tǒng)的搜索路徑深度,,因?yàn)樗阉饕娴乃阉魇前凑找欢ǖ乃阉髀窂剿阉鞯摹?br /> 3.5 治安五要素信息UDDI注冊(cè)中心
    使用微軟的UDDI注冊(cè)中心作為治安五要素信息注冊(cè)中心來(lái)公布主搜索引擎服務(wù)接口。通過(guò)該接口,,其他系統(tǒng)認(rèn)證后可以發(fā)現(xiàn)并使用搜索引擎的服務(wù)并得到所需要的信息,。
    鑒于全省治安信息數(shù)據(jù)的分布特性和各系統(tǒng)數(shù)據(jù)標(biāo)準(zhǔn)的不統(tǒng)一性,本文分析了五要素?cái)?shù)據(jù)模型和元數(shù)據(jù)標(biāo)準(zhǔn),,提出基于Web Service技術(shù)的治安信息五要素智能搜索引擎體系結(jié)構(gòu),,并利用線程、UDDI,、SOAP等技術(shù)實(shí)現(xiàn)五要素信息的關(guān)聯(lián)查詢和漫游查詢,,實(shí)現(xiàn)全省范圍內(nèi)治安信息的“一站式”搜索。智能搜索引擎的設(shè)計(jì)和實(shí)現(xiàn)充分考慮系統(tǒng)的靈活性,,把業(yè)務(wù)組件封裝成Web Service與可重用性構(gòu)件,,這樣系統(tǒng)具有易擴(kuò)展性。目前系統(tǒng)已投入運(yùn)行,,并取得了一定的成效,。但怎樣定義元數(shù)據(jù)標(biāo)準(zhǔn)才能使查詢更有效還有待進(jìn)一步研究,對(duì)多線程的管理控制也有待改進(jìn)。由于是基于Web Service技術(shù)實(shí)現(xiàn)的,,如果把SOAP的思想用到設(shè)計(jì)中,,系統(tǒng)是否更健壯等是下一步工作的內(nèi)容。
參考文獻(xiàn)
[1] 云南省公安廳.五要素引擎可行性研究報(bào)告[R].昆明:2003.
[2] 昆明世科網(wǎng)絡(luò)技術(shù)有限公司.五要素系統(tǒng)需求分析[R].昆明:2004.
[3] PAPAZOGLOU M.Web Services:principles and technology[M].Prentice Hall, 1 editon(September 23,2007).
[4] HONZLER S.XML完全探索[M].陶陽(yáng),,嵩敬波,,王鋒,譯.北京:中國(guó)青年出版社,,2000.
[5] COYLE F P.XML,、WEB服務(wù)和數(shù)據(jù)革命[M].袁勤勇,吳青,,譯.北京:清華大學(xué)出版社,,2003.
 

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載,。