政務(wù)服務(wù)信息技術(shù)崗位做什么 [論新信息技術(shù)對(duì)政務(wù)革新的作用]
發(fā)布時(shí)間:2020-02-16 來(lái)源: 短文摘抄 點(diǎn)擊:
摘要:信息技術(shù)越來(lái)越多地應(yīng)用于社會(huì)多種領(lǐng)域,政務(wù)處理當(dāng)然也不例外。本文討論了政務(wù)處理方法的歷程,重點(diǎn)突出了新的信息技術(shù)對(duì)政務(wù)的革新作用。最后以檢察院為例提出具體應(yīng)用數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)的有效方法,輔助政府獲得潛在的知識(shí)信息。
關(guān)鍵詞:信息技術(shù);數(shù)據(jù)倉(cāng)庫(kù);數(shù)據(jù)挖掘;政務(wù)
中圖分類號(hào):TP399 文獻(xiàn)標(biāo)識(shí)碼:A
在信息時(shí)代,信息技術(shù)的快速發(fā)展對(duì)社會(huì)各個(gè)領(lǐng)域都產(chǎn)生了一定的影響,在電子商務(wù)中反映尤為突出。電子政務(wù)的出現(xiàn)相對(duì)較晚,但據(jù)國(guó)外學(xué)者研究表明大約80%以上的重要信息資源掌握在政府手中,所以許多國(guó)家都將電子政務(wù)作為本國(guó)在信息技術(shù)應(yīng)用領(lǐng)域的首要任務(wù)。
1 政務(wù)狀況分析
政府不僅是處理人民群眾日常事務(wù)的單位,它更重要的作用體現(xiàn)在可以反映群眾的多數(shù)意見(jiàn)和分析社會(huì)大范圍的特征,并以此幫助人民群眾和社會(huì)向更好的方向發(fā)展。政府對(duì)這些事務(wù)的處理到目前為止經(jīng)歷了人工和計(jì)算機(jī)處理的兩大階段。
。ㄒ唬┤斯ぬ幚黼A段
為了反映較大范圍人民群眾的整體特征,政府經(jīng)常要付出龐大的人力和物力收集大量數(shù)據(jù)。這個(gè)數(shù)據(jù)的收集通常要經(jīng)歷一個(gè)較長(zhǎng)的時(shí)間,間隔一段時(shí)間還必須重復(fù)執(zhí)行。比如犯罪規(guī)律調(diào)查、經(jīng)濟(jì)普查、群眾意向調(diào)查等。然而,分析收集來(lái)的海量數(shù)據(jù)更是政府頭疼的一件事。
還沒(méi)有出現(xiàn)計(jì)算機(jī)前,光靠人工來(lái)處理數(shù)據(jù)有時(shí)還會(huì)面臨這樣的窘境:上一期的數(shù)據(jù)結(jié)果還沒(méi)分析出來(lái),下一期的數(shù)據(jù)收集又要開(kāi)始了,因此整個(gè)數(shù)據(jù)收集和分析工作變得沒(méi)有任何意義。另外,有些數(shù)據(jù)需要間隔一段時(shí)間重新收集,然后分析短期和長(zhǎng)期的數(shù)據(jù)。比如經(jīng)濟(jì)普查,若政府制定每5年一次經(jīng)濟(jì)普查,則每5年政府就可以做一次短期經(jīng)濟(jì)狀況分析。但是政府不僅只要知道近5年來(lái)的經(jīng)濟(jì)狀況,還需知道近10年、近20年、50年甚至更長(zhǎng)時(shí)間的經(jīng)濟(jì)發(fā)展?fàn)顩r,那么光靠人工去翻閱以前的數(shù)據(jù)就是件很困難的工作了。所以人工處理數(shù)據(jù)階段,有許多政務(wù)受到很大的限制。
。ǘ┯(jì)算機(jī)處理階段
自計(jì)算機(jī)出現(xiàn)后,許多領(lǐng)域的工作發(fā)生了翻天覆地的變化,政務(wù)處理同樣也不會(huì)忽略如此有效的手段。隨著計(jì)算機(jī)在各政府部分的使用,逐漸出現(xiàn)了“電子政務(wù)(Electronic Government,即EG)”。20世紀(jì)80年代以來(lái),我國(guó)一直關(guān)注電子政務(wù),2001年電子政務(wù)被列入國(guó)家“十五”發(fā)展規(guī)劃。電子政務(wù)的發(fā)展大致經(jīng)歷了以下三個(gè)階段:面向數(shù)據(jù)處理的第一代電子政務(wù)、面向信息處理的第二代電子政務(wù)、面向知識(shí)處理的第三代電子政務(wù)。在前兩個(gè)階段中,許多政務(wù)工作確實(shí)提高了效率,但是政府海量數(shù)據(jù)中隱含的價(jià)值仍不能被有效發(fā)掘。正如在一大座金山中,獲取更有價(jià)值的黃金還需更細(xì)致更有效的清理和挖掘。
雖然在前些年,各級(jí)政府部門(mén)具備了一定的信息化基礎(chǔ)設(shè)施,為構(gòu)建電子政務(wù)系統(tǒng)奠定了基礎(chǔ)。但是,由于缺乏統(tǒng)一的規(guī)劃,各政務(wù)系統(tǒng)成了一個(gè)個(gè)“信息孤島”,也沒(méi)有有效的方法從海量數(shù)據(jù)資源中快速挖掘有價(jià)值的知識(shí)信息。因此,耗費(fèi)成本收集的數(shù)據(jù)沒(méi)有利用就被棄置了,政府也不能夠發(fā)揮出更多潛在的社會(huì)價(jià)值。
由于信息技術(shù)的發(fā)展,電子政務(wù)逐漸進(jìn)入第三代發(fā)展中,即有效應(yīng)用數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)挖掘知識(shí)。
2 DW和DM技術(shù)
數(shù)據(jù)倉(cāng)庫(kù)(DataWare,即DW)是指一個(gè)面向主題的、集成的、非易失的且隨時(shí)間變化的數(shù)據(jù)集合,用來(lái)支持管理人員的決策[1]。當(dāng)大量的數(shù)據(jù)被整合在一起后,從用戶分析角度來(lái)看,使用這些數(shù)據(jù)的手段是多方面和多層次的。面向知識(shí)處理的EG系統(tǒng)應(yīng)能夠自動(dòng)剔除掉不需要的數(shù)據(jù),按照用戶的要求整合雜亂的數(shù)據(jù)資源,獲取某些可用的屬性。而且,政府的決策通常是經(jīng)過(guò)觀察長(zhǎng)期社會(huì)發(fā)展的狀況而制定的。這其間,需要分析5年、10年,甚至幾十年的大量相關(guān)數(shù)據(jù)資源。因此,政府?dāng)?shù)據(jù)需要被長(zhǎng)期、且穩(wěn)定的存儲(chǔ)。在日常收集數(shù)據(jù)和整理數(shù)據(jù)時(shí),利用數(shù)據(jù)倉(cāng)庫(kù)的思想來(lái)進(jìn)行有利于我們充分發(fā)揮數(shù)據(jù)挖掘技術(shù)進(jìn)行知識(shí)的挖掘。
數(shù)據(jù)挖掘(Data Mining,即DM)是指從大量的數(shù)據(jù)中,抽取出潛在的、有價(jià)值的知識(shí)(模型或規(guī)則)的過(guò)程。數(shù)據(jù)挖掘就是從大量數(shù)據(jù)中提取或“挖掘”知識(shí)。
首先,我們要確定數(shù)據(jù)挖掘的對(duì)象有哪些。數(shù)據(jù)資源可以從多種方面獲得,如系統(tǒng)分析設(shè)計(jì)人員向不同范圍的業(yè)務(wù)對(duì)象調(diào)研獲得,或反之業(yè)務(wù)對(duì)象主動(dòng)向系統(tǒng)設(shè)計(jì)人員提出;在互聯(lián)網(wǎng)時(shí)代,從網(wǎng)絡(luò)中獲得數(shù)據(jù)資源更快更多了。
其次,要有效地應(yīng)用數(shù)據(jù)挖掘技術(shù),就要遵循科學(xué)的應(yīng)用流程。一般的挖掘流程是:(1)確定挖掘?qū)ο;?)數(shù)據(jù)準(zhǔn)備;(3)數(shù)據(jù)挖掘,即模式提;(4)結(jié)果分析,即模式評(píng)估。[2]
數(shù)據(jù)挖掘功能用于指定數(shù)據(jù)挖掘任務(wù)中要找的模式類型。數(shù)據(jù)挖掘任務(wù)一般可以分為兩類:描述和預(yù)測(cè)。描述性挖掘任務(wù)刻畫(huà)數(shù)據(jù)庫(kù)中數(shù)據(jù)的一般特性。預(yù)測(cè)性挖掘任務(wù)在當(dāng)前數(shù)據(jù)上進(jìn)行推斷,以進(jìn)行預(yù)測(cè)。數(shù)據(jù)挖掘系統(tǒng)要能夠挖掘多種類型的模式,以適應(yīng)不同的用戶需求或不同的應(yīng)用。數(shù)據(jù)挖掘功能以及它們可以發(fā)現(xiàn)的模式類型包括:class/concept description、Association analysis、Classification and prediction、Clustering、Outlier analysis等。
3 建立面向知識(shí)處理的政務(wù)系統(tǒng)
按照上述數(shù)據(jù)挖掘的基本流程,以檢察院為例介紹如何讓EG系統(tǒng)真正實(shí)現(xiàn)面向知識(shí)的處理。
。ㄒ唬(gòu)建EG系統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)
這部分主要分為四個(gè)任務(wù):確定檢察院EG系統(tǒng)中的數(shù)據(jù)源;Web日志數(shù)據(jù)的預(yù)處理;多維Web數(shù)據(jù)模式的建立;應(yīng)用OLAP技術(shù)。
1.確定檢察院EG系統(tǒng)中的數(shù)據(jù)源
檢察院EG系統(tǒng)的數(shù)據(jù)主要從兩個(gè)方面獲得:
。1)調(diào)研和用戶主動(dòng)提供的數(shù)據(jù)資源;
。2)EG系統(tǒng)從其門(mén)戶網(wǎng)站中獲得數(shù)據(jù)源。
在原來(lái)的檢察院系統(tǒng)中,大量數(shù)據(jù)資源主要從第一方面獲得。當(dāng)實(shí)施了EG后,政府將從其門(mén)戶網(wǎng)站中獲取更多、更豐富的數(shù)據(jù)資源。因?yàn)闄z察院對(duì)第一種數(shù)據(jù)來(lái)源已形成了較成熟的數(shù)據(jù)庫(kù),只需直接導(dǎo)入數(shù)據(jù)倉(cāng)庫(kù)。那么如何對(duì)龐大的Web日志數(shù)據(jù)建立數(shù)據(jù)倉(cāng)庫(kù)呢?
2.Web日志數(shù)據(jù)的預(yù)處理
Web服務(wù)器日志文件中的數(shù)據(jù)稱之為原始數(shù)據(jù),管理員可根據(jù)需要用某些日志字段記錄相關(guān)數(shù)據(jù)。[3]如:用戶的域名或IP地址,用戶的Login ID,訪問(wèn)日期和時(shí)間,訪問(wèn)的方法,被訪問(wèn)頁(yè)的文件名和參數(shù)等。對(duì)Web日志數(shù)據(jù)的預(yù)處理包括兩步。第一步:清除噪音,即去掉對(duì)知識(shí)挖掘無(wú)關(guān)的數(shù)據(jù)。第二步:轉(zhuǎn)化數(shù)據(jù),即將原始數(shù)據(jù)按照挖掘需求通過(guò)重新組織或簡(jiǎn)單計(jì)算轉(zhuǎn)換成規(guī)范模式。
3.多維Web數(shù)據(jù)模式的建立
分為三步進(jìn)行。第一步,選取維。多維數(shù)據(jù)便于我們從多個(gè)角度、多個(gè)側(cè)面對(duì)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行觀察、分析,以深入了解包含在數(shù)據(jù)中的信息和內(nèi)涵。N維數(shù)據(jù)矩陣用C(A1, A2,……, Am ,count)模式表示,其中A??i代表第i維,i=1,2,……,n, count是變量,反映數(shù)據(jù)的實(shí)際意義。
數(shù)據(jù)單元用r[A1:a1,……,An:an,count]模式表示,即為維Ai選定一個(gè)維成員a??i,i=l,…,n,這些維成員的組合唯一確定了變量count的一個(gè)值。通常,需要了解用戶對(duì)門(mén)戶網(wǎng)站中文件資源的訪問(wèn)行為,可以選取用戶維、時(shí)間維、文件維構(gòu)建數(shù)據(jù)矩陣,以形成多維視圖。
第二步,構(gòu)造檢察院門(mén)戶網(wǎng)站訪問(wèn)數(shù)據(jù)的多維視圖。先選取data維(按季度組織)、file維(按文件類型組織)用2-D形式表示用戶對(duì)檢察院門(mén)戶網(wǎng)站的訪問(wèn)行為。然后加入第三維location(按用戶所在區(qū)組織),進(jìn)一步構(gòu)建用戶訪問(wèn)行為的三維視圖。視圖顯示的事實(shí)是visit_count(訪問(wèn)次數(shù))。
第三步,創(chuàng)建多維數(shù)據(jù)模式。最流行的數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)模型是多維數(shù)據(jù)模型。最常見(jiàn)的模型范例是星型模式。
4.應(yīng)用OLAP技術(shù)
OLAP,即在線聯(lián)機(jī)處理。應(yīng)用OLAP技術(shù)可以很方便地從Web日志數(shù)據(jù)矩陣中作出一些簡(jiǎn)單的結(jié)論性分析,如回答一些問(wèn)題:(1)哪些資源訪問(wèn)情況最好,哪些最差?(2)用戶的地域分布情況如何?我們可以充分利用多維數(shù)據(jù)模型上的OLAP操作,如下鉆(drill-down)、上卷(roll-up)、切片分析(slice)和切塊分析(dice)等技術(shù)對(duì)問(wèn)題進(jìn)行求解。
。ǘ┩诰蚰J降挠行(yīng)用
應(yīng)用數(shù)據(jù)挖掘技術(shù)可以自動(dòng)發(fā)現(xiàn)用戶的行為特征和系統(tǒng)的訪問(wèn)模式。
1.?dāng)?shù)據(jù)挖掘技術(shù)應(yīng)用的范圍
雖然現(xiàn)在已有很多地方級(jí)政府部門(mén)都建立了自己的門(mén)戶網(wǎng)站,但公眾只能在這些網(wǎng)站上瀏覽少量的政府職能和部門(mén)介紹。這樣的政府門(mén)戶網(wǎng)站沒(méi)有根本上體現(xiàn)本身應(yīng)有的應(yīng)用價(jià)值。檢察院構(gòu)建其門(mén)戶網(wǎng)站,需要向公眾、企業(yè)和其他政府部門(mén)提供盡可能多相關(guān)信息和服務(wù)。同時(shí),檢察院通過(guò)門(mén)戶網(wǎng)站也要有能力獲悉訪問(wèn)用戶的訪問(wèn)行為和動(dòng)機(jī)、趨勢(shì)。在服務(wù)器以及瀏覽器日志記錄的數(shù)據(jù)中隱藏著模式信息,結(jié)合網(wǎng)絡(luò)技術(shù)應(yīng)用數(shù)據(jù)挖掘技術(shù)可以自動(dòng)發(fā)現(xiàn)系統(tǒng)的訪問(wèn)模式和用戶的行為特征,從而進(jìn)行預(yù)測(cè)分析。
2.應(yīng)用挖掘模式提取和分析知識(shí)
根據(jù)不同的應(yīng)用要求,在數(shù)據(jù)挖掘模式中選擇合適的方法進(jìn)行計(jì)算,提取有效數(shù)據(jù),得出知識(shí)。對(duì)于檢察院,可以應(yīng)用聚類方法確定特定用戶的地域分布,從而識(shí)別出一些問(wèn)題:
。1)哪些分區(qū)在一段時(shí)間內(nèi)網(wǎng)上舉報(bào)情況較集中。
(2)網(wǎng)上舉報(bào)較集中的地區(qū)是因?yàn)榘讣l(fā)生頻繁,還是因?yàn)榫W(wǎng)絡(luò)普及范圍廣。
。3)對(duì)比網(wǎng)上舉報(bào)和非網(wǎng)上舉報(bào)的用戶群,以輔助政府決策對(duì)不同地區(qū)采取不同的情報(bào)收集手段。
關(guān)于新的信息技術(shù)對(duì)政務(wù)處理的革新作用,還有許多值得繼續(xù)深入研究的。但是,不論從那個(gè)方向進(jìn)行研究,都必須要以提高政務(wù)處理能力為宗旨,將先進(jìn)的信息技術(shù)有效的應(yīng)用于政務(wù)處理上,讓政府資源發(fā)揮最大的社會(huì)價(jià)值。
參考文獻(xiàn)
[1]Colin White. Data Warehousing. Cleaning and Transforming Data [M]. InfoDB,2002.
[2]林宇.數(shù)據(jù)倉(cāng)庫(kù)原理與實(shí)踐[M]. 北京: 人民郵電出版社,2003.
[3]杜國(guó)寧, 朱仲英. 基于Web技術(shù)的數(shù)據(jù)挖掘系統(tǒng)研究與設(shè)計(jì)[J]. 微型電腦應(yīng)用,2005, (1).
相關(guān)熱詞搜索:革新 信息技術(shù) 政務(wù) 論新信息技術(shù)對(duì)政務(wù)革新的作用 政務(wù)信息的作用 什么是政務(wù)信息工作
熱點(diǎn)文章閱讀