基于行業(yè)分布的企業(yè)網(wǎng)絡(luò)信息安全威脅及對策研究
發(fā)布時(shí)間:2019-08-22 來源: 感恩親情 點(diǎn)擊:
摘要:在互聯(lián)網(wǎng)日益普及的今天,企業(yè)越來越重視自身的信息化建設(shè),企業(yè)信息化的發(fā)展使得接入互聯(lián)網(wǎng)的企業(yè)不斷增長,如何保護(hù)企業(yè)信息安全成為企業(yè)發(fā)展的關(guān)鍵內(nèi)容之一。本文采取數(shù)理統(tǒng)計(jì)及文本分類的方法,對來自某知名黑客論壇的300余萬條數(shù)據(jù)進(jìn)行分析,通過TF-IDF模型與KNN算法分類思想,得出不同行業(yè)的網(wǎng)絡(luò)信息安全威脅程度,并劃分出較低、適中以及較高三類等級。在此基礎(chǔ)上,根據(jù)行業(yè)特點(diǎn)深入剖析了不同行業(yè)產(chǎn)生信息安全問題的原因,并提出了相應(yīng)的改進(jìn)措施和建議。
Abstract: With the growing popularity of the internet today, the enterprises have paid more attention to their informatization construction. The development of enterprise informatization made more and more enterprise connect to the internet, how to protect the information security is one of the critical problems enterprises should consider. This paper took mathmatical statistics and text classification to analyze more than 3 million data from a famouse hacker"s forum. The paper got the levels of informaiton security threats for different industries through TF-IDF model and KNN algorithm. From that, it analyzed the reasons why there are so many information security problems in different industries deeply, and provided some targeted suggestions.
關(guān)鍵詞: 網(wǎng)絡(luò)信息安全;TF-IDF模型;KNN算法;行業(yè)分布
Key words: Internet information security;TF-IDF model;KNN algorithm;industry distribution
中圖分類號:TP399 文獻(xiàn)標(biāo)識碼:A 文章編號:1006-4311(2015)20-0050-04
0 引言
隨著互聯(lián)網(wǎng)的迅速發(fā)展和普及,企業(yè)的信息化建設(shè)的步伐也在不斷地加快。從外部環(huán)境來看,由于市場范圍不斷擴(kuò)大,科技競爭、營銷競爭、市場和人才的爭奪日益激烈,對企業(yè)形成了強(qiáng)大的壓力。依托互聯(lián)網(wǎng)及信息資源,采用信息技術(shù)來實(shí)現(xiàn)信息化,是企業(yè)保持競爭優(yōu)勢的有力措施。從企業(yè)內(nèi)部來看,為適應(yīng)外部競爭環(huán)境,企業(yè)內(nèi)部結(jié)構(gòu)、業(yè)務(wù)流程、管理方式以及商業(yè)模式都需不斷調(diào)整、重組、變革。企業(yè)與互聯(lián)網(wǎng)結(jié)合進(jìn)行信息化建設(shè),在引入新技術(shù)的同時(shí),能夠提高企業(yè)的應(yīng)變能力、創(chuàng)新能力和競爭能力[1]。
同時(shí),企業(yè)通過互聯(lián)網(wǎng)可以快速了解市場信息,掌握市場動態(tài),傳遞和交換商業(yè)信息,進(jìn)而提高工作效率,節(jié)省成本,企業(yè)的信息化建設(shè)在市場競爭中具有重要的戰(zhàn)略地位[2]。
關(guān)于企業(yè)網(wǎng)絡(luò)信息安全的研究多集中于網(wǎng)絡(luò)威脅的檢測和具體的方法技術(shù),或者從安全管理制度入手,協(xié)調(diào)企業(yè)內(nèi)部管理機(jī)制,建立信息安全管理模型[4]。也有學(xué)者從技術(shù)、管理和資源角度出發(fā),考慮信息安全體系的構(gòu)建原則,或者針對具體的安全問題,提出具有創(chuàng)見性的解決或操作方案[5]。這些都是從企業(yè)建設(shè)的角度,來分析企業(yè)信息安全問題,企業(yè)個體層面的研究較多。
而從宏觀上來看,不同行業(yè)面臨的信息安全問題也會有所區(qū)別,如何明確不同行業(yè)的信息安全威脅程度,并出臺相應(yīng)政策改善信息安全狀況,是相關(guān)政策制定者亟需考慮的問題。
從行業(yè)分布來看企業(yè)的信息安全狀況,能夠給企業(yè)帶來戰(zhàn)略性的指導(dǎo),通過明確信息安全威脅程度,可以有針對性地制定信息安全投入策略,優(yōu)化企業(yè)管理資源配置[6]。
此外,信息安全的行業(yè)分布特征可以從整體上反映我國的信息安全體系建設(shè)的狀況,進(jìn)而通過加強(qiáng)對不同行業(yè)的引導(dǎo),探索保護(hù)企業(yè)信息安全的有效途徑,來完善相應(yīng)的法律法規(guī)制度。
網(wǎng)絡(luò)信息安全事件中,絕大多數(shù)是由黑客行為造成的,在易受黑客攻擊的行業(yè)中,依然有部分企業(yè)完全忽視了信息安全的重要性。
本文從探究不同行業(yè)的網(wǎng)絡(luò)信息安全威脅的角度出發(fā),以某知名黑客論壇搜集到的300多萬條黑客攻擊數(shù)據(jù)為基礎(chǔ),旨在通過實(shí)證研究得出不同行業(yè)的網(wǎng)絡(luò)信息安全威脅程度,為相關(guān)部門制定信息安全政策提供支持,同時(shí)為不同的行業(yè)區(qū)分不同的信息安全等級,有針對性地實(shí)施信息安全保護(hù)措施。
1 入侵行為樣本數(shù)據(jù)采集及預(yù)處理
本文所采用的數(shù)據(jù)來自于某知名黑客論壇,該論壇收錄了大量的網(wǎng)站入侵?jǐn)?shù)據(jù),每條數(shù)據(jù)由黑客攻擊者本身上傳,并提供相應(yīng)的證據(jù)證實(shí)該行為的真實(shí)性,該論壇的工作人員會對提交的信息進(jìn)行審核,確認(rèn)其真實(shí)性后才會在網(wǎng)站社區(qū)進(jìn)行發(fā)布。數(shù)據(jù)的采集以網(wǎng)絡(luò)爬蟲(Web Crawler)抓取的方式進(jìn)行,主要抓取被攻擊網(wǎng)站的中文標(biāo)題和中文關(guān)鍵字,便于后續(xù)的數(shù)據(jù)處理和分析。
從該網(wǎng)站采集的數(shù)據(jù)文字信息雜亂無規(guī)律,且數(shù)據(jù)量大,其中大部分為無效數(shù)據(jù)。由于無效數(shù)據(jù)擴(kuò)大了樣本容量,不具有分析價(jià)值,在對數(shù)據(jù)的冗余統(tǒng)計(jì)上,會使結(jié)果造成很大的偏差。為了使分析結(jié)果更加準(zhǔn)確,我們通過編寫相應(yīng)的程序代碼,對初始數(shù)據(jù)進(jìn)行預(yù)處理,包括外文字符的處理、半角及全角轉(zhuǎn)換、漢字編碼轉(zhuǎn)換以及無效數(shù)據(jù)的清除等工作。清除無效數(shù)據(jù)主要包括去除無明顯含義的字詞、空白字符和特殊符號。我們收集到的數(shù)據(jù)總量為3445153條,經(jīng)過篩選和預(yù)處理,有效數(shù)據(jù)為725550條。
相關(guān)熱詞搜索:信息安全 分布 威脅 對策研究 行業(yè)
熱點(diǎn)文章閱讀