Folksonomy及其國外研究進展:國外白發(fā)研究進展
發(fā)布時間:2020-03-07 來源: 散文精選 點擊:
〔摘要〕闡述了folksonomy的概念與分類原理,指出了其與傳統分類法的不同。分析了folksonomy在類目結構、信息組織、信息資源揭示等方面的優(yōu)勢以及在語義表達、語法控制、語義普遍認知方面的劣勢。從存在價值、基于tag的定量分析、用戶定量分析、系統設計與應用、缺陷解決措施以及檢索等六個方面系統介紹了folksonomy的國外研究進展。
〔關鍵詞〕folksonomy 網絡信息分類法 tag
〔分類號〕G254.11 TP393
Folksonomy and Related Research Progress in Some Advanced Countries
Yu Jinxiang
School of Economics and Management, South China Normal University, Guangzhou510006
〔Abstract〕This paper firstly expounds the conception and the classification principles of folksonomy, and points out the differences between folksonomy and the traditional classification methods. Then, it analyzes folksonomy"s advantages on its category structure, information organization, information resources disclosure and disadvantages on semantics expression, grammar controlling and semantics cognition. At last, the paper introduces foreign research progress of folksonomy systematically from the aspects of the value of existing, the quantitative analysis based on tag, user quantitative analysis, system design and application, flaw solution measures and retrieval technologies.
〔Keywords〕folksonomy internet information classification tag
1引言
Folksonomy是由folks和taxonomy組合而來,folks在英文中是比較口語化的詞,表示一群人、一伙人的意思,taxonomy是指分類法,它是信息架構中的重要部分。Folksonomy是指一種社群參與人運用自由定義tag(標簽)的方式進行協作分類的活動,主要機制是基于開放性元數據標準和自然語言的社群聚類,現有“分眾分類法”、“通俗分類法”、“大眾分類法”、“民眾分類法”等不同翻譯。分類的原理為向社群參與者提供一種協同構建與共享各自網絡資源標簽的開放式平臺,用戶通過自己制定的分類標準來提交tag,由用戶群體定義tag的頻率來決定信息的組織方式。這種標簽包括網絡內容的分類、大意與鏈接地址等,tag對每個人都是完全開放的,用戶可以自由查看并修改自己提交的標簽。
Folksonomy與傳統網絡信息分類法最大的不同在于它并不采用嚴格的分類標準,其分類全部由用戶直接提交,分類的形成過程完全是自發(fā)的。這種分類是平面化的,沒有等級層次的劃分,雖然它相對不夠嚴謹,缺乏準確度,但是在社會性軟件中,這種平面延伸的分類方法卻在無形之中成為了方便、靈活、不受條件限制地溝通渠道。所以以自定義標簽形式的大眾分類在現下流行的社會性網絡服務中得到了廣泛的應用,如:Flickr、Furl、Del.icio.us、Frassle、Simpy、Spurl、Technorati、FotoFlix、Simpy、OpenBM等。應該說,國內對于folksonomy的研究還處于初步階段,因此,了解國外的研究對于國內的研究和實踐具有非常重要的意義。
2Folksonomy的優(yōu)劣勢分析
2.1Folksonomy的優(yōu)勢
2.1.1平面化、非等級結構的類目結構傳統分類法具有嚴密的等級結構和邏輯體系,folksonomy則是平面的、非等級的。一些門戶網站和搜索引擎對信息的組織一般采用類目細分的方式來進行分類,如果分類體系過多,會增加網民的認識負擔、影響檢索效率;如果分類體系過少,則會影響分類體系的清晰度,增加網民瀏覽選擇的負擔[1]。而folksonomy通過tag的字號大小以及顏色的不同來表示其“受歡迎”的程度,能夠實現快速而自動的信息聚類,生成系列加權列表和標簽總圖(TagCloud),具有較強的大眾趨同性,直觀性和易用性強。
2.1.2低成本的信息組織方式Adam提出網絡信息資源的組織有三種方式:由圖書館ICP服務商和其他信息機構提供的檢索目錄、作者創(chuàng)建元數據、用戶交流和共享產生的信息描述。folksonomy通過用戶共享元數據來實現合作分類和交流,相對于前兩種信息組織方式而言,無需預先編制、維護和學習龐大的分類體系表,也無需掌握專門的圖書館領域專業(yè)技術方法和專業(yè)培訓,能夠節(jié)省用戶的時間和精力[2]。
2.1.3多維度揭示信息資源 作為folksonomy類目的tag,它既不同于關鍵詞、也不同于目錄和主題詞。Tag是對文章概括和理解基礎上產生的,是對內容的個人理解上的私人標注,未必針對主題,可能是時間、內容或與文章主題無關的詞匯,因此標簽的設定要比關鍵詞自由和方便,它可以從多個維度來揭示信息內容。在以目錄為基礎的存儲體系中,目錄結構必須要事前規(guī)劃,而tag可以不考慮目錄結構并以較少的代價細化分類。folksonomy的類目是由用戶定義一個或幾個tag組成,沒有明確定義tag之間的關系,各個tag之間的關系是平等的,但是又可以根據相關性分析,將經常一起出現的tag關聯起來,而產生一種相關性的分類,它不像傳統分類法和分類表,有多重明確的關系。此外,它還能解決傳統分類法更新慢,不能及時面對新出現的學科和專業(yè)術語的問題。
2.2Folksonomy的劣勢研究
狹義的分類是以嚴謹的學術邏輯為線索,以學術信息的匯集、樹立和查詢?yōu)槟康,以學術為軸心,而tag是以個人的感性邏輯即個人的知識、情感、意志、記憶、素養(yǎng)等綜合素質的反應為線索,以個人所需信息的匯集、梳理和查詢?yōu)槟康模詡人的經驗為基礎[3]。但是,對于他人或是整個分類體系而言,folksonomy是模糊的,不精確的,隨意的。此外,同名異義的問題也導致了它的模糊性:①一詞多義產生的意義分歧。②縮略詞產生的問題:例如在一些社會性書簽網站中,“ANT”是社會學領域“Actor Network Theory”的縮寫,但是在del.icio.us中,它卻是Java編程語言中的一種工具。
Folksonomy缺乏同義詞、英文單復數控制以及標題、詞語順序等語法控制。同時,folksonomy的中文運用問題上還存在著分詞結構模糊;在不同的語言環(huán)境下,對語義的普遍認知存在明顯差異的問題;垃圾標簽的出現使宏觀標簽總圖的準確性下降,對垃圾信息和標簽的合理使用還沒有行之有效的解決方法[4]。
目前,folksonomy的使用范圍有限,這種分類法的組織對象基本上是非學術的、面向生活的、公眾的,目前僅限于blog等社會性網站的組織和管理,而這部分信息在網絡信息空間中僅是微量部分。由于受語言、風俗習慣、文化背景等的影響,在跨國界、跨時空、跨文化的信息組織和交流中仍然存在很多障礙,作為一種基于自然語言產生的新的網絡信息組織方式,folksonomy仍然存在許多的問題。
3國外folksonomy研究進展
國外對folksonomy理論方面的研究始于2005年,通過對國外文獻的閱讀和分析,筆者認為國外對folksonomy的研究主要集中在以下6個方面:
3.1Folksonomy存在價值的研究
自由分類法這一概念的產生晚于它的應用,最初的討論集中在其存在價值的研究:Admam認為folksonomy將取代以往由專家控制的元數據編輯管理;Clay認為folksonomy是有勝于無的方案;Shelly認為傳統分類法過于復雜,維護成本高;Louis認為folksonomy缺乏檢索功能、精確性不強。
3.2基于tag的定量分析
Lambiotte采用了概率論和數學建模的方法對專業(yè)音樂網站數據進行分析,發(fā)現使用tag描述在線合作性分類產成了由不同結點即用戶、款目和標簽構成的三重網絡。其次,通過分析用戶使用款目和tag之間的關系分析了這三個要素構成的無序網絡。再次,采用過濾技術來分析用戶的合作性行為,認為網絡的等級結構產生了對用戶類型的統計定義,提取了合作性過濾和分類之間的直接連接關系并提出了合作性社群中測量用戶多樣性的方法[5]。
Christopher通過對Technorati中排名前350的tag以及分享同一tag文章的相似性進行定量研究,分析了blog標簽分類的有效性。發(fā)現tag在粗略的分類體系中是有效的,但是在表明特殊的文章內容時是無效的,tag與自動抽詞高度相關,可以高度聚焦分類文章。討論了未來tag成為信息組織和檢索工具更加有效的方法:更具表達力和簡潔性、易用tag的形成;用戶對tag分群,tag間特定關系的闡釋,tag與特定的人或物相關;產生幫助用戶自動形成文章tag的工具;標簽發(fā)展為社會現象的興趣研究等[6]。
3.3基于用戶的定量分析
Ciro采用統計學和概率論的方法對del.icio.us和Connotea中的tag進行了統計分析,構架了用戶使用合作性標簽的隨機模型,該模型包含兩個要素:對于他人標記活動感知的用戶偏好機制以及系統中tag的時效性。盡管用戶個體的認知過程是復雜的,個體的分類、標記標簽的行為是錯綜復雜的,但是在合作性標簽系統內,用戶普遍的標記行為卻遵循著簡單的活動模式[7]。
Scott采用模型和圖表研究了用戶使用合作性標簽系統的規(guī)律以及合作性標簽系統的結構、使用標簽的頻率、各種標簽的應用、相關標簽使用的穩(wěn)定性的分析,認為tag反映了用戶興趣的發(fā)展變化[8]。
3.4系統的設計及應用研究
Cameron建立了基于資源、用戶和標簽的網絡標簽模型,然后以12個標簽系統為例,設計了標簽系統的模塊和系統屬性,這些模塊為:使用標簽的權限、標簽的聚集、標簽支持/供給、資源的類型、來源、資源的鏈接、群體在系統中的連通性。分析了用戶添加tag時的7種動機即未來檢索、貢獻和分享、注意力的吸引、競爭、自我表現、觀點表達等以及這7種動機對標簽系統的不同影響,并在flicker中進行了實驗。該標簽系統為開發(fā)者和設計者提供了基于tag的模型設計和基本思路[9]。
Satoshi Niwa認為,由于難以收集用戶偏愛網頁的數據、因特網上的網頁數量龐大,通過協作性過濾來構建網頁評價體系的嘗試存在一定困難,提出了通過正在流行的folksonomy和社會性書簽工具來構建覆蓋整個網絡網頁評價系統的方法[10]。
多倫多大學Jennifer和美國丹佛藝術博物館Bruce提出博物館的收藏支持社會性書簽,并且提供基于folksonomy的檢索,這給開放的博物館一種新的闡釋[11]。
Darlene指出對于內部網而言,通過標簽可以自由分享未曾發(fā)現的數字資源。通過賓夕法尼亞大學圖書館的Penn Tags的社會性書簽服務項目和哈佛大學Berkman互聯網社會研究中心的H20 Playlist項目以及IBM引入folksonomy理念開發(fā)的企業(yè)社會性書簽工具dogear來說明站點管理員可以試著使用多種社會性軟件來支持標簽活動并指出標簽活動可以消除信息分類者和員工對信息理解的分歧[12]。
3.5Folksonomy缺陷解決措施研究
日本學者從認知學雙循環(huán)滿意原則即及時滿意和延時滿意的角度來解決folksonomy信息質量、信息分享問題,并且針對分類法的非連續(xù)性和同名義意的問題提出了解決辦法,并且提出了基于元數據的個人本體框架[13]。
Louis提出元數據生態(tài)學的概念,基本思想為:設計合理的元數據,建立可控的、動態(tài)發(fā)展的元數據詞匯表,同時鼓勵作者和用戶創(chuàng)造folksonomy詞匯,并作為受控詞表收詞的備選,與受控詞表一起構建和諧的網絡信息組織環(huán)境[14]。
3.省略網站和美味書簽中進行了URLCount和URLRank、TagCount以及TagRank和UserRank檢索結果的比較和分析[15]。
Andreas研究了folksonomy的信息檢索問題,構建了folksonomy的模型和FolkRank檢索機制,并采用這種新的檢索運算法則來研究folksonomy的結構。采用FolkRank運算法則計算了特定主題的排序,并且比較了FolkRank和PageRank間的不同[16]。
Al-KhalifaScott通過測量folksonomy和yahoo關鍵詞設置的重疊率以及索引者主觀評價兩種系統產生的關鍵詞的質量,來對基于相同網站的yahoo API文本語詞抽取技術和folkson-omy進行評價[17]。
4結語
Folksonomy作為一種出現不久的網絡信息組織方法,缺乏重量級的應用,對其研究還需進一步加強。了解國外folksonomy的最新研究概況,汲取國外構建各種模型、tag系統時的經驗和研究方法,對促進我國folksonomy的研究將有積極的促進意義。
2005年5月10日國內博客網站blogbus首次推出tag功能并與專業(yè)搜索引擎Technorati整合,標志著folksonomy理念進入中國并逐步被采用。雖然目前使用或知道tag的網民還主要限于網上博客,標簽軟件的應用標準等尚待完善,folksonomy尚需后受控手段與受控語言的融合,但網民卻接受了這種“有勝于無”的方案。在Web2.0時代,每個人都有權自由獲取、組織和使用信息,而folksonomy作為反映草根文化和民間力量的信息組織方式,為用戶提供了一個契機,它將促進全球信息的分享、交流乃至文化融合、世界大同的共有理念的形成。
參考文獻:
[1] 周榮庭,鄭彬.分眾分類:網絡時代的新型信息分類法.現代圖書情報術,2006(3):72-75.
[2] 梁桂英,李記旭.folksonomy初探.圖書館雜志,2006(4):46-49.
[3] tag-我分類.[2006-6-25].http://www.省略/maozixi-ansheng/.
[4] Folksonomy與語言的關系以及中文應用的問題.[2006-06-25].http://blog.省略.
[5] Lambiotte R, Ausloos M. Collaborative tagging as a tripartite network.[2006-08-15].省略/abs/cs.DS/0512090.
[6] Brooks C H, Montanez N. An analysis of the effectiveness of tagging in blog.[2006-08-15].http://www.cs.usfca.edu.
[7] Cattuto C, Loreto V,Pietronero L. Collaborative tagging and semiotic dynamics.[2006-08-15].省略/.
[8] Golder S A, Huberman B A. The structure of collaborative tagging systems.[2006-08-15].省略/
[9] Marlow C. Tagging paper, taxonomy, flickr, academic article,to read.[2006-08-15].http://www.省略.
[10] Niwa S, Doi T, Honiden S. Web page recommender system based on folksonomy mining for ITNG?6 Submissions.[2006-08-15].http://ieeexplore.省略/.
[11] Trant J, Wyman B. Investigating social tagging and folksonomy in art museums withsteve.museum.[2006-08-15].http://www.省略.
[12] Fichte D. Intranet applications for tagging and folksonomies.[2006-08-20].http://www.省略.
[13] Ikki Ohmukai, Masahiro Hamasaki, Hideaki Takeda. A Proposal of Community-based Folk-sonomy with RDF Metadata.[2006-08-15].http://www.ifi.unizh.ch/.
[14] Rosenfeld L. Folksonomies? How about metadata eco1ogies7.[2006-08-15].http://www.省略.
[15] Szekely B, Torres E. Ranking bookmarks and bistros:Intelligent community and folksonomy development.[2006-08-15].http:/ /torrez.us/.
[16] Hotho A, Jaschke R, Schmitz C, et al. Information retrieval in folksonomies:search and ranking.[2006-08-15].http://www.kde.cs.
[17] Al-Khalifa H S, Davis H C. Folksonomy versus autionmatic keywaord extraction: an empirical study.[2006-08-15].http://eprints.ecs.soton.ac.uk/.
〔作者簡介〕 余金香,女,1983年生,碩士研究生。
相關熱詞搜索:研究進展 國外 Folksonomy Folksonomy及其國外研究進展 國外自由基研究進展 國外基坑研究新進展
熱點文章閱讀