:::

學科主題:資訊系統檢索 (1)想請問何謂隱含語意索引(latent semantic indexing) (2)與向量空間模型相比,它的優點及缺點是什麼 因非資訊專科出身,希望可以找尋到淺顯易懂的說明 感謝您

您好!

有關資訊系統檢索之提問,簡答如下:

一、隱含語意索引(latent semantic indexing)名詞解釋:

「隱含語意索引(latent semantic indexing,簡稱LSI),又稱潛在語意分析(latent semantic analysis,簡稱LSA),是以向量空間模型(vector space model)為基礎,透過奇異值分解(singular value decomposition,簡稱SVD)與維度約化(dimension reduction)進行語意關聯模型建構的方法......此技術能捕捉詞彙間隱含的語意關聯,形成由概念所構成的語意空間(semantic space),進而解決傳統向量空間模型中假設向量維度(即詞彙)彼此獨立而無相關性的缺點......」

「隱含語意索引將詞彙群組成概念,其好處是概念代表多個相關詞或同義詞的集合,且一個概念僅表達單一語義,使得傳統向量空間模型中假設詞彙彼此獨立而造成多詞同義(synonym)及一詞多義(polysemy)未納入考量的問題得以解決......」
(詞條作者:葉鎮源/2012年10月)

引文來源:國家教育研究院「雙語詞彙、學術名詞暨辭書資訊網」/圖書館學與資訊科學大辭典  http://terms.naer.edu.tw/detail/1678985/
建議您參考完整原文。


二、向量空間模型(vector space model)名詞解釋:

「向量空間模型(vector space model,簡稱VSM)是常用的資訊檢索模型,是將文件表達成數學概念(亦即幾何空間中的向量)的一種方式,以方便計算文件之間的相似程度,或便利探討文件與詞彙之間的各種關係......」
(詞條作者:曾元顯/2012年10月)

引文來源:國家教育研究院「雙語詞彙、學術名詞暨辭書資訊網」/圖書館學與資訊科學大辭典
http://terms.naer.edu.tw/detail/1678992/
建議您參考完整原文。


三、其他相關資源及文獻:
(1) 曾元顯/「資訊檢索與知識探勘」 
國家圖書館編目園地 http://catweb.ncl.edu.tw/datas/3-1-009-10.pdf

(2) 呂啟銓/演算法在改善隱含語意索引於大型語料庫之效能比較
朝陽科技大學/資訊工程系碩士班/97/碩士/指導教授:吳世弘

(3) Wu, Shih-hung、Yang,Pey-ching、Soo,Von-wun,"An Assessment of Character-based Chinese News Filtering Using Latent Semantic Indexing",International Journal of Computational Linguistics & Chinese Language Processing 3:2 (民87.08),頁61-78。


以上資料僅供參考。敬祝 安康!

國家圖書館 知識服務組 謹啟
2015.4.25