跳至內容

Lesk演算法

維基百科,自由的百科全書

Lesk演算法邁克·萊斯克於1986年提出的詞義消歧演算法。[1]

概述

[編輯]

Lesk演算法是基於詞彙會與上下文有相同的主題這個假設,簡化版的演算法將有歧義的詞彙在字典中的定義與上下文進行比較。修改後的演算法被用於WordNet[2]。以下為一個實作範例:

  1. 對於有歧義的單字,計算同時出現在上下文與字典定義中詞彙的數量。
  2. 選擇次數最高的詞彙解釋。

用於說明該演算法的常見的範例是詞彙「pine cone」,以下提供的字典定義:

PINE 
1. kinds of evergreen tree with needle-shaped leaves
2. waste away through sorrow or illness
CONE 
1. solid body which narrows to a point
2. something of this shape whether solid or hollow
3. fruit of certain evergreen trees

顯而易見交集次數最高的是Pine#1⋂Cone#3 = 2。

參見

[編輯]

參考文獻

[編輯]
  1. ^ Lesk, M. (1986). Automatic sense disambiguation using machine readable dictionaries: how to tell a pine cone from an ice cream cone. In SIGDOC '86: Proceedings of the 5th annual international conference on Systems documentation, pages 24-26, New York, NY, USA. ACM.
  2. ^ Satanjeev Banerjee and Ted Pedersen. An Adapted Lesk Algorithm for Word Sense Disambiguation Using WordNet頁面存檔備份,存於互聯網檔案館, Lecture Notes in Computer Science; Vol. 2276, Pages: 136 - 145, 2002. ISBN 3-540-43219-1