連結挖掘的任務是什麼?
連結挖掘有幾個任務,如下所示:
基於連結的物件分類 - 在傳統的分類方法中,物件根據定義它們的屬性進行分類。基於連結的分類預測物件的類別不僅取決於其屬性,還取決於其連結以及連結物件的屬性。
網頁分類是基於連結分類的一個很好的例子。它根據單詞出現(出現在頁面上的單詞)和錨文字(超連結單詞,即單擊連結時可以單擊的單詞)來預測網頁的分類,這兩者都作為屬性。此外,分類取決於頁面之間的連結以及頁面和連結的不同屬性。
物件型別預測 - 這根據物件的屬性及其連結以及與其連線的物件的屬性來預測物件的型別。在書目領域,可能需要將出版物的場所型別預測為會議、期刊或研討會。在連線領域,同樣的任務是預測連線聯絡是透過電子郵件、電話或郵件進行的。
連結型別預測 - 這根據所包含物件的屬性預測連結的型別或目標。例如,給定流行病學資料,它可以嘗試預測兩個人是否相互瞭解是家庭成員、同事還是熟人。
預測連結是否存在 - 與連結型別預測不同,在連結型別預測中,它可以理解兩個物件之間存在連線並且需要預測其型別,而是它可能想要預測兩個物件之間是否存在連結。示例包括預測兩個網頁之間是否存在連結以及一篇論文是否會引用另一篇論文。
連結基數估計 - 連結基數估計有兩種形式。首先,它可以預測指向物件的連結數量。例如,這對於根據指向它的連結數(入鏈)預測網頁的權威性很有用。類似地,多個出鏈可用於識別充當集線器的網頁,其中集線器是一個或一組指向同一案例的多個權威頁面的網頁。
物件協調 - 在物件協調中,該函式是根據物件的屬性和連結來預測兩個物件是否實際上是相同的。此函式在資訊提取、重複刪除、物件統一和引用連線中很常見,也稱為記錄連結或身份不確定性。
廣告