MATLAB中兩個矩陣的餘弦相似度計算


在本教程中,我們將學習如何使用MATLAB計算兩個矩陣之間的餘弦相似度。因此,讓我們從餘弦相似度的基本定義開始。

什麼是餘弦相似度?

餘弦相似度是矩陣代數中的一種標準度量,用於確定內積空間(如歐幾里得空間)中兩個非零矩陣之間相似程度的度量。

餘弦相似度測量兩個矩陣之間角度的餘弦值,併產生一個介於-1和1之間的值。這裡,值1表示兩個矩陣完全相似,值-1表示兩個矩陣完全不相似或指向相反的方向(直徑相對)。此外,如果餘弦相似度的值為0,則表示兩個矩陣垂直或正交,它們之間沒有相似性。

因此,我們可以說餘弦相似度是一種確定兩個矩陣在方向上彼此對齊程度的方法。

餘弦相似度廣泛應用於各個科學技術領域,例如數字影像處理、自然語言處理、控制系統、資料探勘、推薦系統等等。

餘弦相似度公式

假設A和B是兩個非零矩陣,則這兩個矩陣之間的餘弦相似度可以使用以下公式計算:

$$\mathrm{Cosine \: Similarity(𝐴, 𝐵) =\frac{A \:和\: B \:的點積}{(A \:的幅度) \ast (B \:的幅度)}}$$

這裡,A和B的點積是矩陣元素逐個相乘的總和,A和B的幅度是它們分量平方和的平方根。

餘弦相似度的優點

以下是餘弦相似度的一些重要優點:

  • 餘弦相似度不依賴於矩陣的幅度,只依賴於它們之間的角度。

  • 餘弦相似度提供矩陣之間的方向資訊,這有助於瞭解它們對齊的緊密程度。

  • 餘弦相似度涉及非常簡單的數學計算。

  • 餘弦相似度是一種高度通用的技術,它可以用於各種應用,如影像處理、自然語言處理、控制系統、資訊檢索、文件聚類等等。

餘弦相似度的缺點

除了優點之外,餘弦相似度也有一些缺點。以下是餘弦相似度的一些主要缺點:

  • 餘弦相似度在計算中不使用矩陣的幅度。因此,此技術不能用於幅度資訊至關重要的應用。

  • 餘弦相似度對矩陣之間的角度非常敏感。因此,角度的微小變化會導致計算結果出現重大誤差。

  • 餘弦相似度在計算中不使用資料的語義含義,並且平等地考慮矩陣的所有維度。

在簡要概述了餘弦相似度、其公式、優點和缺點之後。現在讓我們討論如何使用MATLAB計算兩個矩陣之間的餘弦相似度。

使用MATLAB計算兩個矩陣之間的餘弦相似度

在MATLAB中,我們可以按照以下步驟計算兩個矩陣之間的餘弦相似度:

  • 步驟(1)- 建立兩個矩陣。

  • 步驟(2)- 歸一化矩陣,使其具有單位長度。

  • 步驟(3)- 計算兩個矩陣的點積。

  • 步驟(4)- 計算兩個矩陣的幅度。

  • 步驟(5)- 使用餘弦相似度公式計算兩個矩陣之間的相似度值。

  • 步驟(6)- 顯示結果。

現在,讓我們來看一些例子,瞭解如何實現MATLAB程式碼來計算兩個矩陣之間的餘弦相似度。

MATLAB示例

% MATLAB program to demonstrate cosine similarity calculation
% Create two sample matrices
A = [1 3 5; 2 4 6; 7 9 2];
B = [7 9 8; 6 4 5; 3 1 2];

% Normalize the matrices A and B
Normalized_A = A ./ norm(A, 'fro');
Normalized_B = B ./ norm(B, 'fro');

% Calculate dot product between matrices A and B
Dot_Product = sum(sum(A .* B));

% Calculate the magnitudes of matrices A and B
Magnitude_A = sqrt(sum(sum(A.^2)));
Magnitude_B = sqrt(sum(sum(B.^2)));

% Calculate the cosine similarity between matrices A and B
Cosine_Similarity = Dot_Product ./ (Magnitude_A * Magnitude_B);

% Display the matrices A and B and their cosine similarity value
disp('Matrix A: ');
disp(A);
disp('Matrix B: ');
disp(B);
disp('Cosine Similarity between Matrices A and B: ');
disp(Cosine_Similarity);

輸出

Matrix A: 
     1     3     5
     2     4     6
     7     9     2

Matrix B: 
     7     9     8
     6     4     5
     3     1     2

Cosine Similarity between Matrices A and B: 
    0.6555

結論

在本教程中,我們解釋了什麼是餘弦相似度及其應用。我們討論了計算兩個矩陣之間餘弦相似度的分步過程,還包括一個示例程式來演示餘弦相似度計算的實際實現。

更新於:2023年9月6日

653 次瀏覽

啟動您的職業生涯

透過完成課程獲得認證

開始
廣告
© . All rights reserved.