自然語言工具包 - 入門



為了安裝NLTK,我們必須在我們的計算機上安裝Python。您可以訪問連結www.python.org/downloads並選擇適合您作業系統的最新版本,例如Windows、Mac和Linux/Unix。有關Python的基本教程,您可以參考連結www.tutorialspoint.com/python3/index.htm

Install Natural Language Toolkit

現在,一旦您在計算機系統上安裝了Python,讓我們瞭解如何安裝NLTK。

安裝NLTK

我們可以在不同的作業系統上安裝NLTK,如下所示:

在Windows上

為了在Windows作業系統上安裝NLTK,請按照以下步驟操作:

  • 首先,開啟Windows命令提示符並導航到pip資料夾的位置。

  • 接下來,輸入以下命令來安裝NLTK:

pip3 install nltk

現在,從Windows開始選單開啟PythonShell,並輸入以下命令以驗證NLTK的安裝:

Import nltk

如果您沒有收到任何錯誤,則表示您已成功在安裝了Python3的Windows作業系統上安裝了NLTK。

在Mac/Linux上

為了在Mac/Linux作業系統上安裝NLTK,請寫入以下命令:

sudo pip install -U nltk

如果您在計算機上沒有安裝pip,則請按照以下說明首先安裝pip

首先,使用以下命令更新軟體包索引:

sudo apt update

現在,輸入以下命令以安裝python 3的pip

sudo apt install python3-pip

透過Anaconda

為了透過Anaconda安裝NLTK,請按照以下步驟操作:

首先,要安裝Anaconda,請訪問連結https://www.anaconda.com/download,然後選擇您需要安裝的Python版本。

Anaconda

一旦您在計算機系統上安裝了Anaconda,請轉到其命令提示符並寫入以下命令:

conda install -c anaconda nltk
Anaconda Command

您需要檢視輸出並輸入“yes”。NLTK將被下載並安裝到您的Anaconda軟體包中。

下載NLTK的資料集和包

現在我們已經在計算機上安裝了NLTK,但是為了使用它,我們需要下載其中可用的資料集(語料庫)。一些可用的重要資料集包括stpwords、gutenberg、framenet_v15等等。

藉助以下命令,我們可以下載所有NLTK資料集:

import nltk
nltk.download()
Natural Language Toolkit Datasets

您將獲得以下已下載的NLTK視窗。

Natural Language Toolkit Download

現在,單擊下載按鈕以下載資料集。

如何執行NLTK指令碼?

以下是一個示例,其中我們使用PorterStemmer nltk類實現了Porter詞幹提取演算法。透過此示例,您將能夠了解如何執行NLTK指令碼。

首先,我們需要匯入自然語言工具包(nltk)。

import nltk

現在,匯入PorterStemmer類以實現Porter詞幹提取演算法。

from nltk.stem import PorterStemmer

接下來,建立Porter Stemmer類的例項,如下所示:

word_stemmer = PorterStemmer()

現在,輸入您想要進行詞幹提取的單詞。

word_stemmer.stem('writing')

輸出

'write'

word_stemmer.stem('eating')

輸出

'eat'
廣告

© . All rights reserved.