- 自然語言工具包教程
- 自然語言工具包 - 首頁
- 自然語言工具包 - 簡介
- 自然語言工具包 - 入門
- 自然語言工具包 - 文字分詞
- 訓練分詞器和過濾停用詞
- 在Wordnet中查詢單詞
- 詞幹提取和詞形還原
- 自然語言工具包 - 單詞替換
- 同義詞和反義詞替換
- 語料庫讀取器和自定義語料庫
- 詞性標註基礎
- 自然語言工具包 - 一元標註器
- 自然語言工具包 - 組合標註器
- 自然語言工具包 - 更多NLTK標註器
- 自然語言工具包 - 語法分析
- 組塊和資訊提取
- 自然語言工具包 - 轉換組塊
- 自然語言工具包 - 轉換樹
- 自然語言工具包 - 文字分類
- 自然語言工具包資源
- 自然語言工具包 - 快速指南
- 自然語言工具包 - 有用資源
- 自然語言工具包 - 討論
自然語言工具包 - 入門
為了安裝NLTK,我們必須在我們的計算機上安裝Python。您可以訪問連結www.python.org/downloads並選擇適合您作業系統的最新版本,例如Windows、Mac和Linux/Unix。有關Python的基本教程,您可以參考連結www.tutorialspoint.com/python3/index.htm。
現在,一旦您在計算機系統上安裝了Python,讓我們瞭解如何安裝NLTK。
安裝NLTK
我們可以在不同的作業系統上安裝NLTK,如下所示:
在Windows上
為了在Windows作業系統上安裝NLTK,請按照以下步驟操作:
首先,開啟Windows命令提示符並導航到pip資料夾的位置。
接下來,輸入以下命令來安裝NLTK:
pip3 install nltk
現在,從Windows開始選單開啟PythonShell,並輸入以下命令以驗證NLTK的安裝:
Import nltk
如果您沒有收到任何錯誤,則表示您已成功在安裝了Python3的Windows作業系統上安裝了NLTK。
在Mac/Linux上
為了在Mac/Linux作業系統上安裝NLTK,請寫入以下命令:
sudo pip install -U nltk
如果您在計算機上沒有安裝pip,則請按照以下說明首先安裝pip:
首先,使用以下命令更新軟體包索引:
sudo apt update
現在,輸入以下命令以安裝python 3的pip:
sudo apt install python3-pip
透過Anaconda
為了透過Anaconda安裝NLTK,請按照以下步驟操作:
首先,要安裝Anaconda,請訪問連結https://www.anaconda.com/download,然後選擇您需要安裝的Python版本。
一旦您在計算機系統上安裝了Anaconda,請轉到其命令提示符並寫入以下命令:
conda install -c anaconda nltk
您需要檢視輸出並輸入“yes”。NLTK將被下載並安裝到您的Anaconda軟體包中。
下載NLTK的資料集和包
現在我們已經在計算機上安裝了NLTK,但是為了使用它,我們需要下載其中可用的資料集(語料庫)。一些可用的重要資料集包括stpwords、gutenberg、framenet_v15等等。
藉助以下命令,我們可以下載所有NLTK資料集:
import nltk nltk.download()
您將獲得以下已下載的NLTK視窗。
現在,單擊下載按鈕以下載資料集。
如何執行NLTK指令碼?
以下是一個示例,其中我們使用PorterStemmer nltk類實現了Porter詞幹提取演算法。透過此示例,您將能夠了解如何執行NLTK指令碼。
首先,我們需要匯入自然語言工具包(nltk)。
import nltk
現在,匯入PorterStemmer類以實現Porter詞幹提取演算法。
from nltk.stem import PorterStemmer
接下來,建立Porter Stemmer類的例項,如下所示:
word_stemmer = PorterStemmer()
現在,輸入您想要進行詞幹提取的單詞。
word_stemmer.stem('writing')
輸出
'write'
word_stemmer.stem('eating')
輸出
'eat'