如何使用 Python Pandas 庫將 JSON 檔案讀取到 DataFrame 中?


JSON 代表 JavaScript 物件表示法,它以鍵值對的形式儲存文字資料,這是一種人類可讀的資料格式。這些 JSON 檔案通常用於在網路上交換資料。JSON 物件用花括號({})括起來。JSON 的每個鍵值對之間用逗號隔開。

JSON 資料看起來非常類似於 Python 字典,但 JSON 是一種資料格式,而字典是一種資料結構。要將 JSON 檔案讀取到 Pandas DataFrame 中,我們在 Pandas 庫中可以使用 **read_json** 方法。以下示例概述瞭如何將 JSON 檔案讀取到 Pandas DataFrame 中。

示例

將本地 JSON 檔案讀取到 Pandas DataFrame 中

#importing pandas package
import pandas as pd

# reading JSON file
df = pd.read_json('E:\iris.json')

# displaying sample output
df.sample(5)

解釋

在上面的程式碼中,我們使用 pd.read_json 方法將本地 JSON 檔案讀取到 df 變數中,我們將 JSON 檔案位置作為字串傳遞給此方法。此方法會自動將 JSON 檔案中的資料轉換為 DataFrame。最初,我們將 Pandas 包匯入為 pd。最後,在最後一行,我們顯示了 DataFrame 中的 5 個示例行作為輸出。

輸出

    sepalLength   sepalWidth   petalLength    petalWidth    species
149     5.9          3.0          5.1           1.8         virginica
90      5.5          2.6          4.4           1.2         versicolor
56      6.3          3.3          4.7           1.6        versicolor
38 4.4 3.0 1.3 0.2 setosa
85 6.0 3.4 4.5 1.6 versicolor

Iris JSON 資料集/檔案作為輸入傳遞給 read_json 方法,此資料集具有 5 列和 150 行資料。在此輸出塊中,我們僅使用 df.sample() 方法顯示了 5 行資料的示例。此方法隨機返回 DataFrame 中的資料。

以同樣的方式,我們可以讀取遠端 JSON 資料,方法是在檔案路徑的位置提及遠端 URL。

示例

import pandas as pd

data = pd.read_json(
'http://universities.hipolabs.com/search?country=United+Kingdom')
print(data)

解釋

在此示例中,我們使用了一個公共 HTTP API,該 API 以 JSON 格式儲存資料。這裡也使用 read_json 方法來讀取此遠端 URL JSON 資料。

輸出


域名網頁名稱兩位字母國家程式碼州/省國家
0[abdn.ac.UK, Aberdeen.ac.uk][www.abdn.ac.uk/]阿伯丁大學GBNaN英國
1[aber.ac.uk][www.aber.ac.uk/]威爾士阿伯里斯特威斯大學GBNaN英國
2[abertay.ac.uk][www.abertay.ac.uk/]鄧迪阿伯泰大學GBNaN英國
3[aiuniv.edu][www.aiuniv.edu/]美國洲際大學 - 倫敦GBNaN英國
4[aku.edu][www.aku.edu/]阿迦汗大學GBNaN英國

此輸出包含 read_json 方法返回的 4 行 JSON 資料示例,這些資料來自公共 URL,它有 171 行和 6 列。

更新於: 2021-11-18

2K+ 瀏覽量

開啟你的 職業生涯

透過完成課程獲得認證

立即開始
廣告