向空的 Pandas DataFrame 追加資料
介紹
資料框是一種二維標記陣列,其列可以具有不同的資料型別。可以將其比作電子表格、SQL 表格,甚至 Series 物件的字典來更好地理解它。它是 Pandas 中最常用的專案。
除了資料本身,您還可以選擇為索引(行標籤)和列(列標籤)傳遞引數。如果您提供索引和/或列,則確保這些元素將存在於由您的呼叫生成的 DataFrame 中。因此,如果您將 Series 的字典與特定索引結合使用,它將丟棄與提供的索引不匹配的所有資料。
在這篇文章中,我們將學習如何向空的 Pandas DataFrame 追加資料。
Pandas
Pandas 是一個免費的開源庫,主要用於以簡單直觀的方式處理關係資料或標記資料。其主要目標是簡化此類任務。它提供各種資料結構和操作,所有這些都可用於處理數值資料和時間序列。該庫的建立基於 NumPy 庫,後者作為其基礎。Pandas 速度非常快,為使用者提供出色的速度和效率。
Wes McKinney 在 2008 年還在 AQR Capital Management 工作時提出了 Pandas 的想法。他成功說服 AQR 允許他開源 Pandas。2012 年,AQR 的另一位員工 Chang She 成為該庫的第二大貢獻者。Pandas 隨著時間的推移釋出了多個版本。Pandas 當前執行版本 1.5.2,於 2022 年 11 月 22 日釋出。
資料框 (DataFrame)
資料框是一種二維標記陣列,其列可以具有不同的資料型別。可以將其比作電子表格、SQL 表格,甚至 Series 物件的字典來更好地理解它。它是 Pandas 中最常用的專案。Pandas DataFrame 是一種二維表格資料結構,其大小可變,可以包含可能不同型別的資料,並且具有命名軸(行和列)。資料框是一種二維資料結構,這意味著資料以具有行和列的表格形式組織。資料、行和列是構成 Pandas DataFrame 的三個主要組成部分。
除了資料本身,您還可以選擇為索引(行標籤)提供引數,以及為列提供引數(列標籤)。當您呼叫方法並提供索引和/或列時,您確保這些元件將包含在作為該方法執行結果生成的 DataFrame 中。因此,如果您將 Series 的字典與特定索引結合使用,它將丟棄任何與給定索引不對應的資料,只保留匹配的資料。
如何建立一個空的資料框?
透過從 Python 庫獲取 pandas,您可以建立一個空的資料框。稍後,使用 pd.DataFrame() 建立一個沒有行或列的資料框,如下面的示例所示。請注意,pandas 庫的 DataFrame() 類類似於建構函式,用於構建類。
程式碼示例
import pandas as pdd dtf = pdd.DataFrame() #an empty dataframe is created using pandas print(dtf)
輸出
Empty DataFrame Columns: [] Index: []
如何向空的資料框追加資料?
向空資料框追加一行
import pandas as pdd dtf_p = pdd.DataFrame() #an empty data frame is created using pandas print(dtf_p) d3 = pd.DataFrame( [["ID","Name","GPA","Course","Country"], [128, "Siri",1.8,"BA","US" ], [18, "Georgia",2,"MTech", "UK"]], ) dtf_p=dtf_p.append(d3,ignore_index=False) dtf_p
輸出
向空資料框追加一列
import pandas as pdd dtf_p = pdd.DataFrame() #an empty data frame is created using pandas print(dtf_p) add = ['Delhi', 'Bangalore', 'Chennai', 'Patna'] name=['Shruti','Amiolika','Saba','Parul'] dtf_p['Name'] = name dtf_p['Address'] = add print(dtf_p)
輸出
Empty DataFrame Columns: [] Index: [] Name Address 0 Shruti Delhi 1 Amiolika Bangalore 2 Saba Chennai 3 Parul Patna
結論
在本文中,我們學習了什麼是 pandas 庫,什麼是資料框,如何實現空資料框以及如何向資料框追加行和列。