用一個公共列合併 Pandas 資料幀併為不匹配的值設定 NaN


要使用公共列合併兩個 Pandas 資料幀,請使用 merge() 函式並將 ON 引數設定為列名。要為不匹配的值設定 NaN,請使用“how”引數並將其設定為leftright。這意味著在左側或右側合併。

首先,讓我們匯入 pandas 庫並起個別名 −

import pandas as pd

讓我們建立 DataFrame1 −

dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Audi', 'Mustang', 'Bentley', 'Jaguar'],"Units": [100, 150, 110, 80, 110, 90]
   }
)

讓我們建立 DataFrame2

dataFrame2 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', 'Jaguar'],"Reg_Price": [7000, 1500, 5000, 8000, 9000, 6000]

   }
)

現在,使用公共列 Car 合併資料幀。左側“顯示左側資料幀的所有值,併為第 2 個數據幀中未匹配的值設定 NaN −

mergedRes = pd.merge(dataFrame1, dataFrame2, on ='Car', how ="left")

示例

以下為程式碼

import pandas as pd

# Create DataFrame1
dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Audi', 'Mustang', 'Bentley', 'Jaguar'],"Units": [100, 150, 110, 80, 110, 90]
   }
)

print("DataFrame1 ...\n",dataFrame1)

# Create DataFrame2
dataFrame2 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', 'Jaguar'],"Reg_Price": [7000, 1500, 5000, 8000, 9000, 6000]

   }
)

print("\nDataFrame2 ...\n",dataFrame2)

# merge DataFrames with common column Car and "left" sets NaN for unmatched values from second DataFrame
mergedRes = pd.merge(dataFrame1, dataFrame2, on ='Car', how ="left")
print("\nMerged data frame with common column...\n", mergedRes)

輸出

以下為程式碼 −

DataFrame1 ...
       Car   Units
0      BMW     100
1    Lexus     150
2     Audi     110
3  Mustang      80
4  Bentley     110
5   Jaguar      90

DataFrame2 ...
        Car   Reg_Price
0       BMW        7000
1     Lexus        1500
2     Tesla        5000
3   Mustang        8000
4  Mercedes        9000
5    Jaguar        6000

Merged data frame with common column...
       Car   Units   Reg_Price
0      BMW     100      7000.0
1    Lexus     150      1500.0
2     Audi     110         NaN
3  Mustang      80      8000.0
4  Bentley     110         NaN
5   Jaguar      90      6000.0

更新於:29-Sep-2021

774 次瀏覽

開啟你的 職業生涯

完成課程獲得證書

開始學習
廣告
© . All rights reserved.