NumPy char.encode() 函式



NumPy 的char.encode()函式用於使用指定的編碼(例如 UTF-8 或 ASCII)將字串陣列中的每個元素編碼為位元組字串。

當我們需要將普通字串轉換為特定編碼格式(通常用於儲存或傳輸目的)時,此函式非常有用。

語法

以下是 NumPy char.encode() 函式的語法:

numpy.char.encode(a, encoding=None, errors=None)

引數

以下是 NumPy char.encode() 函式的引數:

  • a(array_like): 要編碼的輸入字串陣列。

  • encoding(str, 可選): 用於將字串轉換為位元組的編碼。預設值為 'utf-8'。

  • errors(str, 可選): 此引數指定錯誤處理方案,其中 'strict' 丟擲錯誤,'ignore' 跳過無效字元,'replace' 將其替換為佔位符。

返回值

此函式返回一個位元組字串陣列,其形狀與輸入陣列相同。輸出陣列的每個元素都是輸入陣列中相應字串的位元組編碼版本,使用指定的編碼進行編碼。

示例 1

以下是 NumPy char.encode() 函式的基本示例。在此示例中,我們有一個字串陣列,我們將使用 UTF-8 編碼將其編碼為位元組字串:

import numpy as np

arr = np.array(['hello', 'world', 'numPy'])
encoded_arr = np.char.encode(arr, encoding='utf-8')
print(encoded_arr)

以下是 numpy.char.encode() 函式基本示例的輸出:

[b'hello' b'world' b'numPy']

示例 2

如果要使用 ASCII 編碼對字串進行編碼,則可以指定 encoding 引數。以下是使用 ASCII 編碼陣列字串的示例:

import numpy as np
arr = np.array(['hello', 'world', 'numPy'])
encoded_arr = np.char.encode(arr, encoding='ascii')
print(encoded_arr)

以下是上述示例的輸出:

[b'hello' b'world' b'numPy']

示例 3

如果要在編碼過程中用佔位符替換無效字元,則可以使用函式char.encode()的 errors='replace' 引數。以下為此示例:

import numpy as np
arr = np.array(['hello', 'wörld', 'numPy'])
encoded_arr = np.char.encode(arr, encoding='ascii', errors='replace')
print(encoded_arr)

以下是替換陣列字串中無效字元後的輸出:

[b'hello' b'w?rld' b'numPy']
numpy_string_functions.htm
廣告