在 Python 中開啟檔案時，“U”修飾符的作用是什麼？

檔案處理在高效管理計算機程式設計領域的資料中起著關鍵作用。Python 作為一種用途廣泛且功能強大的語言，為開發人員提供了強大的機制，可以無縫地讀取和寫入檔案。在處理檔案時，Python 提供了一系列修飾符，允許微調檔案物件的行為。“U”修飾符就是一個這樣的修飾符，它在文字模式下讀取檔案時，會影響 Python 處理換行符的方式。在本篇全面的探討中，我們將深入探討“U”修飾符的細節及其在 Python 中開啟檔案時的含義。我們將以循序漸進的方式講解這些概念，並透過一些有效的程式碼示例來闡明“U”修飾符的工作原理。

Python 文字檔案讀取入門

在我們深入研究“U”修飾符之前，務必簡要了解 Python 如何讀取文字檔案。預設情況下，Python 對文字檔案使用緩衝 I/O，一次讀取一部分資料，與逐字元讀取相比，這大大提高了效率。當 Python 遇到文字檔案時，它會將各種換行符，如“\n”（換行符），“\r”（回車符）或“\r\n”（回車符後跟換行符），解釋為行尾標記。這種智慧解釋有助於無縫處理在不同作業系統上建立的文字檔案。

“U”修飾符的重要性

在文字模式下開啟檔案時，“U”修飾符處於中心地位，它提供了一種啟用通用換行符的方法。它的主要作用是影響 Python 在讀取檔案時處理換行符的方式。當我們指定“U”修飾符時，Python 會承擔將任何換行符組合（例如，“\n”、“\r”或“\r\n”）轉換為普遍認可的換行符格式“\n”的任務。這種智慧轉換使 Python 程式碼能夠優雅地處理在任何平臺上建立的文字檔案，而不管使用的換行符約定。

使用“U”修飾符讀取文字檔案

為了說明“U”修飾符的實際應用，讓我們來看一個讀取文字檔案的簡單示例，同時利用其通用換行符處理功能。假設我們有一個包含混合換行符的文字檔案，我們的目標是以無縫適應通用換行符的方式讀取它。以下程式碼片段展示了我們的方法：

示例

在這裡，我們定義了一個名為“read_text_file_with_universal_newlines”的函式，它將檔案路徑作為引數。在函式內部，我們使用“open()”函式在文字模式下開啟檔案，同時透過“U”修飾符來啟用通用換行符。隨後，我們使用“file.read()”方法讀取檔案的全部內容，並讓“U”修飾符勤勉地處理通用換行符，從而將所有換行符轉換為“\n”。

def read_text_file_with_universal_newlines(file_path):
   with open(file_path, 'rU') as file:
      file_contents = file.read()
   return file_contents

# Example usage
file_path = 'mixed_line_endings.txt'
file_contents = read_text_file_with_universal_newlines(file_path)
print(file_contents)

使用通用換行符寫入文字

如果我們想使用通用換行符編寫文字，Python 提供了一種直觀的方法來簡化這個過程。透過使用帶有“w”模式的“open()”函式，我們可以直接使用“text_to_write”引數，無需任何修改。“open()”函式將代表我們無縫地處理轉換為通用換行符。

示例

def write_text_with_universal_newlines(file_path, text_to_write):
   with open(file_path, 'w') as file:
      file.write(text_to_write)

# Example usage
file_path = 'output_file.txt'
text_to_write = "Hello\r\nWorld!\rThis is a test.\n"
write_text_with_universal_newlines(file_path, text_to_write)

使用“U”修飾符高效地逐行讀取

在逐行讀取文字檔案時，“U”修飾符成為一項寶貴的資產。讓我們深入探討如何利用“U”修飾符進行逐行讀取：

示例

在這個例子中，我們定義了一個名為“read_file_line_by_line_with_universal_newlines”的函式，它將檔案路徑作為引數。在函式內部，我們使用“open()”函式在文字模式下開啟檔案，並使用“U”修飾符。然後，我們啟動一個“for”迴圈來遍歷檔案的每一行。對於每一行，我們呼叫一個自定義的“process_line()”函式，該函式可以精確地處理資料。在這個特定示例中，我們選擇在使用“strip()”方法刪除任何前導或尾隨空格後列印每一行。由於使用了“U”修飾符，無論檔案中使用的換行符是什麼，每一行都將使用“\n”作為換行符進行恰當處理。

def read_file_line_by_line_with_universal_newlines(file_path):
   with open(file_path, 'rU') as file:
      for line in file:
         process_line(line)

def process_line(line):
   # Your custom data processing logic here
   print(line.strip())

# Example usage
file_path = 'mixed_line_endings.txt'
read_file_line_by_line_with_universal_newlines(file_path)

結合 io.StringIO 使用通用換行符

“U”修飾符為與“io”模組中的“io.StringIO”類協同工作提供了一個獨特的機會，從而可以將文字資料作為類檔案物件進行無縫處理。請觀察下面的示例以獲得更清晰的認識：

示例

在此程式碼片段中，我們引入了一個名為“read_string_as_file_with_universal_newlines”的函式，它接受一個數據字串作為引數。我們巧妙地建立了一個名為“buffer”的“io.StringIO”物件，並將資料字串無縫地傳遞到其中。“io.StringIO”物件有效地從資料字串模擬類檔案物件。接下來，我們利用帶有“r”模式的“open()”函式從前面提到的類檔案物件讀取。最後，我們讀取內容並按預期返回它們。最終結果優雅地展示了通用換行符轉換的實際效果。

import io

def read_string_as_file_with_universal_newlines(data_string):
   buffer = io.StringIO(data_string)

   with open(buffer, 'r') as file:
      file_contents = file.read()
   return file_contents

# Example usage
data_string = "Hello\r\nWorld!\rThis is a test.\n"


file_contents = read_string_as_file_with_universal_newlines(data_string)
print(file_contents)

輸出

Hello
This is a test.

總而言之，Python 中的“U”修飾符是在文字模式下開啟檔案時啟用通用換行符的重要工具。透過巧妙地將各種換行符轉換為普遍認可的“\n”格式，“U”修飾符確保了跨不同平臺一致處理換行符。當處理在不同作業系統上建立的文字檔案時，它的獨特效用尤為突出，為 Python 提供了無與倫比的便利性和無縫檔案處理功能。掌握了“U”修飾符及其多種應用，Python 開發人員可以提高其檔案處理操作的一致性和可移植性，從而開始一段通往無與倫比的內容建立能力的旅程。

Rajendra Dharmkar

更新於：2023年8月22日

826 次瀏覽

啟動您的職業生涯

完成課程獲得認證

開始學習