MATLAB - 資料匯入



在 MATLAB 中匯入資料意味著從外部檔案載入資料。importdata 函式允許載入各種不同格式的資料檔案。它有以下五種形式:

序號 函式和描述
1

A = importdata(filename)

filename表示的檔案中將資料載入到陣列 A 中。

2

A = importdata('-pastespecial')

從系統剪貼簿而不是從檔案中載入資料。

3

A = importdata(___, delimiterIn)

delimiterIn解釋為 ASCII 檔案、filename 或剪貼簿資料中的列分隔符。您可以將delimiterIn與上述語法中的任何輸入引數一起使用。

4

A = importdata(___, delimiterIn, headerlinesIn)

從 ASCII 檔案、filename 或剪貼簿載入資料,從第headerlinesIn+1行開始讀取數字資料。

5

[A, delimiterOut, headerlinesOut] = importdata(___)

使用前述語法中的任何輸入引數,返回在delimiterOut中檢測到的輸入 ASCII 檔案的分隔符字元,以及在headerlinesOut中檢測到的標題行數。

預設情況下,Octave 不支援importdata()函式,因此您必須搜尋並安裝此包才能使以下示例與您的 Octave 安裝一起使用。

示例 1

讓我們載入並顯示一個影像檔案。建立一個指令碼檔案,並在其中鍵入以下程式碼:

filename = 'smile.jpg';
A = importdata(filename);
image(A);

執行該檔案時,MATLAB 將顯示影像檔案。但是,您必須將其儲存在當前目錄中。

Importing Imange Files

示例 2

在此示例中,我們匯入文字檔案並指定分隔符和列標題。讓我們建立一個以空格分隔的包含列標題的 ASCII 檔案,命名為weeklydata.txt

我們的文字檔案 weeklydata.txt 看起來像這樣:

SunDay  MonDay  TuesDay  WednesDay  ThursDay  FriDay  SaturDay
95.01   76.21   61.54    40.57       55.79    70.28   81.53
73.11   45.65   79.19    93.55       75.29    69.87   74.68
60.68   41.85   92.18    91.69       81.32    90.38   74.51
48.60   82.14   73.82    41.03       0.99     67.22   93.18
89.13   44.47   57.63    89.36       13.89    19.88   46.60

建立一個指令碼檔案,並在其中鍵入以下程式碼:

filename = 'weeklydata.txt';
delimiterIn = ' ';
headerlinesIn = 1;
A = importdata(filename,delimiterIn,headerlinesIn);

% View data
for k = [1:7]
   disp(A.colheaders{1, k})
   disp(A.data(:, k))
   disp(' ')
end

執行該檔案時,它將顯示以下結果:

SunDay
   95.0100
   73.1100
   60.6800
   48.6000
   89.1300
 
MonDay
   76.2100
   45.6500
   41.8500
   82.1400
   44.4700
 
TuesDay
   61.5400
   79.1900
   92.1800
   73.8200
   57.6300

WednesDay
   40.5700
   93.5500
   91.6900
   41.0300
   89.3600
 
ThursDay
   55.7900
   75.2900
   81.3200
   0.9900
   13.8900
 
FriDay
   70.2800
   69.8700
   90.3800
   67.2200
   19.8800

SaturDay
   81.5300
   74.6800
   74.5100
   93.1800
   46.6000

示例 3

在此示例中,讓我們從剪貼簿匯入資料。

將以下幾行復制到剪貼簿:

數學很簡單

建立一個指令碼檔案,並鍵入以下程式碼:

A = importdata('-pastespecial')

執行該檔案時,它將顯示以下結果:

A = 
   'Mathematics is simple'

低階檔案 I/O

importdata函式是一個高階函式。MATLAB 中的低階檔案 I/O 函式允許對讀取或寫入檔案的資料進行最精細的控制。但是,這些函式需要有關檔案的更詳細資訊才能有效工作。

MATLAB 提供以下函式用於在位元組或字元級別進行讀寫操作:

函式 描述
fclose 關閉一個或所有開啟的檔案
feof 測試檔案結尾
ferror 有關檔案 I/O 錯誤的資訊
fgetl 從檔案中讀取一行,刪除換行符
fgets 從檔案中讀取一行,保留換行符
fopen 開啟檔案或獲取有關開啟檔案的資訊
fprintf 將資料寫入文字檔案
fread 從二進位制檔案讀取資料
frewind 將檔案位置指示器移動到開啟檔案的開頭
fscanf 從文字檔案讀取資料
fseek 移動到檔案中的指定位置
ftell 開啟檔案中的位置
fwrite 將資料寫入二進位制檔案

使用低階 I/O 匯入文字資料檔案

MATLAB 提供以下函式用於低階匯入文字資料檔案:

  • fscanf 函式讀取文字或 ASCII 檔案中的格式化資料。

  • fgetlfgets 函式一次讀取檔案的一行,其中換行符分隔每一行。

  • fread 函式以位元組或位級別讀取資料流。

示例

我們在我們的工作目錄中儲存了一個名為 'myfile.txt' 的文字資料檔案。該檔案儲存 2012 年六月、七月和八月的三個月的降雨量資料。

myfile.txt 中的資料包含在五個地點重複的時間、月份和降雨量測量值。標題資料儲存月份數 M;因此我們有 M 組測量值。

該檔案如下所示:

Rainfall Data
Months: June, July, August
 
M = 3
12:00:00
June-2012
17.21  28.52  39.78  16.55 23.67
19.15  0.35   17.57  NaN   12.01
17.92  28.49  17.40  17.06 11.09
9.59   9.33   NaN    0.31  0.23 
10.46  13.17  NaN    14.89 19.33
20.97  19.50  17.65  14.45 14.00
18.23  10.34  17.95  16.46 19.34
09:10:02
July-2012
12.76  16.94  14.38  11.86 16.89
20.46  23.17  NaN    24.89 19.33
30.97  49.50  47.65  24.45 34.00
18.23  30.34  27.95  16.46 19.34
30.46  33.17  NaN    34.89  29.33
30.97  49.50  47.65  24.45 34.00
28.67  30.34  27.95  36.46 29.34
15:03:40
August-2012
17.09  16.55  19.59  17.25 19.22
17.54  11.45  13.48  22.55 24.01
NaN    21.19  25.85  25.05 27.21
26.79  24.98  12.23  16.99 18.67
17.54  11.45  13.48  22.55 24.01
NaN    21.19  25.85  25.05 27.21
26.79  24.98  12.23  16.99 18.67

我們將從該檔案匯入資料並顯示這些資料。請按照以下步驟操作:

  • 使用fopen函式開啟檔案並獲取檔案識別符號。

  • 使用格式說明符描述檔案中的資料,例如字串的'%s',整數的'%d'或浮點數的'%f'。

  • 要跳過檔案中的文字字元,請將它們包含在格式說明中。要跳過資料欄位,請在說明符中使用星號 ('*')。

    例如,要讀取標題並返回 M 的單個值,我們編寫:

    M = fscanf(fid, '%*s %*s\n%*s %*s %*s %*s\nM=%d\n\n', 1);
    
  • 預設情況下,fscanf 根據我們的格式說明讀取資料,直到找不到任何與資料匹配的資料,或者到達檔案結尾。在這裡,我們將使用 for 迴圈讀取 3 組資料,每次讀取 7 行 5 列。

  • 我們將在工作區中建立一個名為mydata的結構來儲存從檔案中讀取的資料。此結構體包含三個欄位 - timemonthraindata陣列。

建立一個指令碼檔案,並在其中鍵入以下程式碼:

filename = '/data/myfile.txt';
rows = 7;
cols = 5;
 
% open the file
fid = fopen(filename);
 
% read the file headers, find M (number of months)
M = fscanf(fid, '%*s %*s\n%*s %*s %*s %*s\nM=%d\n\n', 1);
 
% read each set of measurements
for n = 1:M
   mydata(n).time = fscanf(fid, '%s', 1);
   mydata(n).month = fscanf(fid, '%s', 1);
 
   % fscanf fills the array in column order,
   % so transpose the results
   mydata(n).raindata  = ...
      fscanf(fid, '%f', [rows, cols]);
end
for n = 1:M
   disp(mydata(n).time), disp(mydata(n).month)
   disp(mydata(n).raindata)
end
 
% close the file
fclose(fid);

執行該檔案時,它將顯示以下結果:

12:00:00
June-2012
   17.2100   17.5700   11.0900   13.1700   14.4500
   28.5200       NaN    9.5900       NaN   14.0000
   39.7800   12.0100    9.3300   14.8900   18.2300
   16.5500   17.9200       NaN   19.3300   10.3400
   23.6700   28.4900    0.3100   20.9700   17.9500
   19.1500   17.4000    0.2300   19.5000   16.4600
   0.3500   17.0600   10.4600   17.6500   19.3400

09:10:02
July-2012
   12.7600       NaN   34.0000   33.1700   24.4500
   16.9400   24.8900   18.2300       NaN   34.0000
   14.3800   19.3300   30.3400   34.8900   28.6700
   11.8600   30.9700   27.9500   29.3300   30.3400
   16.8900   49.5000   16.4600   30.9700   27.9500
   20.4600   47.6500   19.3400   49.5000   36.4600
   23.1700   24.4500   30.4600   47.6500   29.3400

15:03:40
August-2012
   17.0900   13.4800   27.2100   11.4500   25.0500
   16.5500   22.5500   26.7900   13.4800   27.2100
   19.5900   24.0100   24.9800   22.5500   26.7900
   17.2500       NaN   12.2300   24.0100   24.9800
   19.2200   21.1900   16.9900       NaN   12.2300
   17.5400   25.8500   18.6700   21.1900   16.9900
   11.4500   25.0500   17.5400   25.8500   18.6700
廣告