資料分析 - 概述



資料分析是指檢查、清理、轉換和建模資料以發現有用資訊、提出結論和支援決策的過程。

.

資料分析的型別

存在多種資料分析技術,涵蓋商業、科學、社會科學等各個領域,並具有各種名稱。主要的資料分析方法包括:

  • 資料探勘
  • 商業智慧
  • 統計分析
  • 預測分析
  • 文字分析

資料探勘

資料探勘是對大量資料進行分析,以提取以前未知的、有趣的模式、異常資料和依賴關係。請注意,目標是從大量資料中提取模式和知識,而不是提取資料本身。

資料探勘分析涉及人工智慧、機器學習、統計學和資料庫系統交叉領域中的計算機科學方法。

從資料探勘獲得的模式可以被視為輸入資料的摘要,可用於進一步分析或透過決策支援系統獲得更準確的預測結果。

商業智慧

商業智慧技術和工具用於獲取和轉換大量非結構化業務資料,以幫助識別、開發和創造新的戰略業務機會。

商業智慧的目標是允許輕鬆解釋大量資料以識別新的機會。它有助於根據可以為企業提供競爭市場優勢和長期穩定性的見解實施有效的策略。

統計分析

統計學是對資料的收集、分析、解釋、展示和組織的研究。

在資料分析中,使用兩種主要的統計方法:

  • 描述性統計 - 在描述性統計中,使用數值描述符(例如 -)來彙總來自整個人群或樣本的資料:

    • 連續資料的平均值、標準差

    • 分類資料的頻率、百分比

  • 推論統計 - 它利用樣本資料中的模式來推斷所代表的人群或考慮隨機性。這些推論可以是:

    • 回答有關資料的是/否問題(假設檢驗)

    • 估計資料的數值特徵(估計)

    • 描述資料中的關聯(相關性)

    • 對資料中的關係進行建模(例如迴歸分析)

預測分析

預測分析使用統計模型來分析當前和歷史資料,以預測未來或其他未知事件。在商業中,預測分析用於識別有助於決策的風險和機會。

文字分析

文字分析,也稱為文字挖掘或文字資料探勘,是從文字中提取高質量資訊的流程。文字挖掘通常涉及構建輸入文字、使用統計模式學習等方法在結構化資料中匯出模式,以及最終評估和解釋輸出。

資料分析流程

統計學家 John Tukey 在 1961 年將資料分析定義為“分析資料的程式、解釋此類程式結果的技術、規劃資料收集以使其分析更容易、更精確或更準確的方法,以及所有適用於分析資料的(數學)統計機器和結果。”

因此,資料分析是一個從各種來源獲取大型非結構化資料並將其轉換為對以下方面有用的資訊的流程:

  • 回答問題
  • 檢驗假設
  • 決策
  • 證偽理論

使用 Excel 進行資料分析

Microsoft Excel 提供了幾種分析和解釋資料的方法。資料可以來自各種來源。資料可以以多種方式進行轉換和格式化。它可以使用相關的 Excel 命令、函式和工具進行分析 - 包括條件格式、區域、表格、文字函式、日期函式、時間函式、財務函式、小計、快速分析、公式審計、查詢工具、假設分析、求解器、資料模型、PowerPivot、PowerView、PowerMap 等。

您將學習這些使用 Excel 的資料分析技術,分為兩部分:

  • 使用 Excel 進行資料分析和
  • 使用 Excel 進行高階資料分析
廣告