找到 413 篇文章 關於資料探勘

為什麼商業分析師需要資料倉庫?

Ginni
更新於 2021年11月22日 07:38:15

380 次瀏覽

資料倉庫是一種主要用於收集和管理來自各種來源的資料的技術,以便為企業提供有意義的商業洞察。資料倉庫專門設計用於支援管理決策。簡單來說,資料倉庫定義了一個獨立於組織運營資料庫維護的資料庫。資料倉庫系統能夠整合多個應用程式系統。它們透過支援一個可靠的、整合的歷史資訊分析平臺來提供資料處理。資料倉庫的技術包括資料清洗、資料整合和聯機分析處理 (OLAP),即具有諸如……功能的分析技術 閱讀更多

資料倉庫的組成部分是什麼?

Ginni
更新於 2021年11月22日 07:36:42

3K+ 次瀏覽

資料倉庫的主要組成部分如下:資料來源 - 資料來源定義了一個電子記錄庫,其中包含對管理使用或分析感興趣的資料。資料庫的主機(例如 IBM DB2、ISAM、Adabas、Teradata 等)、客戶機-伺服器資料庫(例如 Teradata、IBM DB2、Oracle 資料庫、Informix、Microsoft SQL Server 等)、PC 資料庫(例如 Microsoft Access、Alpha Five)、電子表格(例如 Microsoft Excel)以及任何其他電子資料儲存。資料倉庫 - 資料倉庫通常是關係資料庫。它應該被組織成以最支援查詢和……的方式儲存資料 閱讀更多

為什麼我們需要一個單獨的資料倉庫?

Ginni
更新於 2021年11月22日 07:35:16

5K+ 次瀏覽

資料倉庫是一種主要用於收集和管理來自各種來源的資料的技術,以便為企業提供有意義的商業洞察。資料倉庫專門設計用於支援管理決策。簡單來說,資料倉庫指的是一個獨立於組織運營資料庫維護的資料庫。資料倉庫系統能夠整合多個應用程式系統。它們透過支援一個可靠的、整合的歷史資訊分析平臺來提供資料處理。資料倉庫查詢很複雜,因為它們包含在彙總級別計算大量資訊。它可能需要使用…… 閱讀更多

運營資料庫和資料倉庫的區別?

Ginni
更新於 2021年11月22日 08:41:43

730 次瀏覽

運營資料庫運營資料庫是資料倉庫的資料來源。它包含用於執行企業正常運營的詳細資訊資料。資料通常會在建立更新時發生變化,並反映最終交易的最新值。它也稱為 OLTP(聯機事務處理資料庫),用於即時管理動態資料。運營資料庫的要求僅僅是控制資訊的插入和更新,以及對資料操作和檢視機制的有效訪問。資料倉庫資料倉庫系統為使用者或知識工作者提供資料分析和決策支援。此類系統可以構建…… 閱讀更多

什麼是資料倉庫?

Ginni
更新於 2021年11月22日 07:32:04

769 次瀏覽

資料倉庫是一種主要用於收集和管理來自各種來源的資料的技術,以便為企業提供有意義的商業洞察。資料倉庫專門設計用於支援管理決策。簡單來說,資料倉庫定義了一個獨立於組織運營資料庫維護的資料庫。資料倉庫系統能夠整合多個應用程式系統。它們透過提供一個可靠的、整合的歷史資訊分析平臺來提供資料處理。資料倉庫在多維空間中概括和集中資料。資料倉庫的構建包含資料清洗、資料整合和資料轉換,並且可以…… 閱讀更多

什麼是資料立方體聚合?

Ginni
更新於 2021年11月22日 07:27:09

5K+ 次瀏覽

資料整合是將來自多個不同來源的資料合併的過程。在執行資料整合時,它必須處理資料冗餘、不一致、重複等問題。在資料探勘中,資料整合是一種記錄預處理方法,包括將來自多個異構資料來源的資料合併成一致的資料,以保留和提供資料的統一視角。資料整合在醫療保健行業尤為重要。來自多個患者記錄和診所的整合資料透過將來自多個系統的資訊整合到對有益資訊的單一視角中,幫助臨床醫生識別醫療疾病和疾病,從而…… 閱讀更多

分類資料的離散化和概念層次生成的技術是什麼?

Ginni
更新於 2021年11月19日 12:25:37

1K+ 次瀏覽

分類資料是離散資料。分類屬性具有固定數量的不同值,這些值之間沒有順序,包括地理區域、工作類別和專案型別。生成分類資料概念層次結構的各種方法如下:使用者或專家在模式級別顯式指定屬性的部分排序 - 分類屬性或維度的概念層次結構通常包含一組屬性。使用者或專業人員可以透過在模式級別定義屬性的部分或全部排序來簡單地表示概念層次結構。例如,一個…… 閱讀更多

數值資料的離散化和概念層次生成的技術是什麼?

Ginni
更新於 2021年11月19日 12:20:34

2K+ 次瀏覽

由於適用資料範圍的廣泛多樣性和資料值的頻繁更新,為數值屬性定義概念層次結構是複雜且費力的。數值資料概念層次生成有各種方法,如下所示:分箱 - 分箱是一種基於定義數量的箱的自頂向下拆分技術。這些方法也用作用於數值減少和概念層次生成的離散化方法。這些技術可以遞迴地應用於生成的劃分以建立概念層次結構。分箱不使用類資料,因此是一種無監督的離散化技術。它…… 閱讀更多

什麼是資料離散化?

Ginni
更新於 2021年11月19日 12:19:05

5K+ 次瀏覽

資料離散化技術可用於透過將屬性的範圍劃分為區間來減少給定連續屬性的值的數量。可以使用區間標籤來恢復實際資料值。它可以恢復具有少量區間標籤的連續屬性的多個值,因此減少並簡化了原始資訊。這導致了簡潔、易於使用、知識級別的挖掘結果表示。離散化技術可以根據離散化的實現方式進行分類,例如它是否使用類資料或它進行的方向(即自頂向下與自底向上)。如果…… 閱讀更多

降維和數值歸約的區別?

Ginni
更新於 2021年11月19日 12:17:47

715 次瀏覽

降維
在降維中,使用資料編碼或轉換來訪問原始資料的簡化或“壓縮”表示。如果可以從壓縮資料中無損地重建原始資料,則資料縮減稱為無損的。如果重建的資料只是原始資料的近似值,則資料縮減稱為有損的。
離散小波變換 (DWT) 與離散傅立葉變換 (DFT) 密切相關,DFT 是一種包含正弦和餘弦的訊號處理技術。一般來說,DWT 可以實現更好的有失真壓縮。也就是說,如果為 DWT 保持相似數量的係數……閱讀更多

廣告
© . All rights reserved.