什麼是大資料?

來源:酷知科普網 2.76W

大資料指無法在一定時間範圍內用常規軟體工具進行捕捉、管理和處理的資料集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的資訊資產。

什麼是大資料?

什麼是大資料

大資料指無法在一定時間範圍內用常規軟體工具進行捕捉、管理和處理的資料集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的資訊資產。

大資料歷史和當前考慮因素

雖然術語“大資料”相對較新,但收集和儲存大量資訊以進行最終分析的行為已經很久了。這個概念在 21 世紀初獲得了動力,當時行業分析師 Doug Laney 將現在主流的大資料定義表達為三個 V:

1.卷,組織從各種來源收集資料,包括業務交易,社交媒體和來自感測器或機器到機器資料的資訊。在過去,儲存它將是一個問題 – 但新技術(如 Hadoop)減輕了負擔。

2.速度,資料以前所未有的速度流入,必須及時處理。RFID 標籤,感測器和智慧電錶正在推動近乎實時處理資料的需求。

3.品種,資料有各種格式 – 從傳統資料庫中的結構化數字資料到非結構化文字文件,電子郵件,視訊,音訊,股票報價資料和金融交易。

在 SAS,我們在大資料方面考慮兩個額外的維度:

1.變化性,除了速度和資料種類的增加之外,資料流還可能與週期性峰值高度不一致。社交媒體中有什麼趨勢嗎?每日,季節性和事件觸發的峰值資料負載可能難以管理。非結構化資料更是如此。

2.複雜,今天的資料來自多個來源,這使得難以跨系統連結,匹配,清理和轉換資料。但是,有必要連線和關聯關係,層次結構和多個數據連結,否則您的資料可能會迅速失控。

什麼是大資料? 第2張

為什麼大資料很重要?

大資料的重要性不在於您擁有多少資料,而在於您使用它做了多少。您可以從任何來源獲取資料並進行分析,以找到能夠降低成本,減少時間,新產品開發和優化產品,以及智慧決策的答案。將大資料與高效能分析結合使用時,您可以完成與業務相關的任務,例如:

1.近乎實時地確定故障,問題和缺陷的根本原因;

2.根據客戶的購買習慣在銷售點生成優惠券;

3.在幾分鐘內重新計算整個風險組合;

4.在欺詐行為影響您的組織之前檢測它。

熱門標籤