㈠ 求IBM R52的配置。。謝謝!!!
對R52隻有3種系列,1858集成顯卡,1846、1847 X300獨顯,所以看顯卡就知道系列了。1847配置比較高,通常512M內存
這是第一種
筆記本品牌: IBM/ThinkPad IBM系列型號: R52
產品參數詳細信息--主要功能
CPU類型 Dothan 標稱頻率 1600MHz
CPU描述 FSB 533MHz
顯示屏尺寸 14.1英寸 顯示屏描述 1024*768
內存類型 DDR2 內存大小 256MB
產品參數詳細信息--存儲性能
硬碟大小 40GB 硬碟描述 ATA-100
光碟機類型 DVD-ROM
光碟機描述 8X
產品參數詳細信息--視頻/音頻
顯卡描述 Intel Graphics Media Accelerator 900
音頻系統 SoundMAX
產品參數詳細信息--輸入輸出
鍵盤 全尺寸 網卡 10M/100M/1000M網卡
數據機 56K V.92
標准介面 2個USB2.0,紅外,IEEE 1394a,並口,VGA介面,耳機介面,麥克風
產品參數詳細信息--電能規格
電池類型 6 Cell Lithium-Ion 電池時間 3小時
產品參數詳細信息--基本特徵
厚度 34mm 重量 2.8Kg
產品參數詳細信息--其他特性
預裝操作系統 Microsoft Windows XP 家庭版
這是第二種
ThinkPad R52 18465EC主要性能
處理器品牌 INTEL
顯示屏尺寸 14英寸 筆記本處理器 Intel 奔騰M 740
筆記本主頻 1733MHz 迅馳技術 迅馳2
二級緩存 2048KB 挑錯 筆記本晶元組 Intel 915PM
系統匯流排頻率 533MHz
內存類型 DDR2 標准內存容量 256MB
最大支持內存 2048MB
ThinkPad R52 18465EC存儲性能
硬碟容量 40GB 硬碟描述 ATA-100
光碟機類型 COMBO 光碟機速度 8X
hinkPad R52 18465EC顯示屏
顯示屏類型 TFT LCD
標准解析度 1024×768
ThinkPad R52 18465EC視頻音頻
顯卡晶元 ATI Mobility Radeon X300 顯存容量 64MB
音頻系統 SoundMAX 內置音箱 有
ThinkPad R52 18465EC網路設備
紅外 網卡 100/1000M乙太網卡
MODEM 56K V.92 無線網卡 802.11b/g
ThinkPad R52 18465EC輸入輸出
指取設備 指點桿加觸摸板
I/O介面 2 USB 2.0 ,IEEE 1394,Microphone/line in
PCMCIA槽數 1個,Type II
ThinkPad R52 18465EC特徵參數
筆記本重量 2.8Kg 外觀特徵 34×314×260
機殼材料 普通機殼
ThinkPad R52 18465EC電能規格
電池規格 6 Cell Lithium-Ion 續航時間 3.6小時
ThinkPad R52 18465EC隨機配件
預裝操作系統 Windows XP 家庭版
這是第3種
IBM ThinkPad R52 1846CC2 主要性能
設計類型 光碟機可抽換
CPU類型 奔騰-M(Dothan-533) 迅馳技術 支持
標稱頻率 2GHz CPU描述 Intel Pentium M Processor 760 主板描述 I915PM
屏幕尺寸 14.1英寸 屏幕描述 1024x768
是否寬屏 否
內存類型 DDRII 內存大小 512MB
內存描述 PC2-4200 DDR2 SDRAM
IBM ThinkPad R52 1846CC2 存儲性能
硬碟大小 60GB 硬碟描述 ATA-100 (Enhanced IDE)
光碟機類型 康寶 光碟機描述 24X/24X/24X/8X Max
軟碟機描述 無
IBM ThinkPad R52 1846CC2 視頻/音頻
顯卡類型 獨立顯卡
顯卡晶元 ATI Radeon X300 顯存類型 DDR2 SDRAM 顯存容量 64MB
音頻系統 SoundMAX
IBM ThinkPad R52 1846CC2 輸入輸出
滑鼠描述 ThinkPad UltraNav
鍵盤描述 Full size
WLAN性能 802.11a/b/g,Intel PRO/Wireless 2200BG
網卡描述 1000Mbps乙太網卡
數據機 56K 紅 外 線 紅外線介面
標准介面 AC adapter
Headphone / Line out
External Display
Expansion Bus port (for Dock II/Mini Dock or Port Replicator II)
Infrared
IEEE1394
Microphone / Line in
1個並口
RJ11
RJ45
S-Video out
2 USB2.0
IBM ThinkPad R52 1846CC2 電能規格
電池類型 6 Cell Lithium-Ion 供電時間 3.6 Hrs
IBM ThinkPad R52 1846CC2 基本特徵
外形尺寸 34*314*260 筆記本重量 2800g
IBM ThinkPad R52 1846CC2 其他特性
操作系統 中文Microsoft Windows XP家庭版
上市日期 2005
附帶軟體 Access Program, ThinkVantage Access Connections, ThinkVantage Rescue and Recovery
Adobe Acrobat Reader
其他特點 IBM Embedded Security Subsystem 2.0
絕對是出廠的配置
㈡ 資料庫一體機與大數據技術區別何在
資料庫一體機與大數據技術區別何在
作為近期信息管理領域最為熱門的兩項技術,資料庫一體機與大數據技術的硬體架構基本相同,但軟體體系有著本質的區別,這也導致了兩者擁有不同的特徵表現。
隨著企業數據量的快速增長,以及用戶對服務水平要求的不斷提高,相當長的一段時間以來,傳統關系資料庫技術在生產實踐中表現出明顯的能力不足。如何以合理的成本獲得海量數據的高可用性已經成為現代IT領域的重大挑戰。為了應對這一挑戰,近年來,IT市場中相繼出現了許多新的技術手段,其中最為引人注目的便是由主流資料庫廠商主導的資料庫一體機(例如Oracle ExaData以及IBM Netezza等),以及以開源力量為主的大數據技術。
不過,雖然資料庫一體機與大數據技術都是當今的熱門話題,並都已經被廣泛應用,但卻有相當一部分用戶仍然無法深入了解兩者之間的本質區別與關系。同時,很多用戶也在為如何在企業內部對這兩者進行正確定位而感到困惑。為此,本文特別對資料庫一體機(也可稱新一代主流關系型資料庫)和大數據技術(例如Hadoop,主要指MapRece與NoSQL)的相關技術特點進行對比。
硬體與軟體
從本質上來講,資料庫一體機與大數據技術的硬體架構基本相同,同樣是採用x86伺服器集群的分布式並行模式,以應對大規模的數據與計算。但是,資料庫一體機的賣家們通常會對其產品的硬體體系進行面向產品化的、系統性的整體調優,同時也會有各自的特色手段。比方說Oracle ExaData的Infiniband、Flash Cache,IBM Nettezza的FPGA(現場可編程邏輯門陣)等。[page] 資料庫一體機與大數據技術最為核心的區別是在軟體體繫上。資料庫一體機的核心是SQL體系,這不只是指SQL解析,更重要的是指包括SQL優化引擎、索引、鎖、事務、日誌、安全以及管理等在內的完整而龐大的技術體系。這一體系是成熟的、面向產品的。
大數據技術軟體體系中的MapRece則提供了一個面向海量數據處理的分布式編程框架,使用者需要自行編制所需要的計算邏輯。MapRece對數據的讀寫是批量連續的,而不是隨機的。而大數據技術的另一體系NoSQL則大都只是提供了海量數據的分布式存儲,以及基於索引的快速讀取機制,為使用者提供的大多是編程API(雖然也有類SQL的語言,但其本質並不是完整的SQL體系)。
由於SQL體系的復雜性與處理邏輯的整體關聯性,導致資料庫一體機在擴展性上遠不及大數據技術體系,雖然前者已經在很大程度上改善了傳統關系資料庫垂直擴展的瓶頸。MapRece與NoSQL的單個集群往往可以擴展到數千個節點,而資料庫一體機如果在硬體上擴展到這個規模,從軟體上來講,已經是沒有意義的了。
特徵與本質
基於軟體體系的不同,導致了資料庫一體機和大數據技術有著不同的特徵表現。資料庫一體機往往適合於存儲關系復雜的數據模型(例如企業核心業務數據),並且需要限制為基於二維表的關系模型。同時,資料庫一體機適合進行一致性與事務性要求高的計算,以及復雜的BI計算。
大數據技術則更適合於存儲較簡單的數據模型,並且可以不受模式的約束。因而其可存儲管理的數據類型更加豐富。大數據技術還適合進行一致性與事務性要求不高的計算(主要是指NoSQL的查詢操作),以及對超大規模海量數據的、批量的分布式並行計算(基於MapRece)。
需要注意的是,NoSQL資料庫由於擺脫了繁瑣的SQL體系約束,其查詢與插入的效率比資料庫一體機更高。大數據技術比資料庫一體機所能處理的數據量也相對大些,這主要是因為其集群可以擴展得更大。
從本質上講,MapRece是對海量數據分布式計算領域的一個重要創新,但也只是在適合於並行處理的大規模批量處理問題上更占優勢,而對一些復雜操作,則不一定具有優勢。NoSQL則可以看作是對傳統關系資料庫進行簡化的結果。由於NoSQL資料庫的設計思想只是提取出關系型資料庫的索引機制,並加了上分布式存儲,把SQL體系中那些對「某些特殊問題」而言並不需要的東西統統刪去,由此實現了更優秀的效率、擴展性與靈活性。[page] 因此,我們可以明顯地看到,在實踐中,有很多問題(特別是流行的大數據問題),關系資料庫中的許多設計並不需要,這才是NoSQL發展壯大的根本立足點。
關系與協作
通過前面的分析,我們不難得出這樣的結論:大數據技術與資料庫一體機應該是相輔相成,並非互相替代的。它們針對不同的應用場景設計,並相互補充與合作。具體來說,大數據技術可以實現:
■處理企業內海量的、模型簡單、類型多樣的非結構化與半結構化數據(例如社會化數據、各種日誌甚至圖片、視頻等),其處理結果可以被直接使用;
■以上處理結果也同時可以被當成是新的輸入存儲到企業級數據倉庫中,這時大數據機相當於是面向大數據源的、新的ETL(提取-轉換-載入)手段;
■面向海量數據的、不太適合SQL的存儲或計算。
而資料庫一體機則應該還是作為企業數據倉庫的主流技術,至少在很長一段時間內應該是這樣。它負責存儲與計算最主要的、有重大價值的企業關鍵業務數據。
現存的誤區
有些人認為,雖然大數據技術的原始開源狀態還不適合充當企業級數據倉庫主平台的要求,但經過開發、補充,應該是可以的。其實這個觀點沒有錯。但實際上,對開源的大數據技術進行補充開發,所要補充的正是大數據技術在原始設計上就去除了的、那些本屬於關系型資料庫體系的東西。
如果進行這樣的補充開發,企業不僅會面臨龐大的、難於估計的開發工作量,同時也難以像專業資料庫廠商那樣實現這些工作的理論化、產品化與體系化。雖然從純技術的角度上講,開發什麼都有可能。但是如果企業真的准備這樣做,是要開發另一個商業化的關系資料庫嗎?很明顯,這違背了大數據技術的設計初衷。
㈢ IBM旗下產品
IBM旗下產品
在過去的幾年裡,IBM已經完成了業務模式的完全轉型。IBM 的全球能力包括服務、軟體、硬體系統、研發及相關融資支持。IBM的業務模式是靈活的,能夠與不斷變化的市場和經濟環境相適應。
IBM的主要業務部門包括:全球信息科技服務部,全球企業咨詢服務部,軟體集團,系統與科技部,全球融資部。
軟體產品
軟體產品包括Information Management、Lotus、Rational、Tivoli、WebSphere 五大家族。
Information Management:資料庫管理系統、企業內容管理、Cognos 商業智能和績效管理、信息整合、數據倉庫、數據挖掘等。
Lotus:電子郵件等協作應用、社交網站和Mashup、企業辦公套件、移動和無線、電子表格和Web內容管理等。
Rational:軟體開發管理、軟體測試、軟體質量管理、企業架構管理、需求管理、軟體項目管理、企業現代化、確保 Web 站點的遵從性和安全性等。
Tivoli:服務管理、存儲管理、資產管理、安全管理、業務應用管理、雲計算、虛擬化管理和能效管理等。
WebSphere:應用伺服器、企業門戶應用、電子商務、應用整合、業務流程管理、業務規則管理系統、優化、供應鏈應用、可視化等。
伺服器產品
伺服器產品包括:基於Intel架構的伺服器xSeries,基於AMD架構的伺服器,BladeCenter刀片伺服器,UNIX 伺服器pSeries,中型企業級伺服器iSeries,大型主機zSeries。
專業圖形工作站:A Pro系列,M Pro系列,Z pro系列,T221超高解析度平面顯示器。
網格計算
存儲技術:磁碟存儲系統,磁帶存儲,網路存儲,存儲軟體。
零售終端:商業收款機,POS軟體
其他產品
其它產品: ACS 先進布線系統,IBM電源解決方案產品目錄,Cisco產品及服務隨著微軟公司對計算機產業的影響已經由促進變成了阻礙,IBM成為了打倒微軟的希望所在,IBM支持著所有熱愛自由的計算機使用者。
在過去的80多年裡,世界經濟不斷發展,現代科學日新月異,IBM始終以超前的技術、出色的管理和獨樹一幟的`產品領導著信息產業的發展,保證了世界范圍內幾乎所有行業用戶對信息處理的全方位需求。眾所周知,早在1969年,阿波羅宇宙飛船載著3名宇航員,肩負著人類的使命,首次登上了月球;1981年哥倫比亞號太空梭又成功地飛上了天空。這兩次歷史性的太空飛行都凝聚著IBM無與倫比的智慧。IBM的事業就象宇宙飛船一樣永遠向著更高的目標不斷奮進,造福人類。
鑒於IBM在程序生命周期管理平台和資料庫方面的努力,專注於給企業提供高效的管理和開發方法,被著名IT雜志“SD Times”列入2013 SD Times 100,位於“應用程序生命周期管理&開發工具”分類中的第三位,“資料庫和資料庫管理”分類中的第四位。
IT基礎設施
2014年10月漢莎,同意將IT基礎設施部門出售給IBM,根據一項七年期協議,漢莎將把所有的IT基礎設施服務外包給IBM。
;㈣ IBM的 AS/400是什麼
IBM的 AS/400意思是:AS400好像是IBM生產的一種微型計算機的型號。
字母A:採用的是Unix的一個變種OS——AIX,。
字母S:系統,SYSTEM 。
AS400是IBM早期推出的商用小型機。操作系統與Windos、Unix等都不一樣,
不過正逐步靠近Unix。
㈤ IBM大型機多少錢一台
IBM大型機要上億人民幣,非常貴。
IBM大型機(IBM mainframe)是硬體概念,最初是指裝在非常大的帶框鐵盒子里的大型計算機系統,以用來同小一些的迷你機和微型機有所區別。由於有相對特定的語言編程(COBOL語言),操作系統(目前貌似是OS390)和資料庫(DB2),與通用的主流語言不相通,所以廣義上的IBM大型機不僅僅是一個硬體上的概念,它是硬體和專屬軟體的一個有機整體,是一套密不可分的封閉系統。
其主要特點:
1、穩定性好,好的無與倫比比一般小型機高不知道多少檔次(據說多長多長時間不宕機,對於一些大型銀行,物流,金融公司來講特別重要,時間就是金錢啊)。
安全性高(用的COBOL語言特性決定的,嚴謹,對話式語言,上世紀60年代到如今沒有什麼變化,所以極少有黑客去研究這些,看windows的補丁一個接一個,那是被人研究的太多了)。
2、運算能力超級強(不是說把幾百台PC連起來就能趕上一個大型機的)。
3、價格貴(幾百萬美元,近億人民幣)。
4、企業用得少(大家想想,能用大型機的單位,這成本。。。如果沒有特定要求,沒人得起)但用的企業都是很有實力的企業。
5、人才緊缺(教學硬體要求高,高校及社會培訓都少,培訓成本較高)。
㈥ 什麼是大數據時代
大數據時代
(巨量資料(IT行業術語))
編輯
最早提出「大數據」時代到來的是全球知名咨詢公司麥肯錫,麥肯錫稱:「數據,已經滲透到當今每一個行業和業務職能領域,成為重要的生產因素。人們對於海量數據的挖掘和運用,預示著新一波生產率增長和消費者盈餘浪潮的到來。」 「大數據」在物理學、生物學、環境生態學等領域以及軍事、金融、通訊等行業存在已有時日,卻因為近年來互聯網和信息行業的發展而引起人們關注。
中文名
大數據時代
外文名
Big data
提出者
麥肯錫
類 屬
科技名詞
目錄
1 產生背景
2 影響
▪ 大數據
▪ 大數據的精髓
▪ 數據價值
▪ 可視化
3 特徵
4 案例分析
5 產業崛起
6 提供依據
7 應對措施
產生背景
編輯
進入2012年,大數據(big data)一詞越來越多地被提及,人們用它來描述和定義信息爆炸時代產生的海量數
大數據時代來臨
據,並命名與之相關的技術發展與創新。它已經上過《紐約時報》《華爾街日報》的專欄封面,進入美國白宮官網的新聞,現身在國內一些互聯網主題的講座沙龍中,甚至被嗅覺靈敏的國金證券、國泰君安、銀河證券等寫進了投資推薦報告。[1]
數據正在迅速膨脹並變大,它決定著企業的未來發展,雖然很多企業可能並沒有意識到數據爆炸性增長帶來問題的隱患,但是隨著時間的推移,人們將越來越多的意識到數據對企業的重要性。
正如《紐約時報》2012年2月的一篇專欄中所稱,「大數據」時代已經降臨,在商業、經濟及其他領域中,決策將日益基於數據和分析而作出,而並非基於經驗和直覺。
哈佛大學社會學教授加里·金說:「這是一場革命,龐大的數據資源使得各個領域開始了量化進程,無論學術界、商界還是政府,所有領域都將開始這種進程。」[2]
影響
編輯
大數據
現在的社會是一個高速發展的社會,科技發達,信息流通,人們之間的交流越來越密切,生活也越來越方便,大數據就是這個高科技時代的產物。[3]
隨著雲時代的來臨,大數據(Big data)也吸引了越來越多的關注。大數據(Big data)通常用來形容一個公司創造的大量非結構化和半結構化數據,這些數據在下載到關系型資料庫用於分析時會花費過多時間和金錢。大數據分析常和雲計算聯繫到一起,因為實時的大型數據集分析需要像MapRece一樣的框架來向數十、數百或甚至數千的電腦分配工作。[2]
在現今的社會,大數據的應用越來越彰顯他的優勢,它佔領的領域也越來越大,電子商務、O2O、物流配送等,各種利用大數據進行發展的領域正在協助企業不斷地發展新業務,創新運營模式。有了大數據這個概念,對於消費者行為的判斷,產品銷售量的預測,精確的營銷范圍以及存貨的補給已經得到全面的改善與優化。[4]
「大數據」在互聯網行業指的是這樣一種現象:互聯網公司在日常運營中生成、累積的用戶網路行為數據。這些數據的規模是如此龐大,以至於不能用G或T來衡量。
大數據到底有多大?一組名為「互聯網上一天」的數據告訴我們,一天之中,互聯網產生的全部內容可以刻滿1.68億張DVD;發出的郵件有2940億封之多(相當於美國兩年的紙質信件數量);發出的社區帖子達200萬個(相當於《時代》雜志770年的文字量);賣出的手機為37.8萬台,高於全球每天出生的嬰兒數量37.1萬……[1]
截止到2012年,數據量已經從TB(1024GB=1TB)級別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級別。國際數據公司(IDC)的研究結果表明,2008年全球產生的數據量為0.49ZB,2009年的數據量為0.8ZB,2010年增長為1.2ZB,2011年的數量更是高達1.82ZB,相當於全球每人產生200GB以上的數據。而到2012年為止,人類生產的所有印刷材料的數據量是200PB,全人類歷史上說過的所有話的數據量大約是5EB。IBM的研究稱,整個人類文明所獲得的全部數據中,有90%是過去兩年內產生的。而到了2020年,全世界所產生的數據規模將達到今天的44倍。[5] 每一天,全世界會上傳超過5億張圖片,每分鍾就有20小時時長的視頻被分享。然而,即使是人們每天創造的全部信息——包括語音通話、電子郵件和信息在內的各種通信,以及上傳的全部圖片、視頻與音樂,其信息量也無法匹及每一天所創造出的關於人們自身的數字信息量。
這樣的趨勢會持續下去。我們現在還處於所謂「物聯網」的最初級階段,而隨著技術成熟,我們的設備、交通工具和迅速發展的「可穿戴」科技將能互相連接與溝通。科技的進步已經使創造、捕捉和管理信息的成本降至2005年的六分之一,而從2005年起,用在硬體、軟體、人才及服務之上的商業投資也增長了整整50%,達到了4000億美元。[5]
大數據的精髓
大數據帶給我們的三個顛覆性觀念轉變:是全部數據,而不是隨機采樣;是大體方向,而不是精確制導;是相關關系,而不是因果關系。[6]
A.不是隨機樣本,而是全體數據:在大數據時代,我們可以分析更多的數據,有時候甚至可以處理和某個特別現象相關的所有數據,而不再依賴於隨機采樣(隨機采樣,以前我們通常把這看成是理所應當的限制,但高性能的數字技術讓我們意識到,這其實是一種人為限制);
B.不是精確性,而是混雜性:研究數據如此之多,以至於我們不再熱衷於追求精確度;之前需要分析的數據很少,所以我們必須盡可能精確地量化我們的記錄,隨著規模的擴大,對精確度的痴迷將減弱;擁有了大數據,我們不再需要對一個現象刨根問底,只要掌握了大體的發展方向即可,適當忽略微觀層面上的精確度,會讓我們在宏觀層面擁有更好的洞察力;
C.不是因果關系,而是相關關系:我們不再熱衷於找因果關系,尋找因果關系是人類長久以來的習慣,在大數據時代,我們無須再緊盯事物之間的因果關系,而應該尋找事物之間的相關關系;相關關系也許不能准確地告訴我們某件事情為何會發生,但是它會提醒我們這件事情正在發生。
數據價值
大數據時代,什麼最貴?
十年前,葛大爺曾說過,「21世紀什麼最貴?」——「人才」,深以為然。只是,十年後的今天,大數據時代也帶來了身價不斷翻番的各種數據。由於急速拓展的網路帶寬以及各種穿戴設備所帶來的大量數據,數據的增長從未停歇,甚至呈井噴式增長。[7]
一分鍾內,微博推特上新發的數據量超過10萬;社交網路「臉譜」的瀏覽量超過600萬……
這些龐大數字,意味著什麼?
它意味著,一種全新的致富手段也許就擺在面前,它的價值堪比石油和黃金。
事實上,當你仍然在把微博等社交平台當作抒情或者發議論的工具時,華爾街的斂財高手們卻正在挖掘這些互聯網的「數據財富」,先人一步用其預判市場走勢,而且取得了不俗的收益。
讓我們一起來看看——他們是怎麼做的。
這些數據都能幹啥。具體有六大價值:
●1、華爾街根據民眾情緒拋售股票;
●2、對沖基金依據購物網站的顧客評論,分析企業產品銷售狀況;
●3、銀行根據求職網站的崗位數量,推斷就業率;
●4、投資機構搜集並分析上市企業聲明,從中尋找破產的蛛絲馬跡;
●5、美國疾病控制和預防中心依據網民搜索,分析全球范圍內流感等病疫的傳播狀況;
●6、美國總統奧巴馬的競選團隊依據選民的微博,實時分析選民對總統競選人的喜好。[1]
可視化
「數據是新的石油。」亞馬遜前任首席科學家Andreas Weigend說。Instagram以10億美元出售之時,成立於1881年的世界最大影像產品及服務商柯達正申請破產。
大數據是如此重要,以至於其獲取、儲存、搜索、共享、分析,乃至可視化地呈現,都成為了當前重要的研究課題[1] 。
「當時時變幻的、海量的數據出現在眼前,是怎樣一幅壯觀的景象?在後台注視著這一切,會不會有接近上帝俯視人間星火的感覺?」
這個問題我曾請教過劉建國,中國著名的搜索引擎專家。劉曾主持開發過國內第一個大規模中英文搜索引擎系統「天網」。
要知道,劉建國曾任至網路的首席技術官,在這樣一家每天需應對網民各種搜索請求1.7億次(2013年約為8.77億次)的網站中,如果只是在後台靜靜端坐,可能片刻都不能安心吧。網路果然在提供搜索服務之外,逐漸增添了網路指數,後又建立了基於網民搜索數據的重要產品「貼吧」及網路統計產品等。
劉建國沒有直接回答這個問題,他想了很久,似乎陷入了回憶,嘴角的笑容含著詭秘。
倒是有公司已經在大數據中有接近上帝俯視的感覺,美國洛杉磯就有企業宣稱,他們將全球夜景的歷史數據建立模型,在過濾掉波動之後,做出了投資房地產和消費的研究報告。
在數據可視化呈現方面,我最新接收到的故事是,一位在美國思科物流部門工作的朋友,很聰明的印度裔小夥子,被Facebook高價挖角,進入其數據研究小組。他後來驚訝地發現,裡面全是來自物流企業、供應鏈方面的技術人員和專家,「Facebook想知道,能不能用物流的角度和流程的方式,分析用戶的路徑和行為。」
特徵
編輯
數據量大(Volume)
第一個特徵是數據量大。大數據的起始計量單位至少是P(1000個T)、E(100萬個T)或Z(10億個T)。
類型繁多(Variety)
第二個特徵是數據類型繁多。包括網路日誌、音頻、視頻、圖片、地理位置信息等等,多類型的數據對數據的處理能力提出了更高的要求。
價值密度低(Value)
第三個特徵是數據價值密度相對較低。如隨著物聯網的廣泛應用,信息感知無處不在,信息海量,但價值密度較低,如何通過強大的機器演算法更迅速地完成數據的價值「提純」,是大數據時代亟待解決的難題。
速度快、時效高(Velocity)
第四個特徵是處理速度快,時效性要求高。這是大數據區分於傳統數據挖掘最顯著的特徵。
既有的技術架構和路線,已經無法高效處理如此海量的數據,而對於相關組織來說,如果投入巨大採集的信息無法通過及時處理反饋有效信息,那將是得不償失的。可以說,大數據時代對人類的數據駕馭能力提出了新的挑戰,也為人們獲得更為深刻、全面的洞察能力提供了前所未有的空間與潛力。[2]
案例分析
編輯
個案一
你開心他就買你焦慮他就拋[2]
華爾街「德溫特資本市場」公司首席執行官保羅·霍廷每天的工作之一,就是利用電腦程序分析全球3.4億微博賬戶的留言,進而判斷民眾情緒,再以「1」到「50」進行打分。根據打分結果,霍廷再決定如何處理手中數以百萬美元計的股票。
霍廷的判斷原則很簡單:如果所有人似乎都高興,那就買入;如果大家的焦慮情緒上升,那就拋售。
這一招收效顯著——當年第一季度,霍廷的公司獲得了7%的收益率。
個案二
國際商用機器公司(IBM)估測,這些「數據」值錢的地方主要在於時效。對於片刻便能定輸贏的華爾街,這一時效至關重要。曾經,華爾街2%的企業搜集微博等平台的「非正式」數據;如今,接近半數企業採用了這種手段。
●「社會流動」創業公司在「大數據」行業生機勃勃,和微博推特是合作夥伴。它分析數據,告訴廣告商什麼是正確的時間,誰是正確的用戶,什麼是應該發表的正確內容,備受廣告商熱愛。
●通過喬希·詹姆斯的Omniture(著名的網頁流量分析工具)公司,你可以知道有多少人訪問你的網站,以及他們呆了多長時間——這些數據對於任何企業來說都至關重要。詹姆斯把公司賣掉,進賬18億美元。
●微軟專家吉拉德喜歡把這些「大數據」結果可視化:他把客戶請到辦公室,將包含這些公司的數據圖譜展現出來——有些是普通的時間軸,有些像蒲公英,有些則是鋪滿整個畫面的泡泡,泡泡中顯示這些客戶的粉絲正在談論什麼話題。
●「臉譜」數據分析師傑弗遜的工作就是搭建數據分析模型,弄清楚用戶點擊廣告的動機和方式。
處理和分析工具
用於分析大數據的工具主要有開源與商用兩個生態圈。
開源大數據生態圈:
1、Hadoop HDFS、HadoopMapRece, HBase、Hive 漸次誕生,早期Hadoop生態圈逐步形成。
2、. Hypertable是另類。它存在於Hadoop生態圈之外,但也曾經有一些用戶。
3、NoSQL,membase、MongoDb
商用大數據生態圈:
1、一體機資料庫/數據倉庫:IBM PureData(Netezza), OracleExadata, SAP Hana等等。
2、數據倉庫:TeradataAsterData, EMC GreenPlum, HPVertica 等等。
3、數據集市:QlikView、 Tableau 、 以及國內的Yonghong Data Mart 。
產業崛起
編輯
越來越多的政府、企業等機構開始意識到數據正在成為組織最重要的資產,數據分析能力正在成為組織的核心競爭力。具體有以下三大案例:
1、2012年3月22日,奧巴馬政府宣布投資2億美元拉動大數據相關產業發展,將「大數據戰略」上升為國家意志。奧巴馬政府將數據定義為「未來的新石油」,並表示一個國家擁有數據的規模、活性及解釋運用的能力將成為綜合國力的重要組成部分,未來,對數據的佔有和控制甚至將成為陸權、海權、空權之外的另一種國家核心資產。
2、聯合國也在2012年發布了大數據政務白皮書,指出大數據對於聯合國和各國政府來說是一個歷史性的機遇,人們如今可以使用極為豐富的數據資源,來對社會經濟進行前所未有的實時分析,幫助政府更好地響應社會和經濟運行。
3、而最為積極的還是眾多的IT企業。麥肯錫在一份名為《大數據,是下一輪創新、競爭和生產力的前沿》的專題研究報告中提出,「對於企業來說,海量數據的運用將成為未來競爭和增長的基礎」,該報告在業界引起廣泛反響。
IBM則提出,上一個十年,他們拋棄了PC,成功轉向了軟體和服務,而這次將遠離服務與咨詢,更多地專注於因大數據分析軟體而帶來的全新業務增長點。IBM執行總裁羅睿蘭認為,「數據將成為一切行業當中決定勝負的根本因素,最終數據將成為人類至關重要的自然資源。」
在國內,網路已經致力於開發自己的大數據處理和存儲系統;騰訊也提出2013年已經到了數據化運營的黃金時期,如何整合這些數據成為未來的關鍵任務。
事實上,自2009年以來,有關「大數據」 主題的並購案層出不窮,且並購數量和規模呈逐步上升的態勢。其中,Oracle對Sun、惠普對Autonomy兩大並購案總金額高達176億美元,大數據的產業價值由此可見一斑。[1-2]
提供依據
編輯
大數據是信息通信技術發展積累至今,按照自身技術發展邏輯,從提高生產效率向更高級智能階段的自然生長。無處不在的信息感知和採集終端為我們採集了海量的數據,而以雲計算為代表的計算技術的不斷進步,為我們提供了強大的計算能力,這就圍繞個人以及組織的行為構建起了一個與物質世界相平行的數字世界[1-2] 。
大數據雖然孕育於信息通信技術的日漸普遍和成熟,但它對社會經濟生活產生的影響絕不限於技術層面,更本質上,它是為我們看待世界提供了一種全新的方法,即決策行為將日益基於數據分析做出,而不是像過去更多憑借經驗和直覺做出。
事實上,大數據的影響並不僅僅限於信息通信產業,而是正在「吞噬」和重構很多傳統行業,廣泛運用數據分析手段管理和優化運營的公司其實質都是一個數據公司。麥當勞、肯德基以及蘋果公司等旗艦專賣店的位置都是建立在數據分析基礎之上的精準選址。而在零售業中,數據分析的技術與手段更是得到廣泛的應用,傳統企業如沃爾瑪通過數據挖掘重塑並優化供應鏈,新崛起的電商如卓越亞馬遜、淘寶等則通過對海量數據的掌握和分析,為用戶提供更加專業化和個性化的服務。
最讓人吃驚的例子是,社交媒體監測平台DataSift監測了Facebook(臉譜) IPO當天Twitter上的情感傾向與Facebook股價波動的關聯。在Facebook開盤前Twitter上的情感逐漸轉向負面,25分鍾之後Facebook的股價便開始下跌。而當Twitter上的情感轉向正面時,Facebook股價在8分鍾之後也開始了回彈。最終當股市接近收盤、Twitter上的情感轉向負面時,10分鍾後Facebook的股價又開始下跌。最終的結論是:Twitter上每一次情感傾向的轉向都會影響Facebook股價的波動。
這僅僅只是基於社交網路產生的大數據「預見未來」的眾多案例之一,此外還有谷歌通過網民搜索行為預測流感爆發等例子。不僅在商業方面,大數據在社會建設方面的作為同樣令人驚嘆,智能電網、智慧交通、智慧醫療、智慧環保、智慧城市等的蓬勃興起,都與大數據技術與應用的發展息息相關。
「大數據」可能帶來的巨大價值正漸漸被人們認可,它通過技術的創新與發展,以及數據的全面感知、收集、分析、共享,為人們提供了一種全新的看待世界的方法。更多地基於事實與數據做出決策,這樣的思維方式,可以預見,將推動一些習慣於靠「差不多」運行的社會發生巨大變革。
應對措施
編輯
一個好的企業應該未雨綢繆,從現在開始就應該著手准備,為企業的後期的數據收集和分析做好准備,企業可以從下面六個方面著手,這樣當面臨鋪天蓋地的大數據的時候,以確保企業能夠快速發展,具體為下面六點。
目標
幾乎每個組織都可能有源源不斷的數據需要收集,無論是社交網路還是車間感測器設備,而且每個組織都有大量的數據需要處理,IT人員需要了解自己企業運營過程中都產生了什麼數據,以自己的數據為基準,確定數據的范圍。
准則
雖然每個企業都會產生大量數據,而且互不相同、多種多樣的,這就需要企業IT人員在現在開始收集確認什麼數據是企業業務需要的,找到最能反映企業業務情況的數據。
重新評估
大數據需要在伺服器和存儲設施中進行收集,並且大多數的企業信息管理體系結構將會發生重要大變化,IT經理則需要准備擴大他們的系統,以解決數據的不斷擴大,IT經理要了解公司現有IT設施的情況,以組建處理大數據的設施為導向,避免一些不必要的設備的購買。
重視大數據技術
大數據是最近幾年才興起的詞語,而並不是所有的IT人員對大數據都非常了解,例如如今的Hadoop,MapRece,NoSQL等技術都是2013年剛興起的技術,企業IT人員要多關注這方面的技術和工具,以確保將來能夠面對大數據的時候做出正確的決定。
培訓企業的員工
大多數企業最缺乏的是人才,而當大數據到臨的時候,企業將會缺少這方面的採集收集分析方面的人才,對於一些公司,特別是那種人比較少的公司,工作人員面臨大數據將是一種挑戰,企業要在平時的時候多對員工進行這方面的培訓,以確保在大數據到來時,員工也能適應相關的工作。
培養三種能力
Teradata大中華區首席執行官辛兒倫對新浪科技表示,隨著大數據時代的到來,企業應該在內部培養三種能力。第一,整合企業數據的能力;第二,探索數據背後價值和制定精確行動綱領的能力;第三,進行精確快速實時行動的能力。
做到上面的幾點,當大數據時代來臨的時候,面臨大量數據將不是束手無策,而是成竹在胸,而從數據中得到的好處也將促進企業快速發展。
望採納,謝謝