性色va性a免费视频|丝袜av资源|成人黄色片子免费|久久99婷婷国产精品免费,日本丰满少妇XXXX,在线观看麻豆av,国产精品手机在线亚洲

“大數(shù)據(jù)”時代呼之欲出 會變成另一朵“云”嗎?

    繼“物聯(lián)網(wǎng)”“云計算”之后,“大數(shù)據(jù)”成為了炙手可熱的科技“新貴”,不少地方政府紛紛提出率先布局大數(shù)據(jù)產(chǎn)業(yè)、建設(shè)大數(shù)據(jù)中心。

    大數(shù)據(jù)時代來臨意味著什么?政府和業(yè)界如何應(yīng)對大數(shù)據(jù)時代帶來的變革和挑戰(zhàn)?科技日報記者就相關(guān)問題采訪了專家和業(yè)內(nèi)人士。

    大數(shù)據(jù)不只是“數(shù)據(jù)大”

    究竟什么是大數(shù)據(jù)?中國工程院院士、工信部通信科技委主任鄔賀銓認為,隨著互聯(lián)網(wǎng)的出現(xiàn)和發(fā)展,數(shù)據(jù)量每年以40%的速度遞增,超過了現(xiàn)有計算機硬件和軟件的處理能力,于是人們將無法在容許的時間內(nèi)用常規(guī)軟件工具對其內(nèi)容進行抓取、處理、分析的數(shù)據(jù)集合稱之為大數(shù)據(jù)。

    多大規(guī)模的數(shù)據(jù)才算大數(shù)據(jù)?“大數(shù)據(jù)規(guī)模的標準是持續(xù)變化的,當(dāng)前泛指單一數(shù)據(jù)集的大小在幾十個TB(百萬兆字節(jié))和幾個PB(千萬億字節(jié))之間”。

    也許你并沒有意識到,大數(shù)據(jù)在日常生活中已不鮮見。鄔賀銓舉例道,比如一個城市里有幾十萬個攝像頭,單個8兆比特每秒的攝像頭一小時就產(chǎn)生3.6GB(千兆字節(jié))的數(shù)據(jù),一個城市幾十萬個攝像頭一個月拍攝存儲下來的數(shù)據(jù)量就達到PB量級。再比如,醫(yī)院一天要做很多例CT檢查,一幅CT圖像幾百兆字節(jié),一個病人可能多達兩千幅CT照片,加上病人數(shù)據(jù)需要保存幾十年,自然產(chǎn)生非常龐大的數(shù)據(jù)量!按髷(shù)據(jù)已經(jīng)滲透進了生活的每個角落,基于此,我們才說大數(shù)據(jù)時代已經(jīng)來臨!

    大數(shù)據(jù)只是數(shù)據(jù)大嗎?顯然不是。牛津大學(xué)教授維克托·邁爾-舍恩伯格在他與人合著的《大數(shù)據(jù)時代》一書中寫道:人們在大規(guī)模數(shù)據(jù)的基礎(chǔ)上可以做到的事情,在小規(guī)模數(shù)據(jù)的基礎(chǔ)上是無法完成的。

    大數(shù)據(jù)正在改變我們的生活以及理解世界的方式,成為新發(fā)明和新服務(wù)的源泉。

    對此,鄔賀銓也表達了相同的看法!皵(shù)據(jù)量大到一定程度,可挖掘價值超乎想象,是受樣本數(shù)量所限的小規(guī)模數(shù)據(jù)難以比擬的。因此,世界經(jīng)濟論壇去年發(fā)布的報告指出,大數(shù)據(jù)就是新財富,價值堪比石油!

    大數(shù)據(jù)帶來大挑戰(zhàn)

    身處大數(shù)據(jù)時代,如何收集存儲海量數(shù)據(jù),并將一堆龐大的看似毫無關(guān)聯(lián)的“冰冷”數(shù)據(jù)轉(zhuǎn)化成幫助決策的利器,無疑考驗著人們的智慧。

    正如鄔賀銓所說,盡管大數(shù)據(jù)時代已經(jīng)來臨,但這并不意味著我們真正掌控了大數(shù)據(jù),在大數(shù)據(jù)的收集存儲和挖掘分析上,還有很多技術(shù)難題需要去攻克。

    數(shù)據(jù)類型繁多是大數(shù)據(jù)的一大特點,文本、圖片、視頻等各類數(shù)據(jù)的標準、結(jié)構(gòu)形式不一,數(shù)據(jù)采集的實時性要求等都增加了采集整合的困難。由于數(shù)據(jù)量太大,傳統(tǒng)的集中式數(shù)據(jù)庫、數(shù)據(jù)倉庫系統(tǒng)已不能有效地處理大數(shù)據(jù)的存儲和分析,需要分布式處理。

    “我們現(xiàn)在都用低成本分布處理器,但低成本如何保證可靠性?另外,僅存起來也不行,如果沒有標簽,將來也找不到,還需要標簽化,方便快速查詢分析!编w賀銓表示。

    數(shù)據(jù)價值密度相對較低是大數(shù)據(jù)的另一大特點,如何在海量信息中快速完成價值“提純”并以可視化結(jié)果呈現(xiàn),需要在算法、人工智能等技術(shù)方面加以突破。相對于文本等結(jié)構(gòu)化數(shù)據(jù)而言,照片、視頻等非結(jié)構(gòu)化數(shù)據(jù)處理難度更大,不能簡單地通過關(guān)鍵詞進行搜索分析,如何將各類不同數(shù)據(jù)關(guān)聯(lián)起來處理也是一大難題。

    鄔賀銓指出,“在大數(shù)據(jù)的分析挖掘上,一方面需要更強大的算法提升處理能力,同時需要通過人臉識別等人工智能技術(shù)研發(fā),實現(xiàn)對圖像數(shù)據(jù)的智能分析!

    大數(shù)據(jù)帶來的挑戰(zhàn)不容小視。2012年3月,美國政府撥款2億美元啟動“大數(shù)據(jù)研究和發(fā)展倡議”計劃,旨在提升從海量和復(fù)雜的數(shù)據(jù)中獲取知識的能力。

    鄔賀銓介紹,圍繞與大數(shù)據(jù)相關(guān)的科學(xué)問題,比如低成本大規(guī)模高可靠性存儲、數(shù)據(jù)智能分析和挖掘等,國家973計劃中已經(jīng)并將會部署相關(guān)的科研項目。

    發(fā)展大數(shù)據(jù)切忌盲目跟風(fēng)

    對于各地政府紛紛提出率先布局大數(shù)據(jù)產(chǎn)業(yè)、建設(shè)大數(shù)據(jù)中心現(xiàn)象,鄔賀銓表示,盡管大數(shù)據(jù)是個值得重視和關(guān)注的方向,但目前技術(shù)上并不成熟,各地不要盲目上馬大數(shù)據(jù)項目、建大數(shù)據(jù)中心,以免重蹈云計算過熱的覆轍!拔也⒉环磳τ袟l件的城市,由政府主導(dǎo)來建大數(shù)據(jù)中心,只是擔(dān)心一些地方?jīng)]想清楚做什么,就盲目購買一堆硬件、軟件設(shè)備,建好了沒人用,造成資源浪費。”

    在鄔賀銓看來,云計算發(fā)展幾年來成效不顯著,很多地方建的云計算中心利用率不高,不少還僅僅是數(shù)據(jù)庫,沒有提供云服務(wù)的能力。

    癥結(jié)就在于起步太急,沒有考慮清楚為誰建、建了做什么,一哄而上的云中心、云平臺最后成了租不出去的“數(shù)據(jù)倉庫”!按笃髽I(yè)有自己的數(shù)據(jù)庫不需要租用,中小企業(yè)出于數(shù)據(jù)安全和成本的考慮也不愿意用!

    因此,發(fā)展大數(shù)據(jù)產(chǎn)業(yè)需要有明晰的產(chǎn)業(yè)規(guī)劃,建大數(shù)據(jù)中心要有明確的用途和服務(wù)對象。鄔賀銓認為,由政府主導(dǎo)建立的大數(shù)據(jù)中心,首先應(yīng)該用來分析政府部門數(shù)據(jù),比如交通流量、氣象、醫(yī)保等,幫助政府部門決策。此外,面向企業(yè)應(yīng)用時應(yīng)首先考慮中小企業(yè)需求,開展有針對性的服務(wù)。

    大數(shù)據(jù)時代,你的一舉一動或被“監(jiān)視”

    通過分析大量用戶的搜索記錄,比如“咳嗽”“發(fā)燒”等特定詞條,谷歌公司能準確預(yù)測美國冬季流感傳播趨勢。和官方機構(gòu)相比,谷歌能提前一兩周預(yù)測流感暴發(fā),預(yù)測結(jié)果與官方數(shù)據(jù)的相關(guān)性高達97%。2009年甲型H1N1流感暴發(fā)時,“谷歌流感趨勢”系統(tǒng)大顯身手。這已經(jīng)成為大數(shù)據(jù)應(yīng)用的一個經(jīng)典案例。

    “谷歌流感趨勢”系統(tǒng)為公共衛(wèi)生機構(gòu)提供非常有價值的數(shù)據(jù)信息的同時,卻也招來了隱私保護組織的嚴厲聲討。人們擔(dān)心的是,谷歌是否找到一種方法來確保收集的大量數(shù)據(jù)不會泄露究竟是哪些用戶提交了相關(guān)搜索信息。

    當(dāng)你習(xí)以為常地瀏覽網(wǎng)頁、發(fā)微博、逛社交網(wǎng)站的時候,可能并沒有注意到,你的一舉一動被“監(jiān)視”著。如維克托所說,亞馬遜監(jiān)視著我們的購物習(xí)慣、谷歌監(jiān)視著我們的網(wǎng)頁瀏覽習(xí)慣,Twitter竊聽到了我們心中的“TA”,F(xiàn)ACEBOOK似乎什么都知道,包括我們的社交關(guān)系網(wǎng)。

    如果說互聯(lián)網(wǎng)時代人們的隱私受到了威脅,那么大數(shù)據(jù)時代無疑加深了這種威脅。大數(shù)據(jù)的價值潛力,使得個人信息被更多采集、更久存儲、更徹底利用。甚至有些看似無關(guān)緊要的信息,關(guān)聯(lián)在一起就能精準定位到具體的某個人。

    在維克托看來,大數(shù)據(jù)時代,不管是告知與許可、模糊化還是匿名化,這三大隱私保護策略都失效了。因此,需要設(shè)立新的模式來保護個人隱私,這個模式應(yīng)該更著重于強調(diào)數(shù)據(jù)使用者為其行為承擔(dān)責(zé)任。

    大數(shù)據(jù)時代,如何兼顧數(shù)據(jù)充分利用和個人隱私保護?鄔賀銓認為首先需要界定什么樣的個人信息可以被采集挖掘,以及挖掘出的數(shù)據(jù)可以做哪些用途!熬唧w的尺度需要在實踐中一步步地厘清和把握!

    不只是個人隱私,國家安全是另一個值得關(guān)注的問題。鄔賀銓特別強調(diào),國內(nèi)企業(yè)和相關(guān)政府部門要避免將自己的重要數(shù)據(jù)放到國外的分析應(yīng)用平臺,即使對方愿意免費提供相關(guān)服務(wù)!斑@些看似無關(guān)的數(shù)據(jù),其實都跟企業(yè)發(fā)展策略、國家經(jīng)濟運行狀況密切相關(guān),我們要時刻保持對信息安全的警覺。”(記者 唐婷)

    大數(shù)據(jù)時代,能做成哪些“大事情”

    《紐約時報》去年底出版文章稱,麻省理工學(xué)院數(shù)字商業(yè)中心首席科學(xué)家安德魯·麥卡菲(Andrew McAfee)認為,大數(shù)據(jù)將成為人類商業(yè)歷史上新的篇章。該中心另一名教授埃里克·布林約爾森(Erik Brynjolfsson)稱,大數(shù)據(jù)將取代想法、范例、組織以及人們思考世界的方式。

    據(jù)介紹,這些前衛(wèi)的預(yù)測的前提是:Web瀏覽記錄、傳感器信號、GPS跟蹤和社交網(wǎng)絡(luò)信息等數(shù)據(jù)能夠以前所未有的程度面向衡量和監(jiān)控人類及設(shè)備的行為敞開大門。通過計算機算法,可以預(yù)測出人類的許多事情,如購物、約會或投票等。

    業(yè)內(nèi)專家預(yù)計,最終的結(jié)果就是:世界變得越來越智能,企業(yè)的工作效率越來越高,消費者獲得的服務(wù)質(zhì)量越來越高,人們所做出的決定也越來越合理。

    關(guān)于大數(shù)據(jù)悄然改變我們生活的例子還有很多。

    去年備受矚目的美國大選中,大數(shù)據(jù)也扮演了重要的角色。和以往不同,此次大選伊始,美國總統(tǒng)的競選團隊就紛紛利用數(shù)據(jù)分析方法來尋找和鎖定潛在的己方選民,并使用最前沿的數(shù)字化策略定位并拉攏那些中間派選民。大選結(jié)果出爐后,美國《時代》周刊網(wǎng)站刊文指出,數(shù)據(jù)挖掘團隊為奧巴馬的連任立下了汗馬功勞,政治領(lǐng)域的大數(shù)據(jù)時代已經(jīng)到來。

    大數(shù)據(jù)在商業(yè)領(lǐng)域同樣有著不俗的表現(xiàn)。華爾街德溫特資本市場公司首席執(zhí)行官保羅·霍廷每天的工作之一,就是利用電腦程序分析全球3.4億微博賬戶的留言,判斷民眾情緒,從而決定股票的買入和賣出。他的判斷原則是:如果人們似乎都高興,那就買入;如果大家的焦慮情緒上升,那就拋售。去年一季度,霍廷的公司獲得了7%的收益率。

    大數(shù)據(jù)商業(yè)應(yīng)用在國內(nèi)也已經(jīng)起步。鄔賀銓舉例道,國內(nèi)很多中小企業(yè)由于沒有擔(dān)保,無法從商業(yè)銀行貸款。對此,阿里巴巴公司根據(jù)旗下淘寶網(wǎng)上的交易情況,篩選出一批財務(wù)健康和誠信的中小企業(yè),對其發(fā)放不需要擔(dān)保的貸款。目前阿里巴巴已放貸300多億元,壞賬率僅0.3%,而國內(nèi)商業(yè)銀行貸款的壞賬率在1%以上。

    不只是阿里巴巴,國內(nèi)一些中小企業(yè)也嗅到了大數(shù)據(jù)帶來的商機。以網(wǎng)站數(shù)據(jù)分析、視頻行為分析等為主營業(yè)務(wù)的北京國雙科技公司就是其中之一。該公司CEO祁國晟十分看好大數(shù)據(jù)應(yīng)用的前景,他認為互聯(lián)網(wǎng)數(shù)據(jù)分析行業(yè)未來幾年將有一個很快的發(fā)展勢頭!叭绻粋企業(yè)能持續(xù)5年、10年去收集一個行業(yè)的數(shù)據(jù)并分析,那一定能做成偉大的事。”