預測是數據分析的終極目的
預測的必要性和誤差的必然性
經驗預測法
類比預測法
慣性法與時間序列分析
邏輯關系預測法
1.1?預測是數據分析的終極目的
數據分析最重要的目的就是從數據中尋找規(guī)律,找到能夠指導我們未來實踐的原則和方法,它是產生智慧的主要途徑。所以,預測分析是數據分析的終極目的。雖然數據分析可以承擔各種功能,包括監(jiān)測、監(jiān)控、檢查、證據、校驗,但預測還是最為關鍵的,所以掌握數據分析和挖掘的預測方法才是數據分析師的看家本領。
預測包括現象的預測和規(guī)律的預測。自然科學在本質上也是對事物的屬性、本質和規(guī)律的預測。有了對事物的認知和對規(guī)律的掌握,我們就能夠創(chuàng)造出更多的東西。商業(yè)社會也是如此,如果我們能夠知道影響股票波動的因素,并能夠掌握這些影響因素的數據,就能夠對股價做出精準的預測,從而指導我們的投資決策,做到穩(wěn)賺不賠。但事物具有復雜性,我們無法掌握所有的信息,更無法掌握所有的規(guī)律,所以才會有了那么多的偶然影響因素和隨機事件。
在美國電視?。ê喎Q美?。兑煞缸粉櫋分杏幸慌_超級服務器,它能夠掌握所有事情,預測所有事情的發(fā)展,從而能夠預測各種犯罪的發(fā)生和危險事件。主人公與幾個特工組成一個阻止悲劇發(fā)生的戰(zhàn)隊,開始了各種所謂的營救行動。這樣的機器或許在未來能夠出現,但在目前能掌握所有事物的數據并通曉其規(guī)律的機器還沒有。在智能領域,我們已經能夠制造出會下圍棋的AlphaGo,但距離精準的預測還有很大的距離,但這并不能阻止我們對某些特殊事物的預測。
隨著大數據、物聯(lián)網等技術的快速發(fā)展和應用,我們會擁有越來越多的數據,在這些數據的基礎上,通過各種分析技術的發(fā)展,我們就能夠加工出越來越多的“智慧”,從而能夠指導我們的實踐,而我們對未來的預測會越來越精準,越來越有效。
人們總是把事情想象得過于美好,認為做大數據的人能夠上知天文,下曉地理,能夠準確地預測未來?,F在還沒有人有這樣的能力,至少目前不會有,未來10年估計也不會有。所以企業(yè)的老板也不能對數據部門寄予過高的期望。
經濟學、社會學、社會物理學、心理學、統(tǒng)計學和數學等眾多學科都是預測的工具和方法,人類已經掌握了一些基本的事物發(fā)展規(guī)律,對人類大腦、情感、心理的認知也逐步深入。但我們對這些學科的掌握程度還遠遠達不到準確預測未來的程度,我們所知道的僅僅是大自然中非常小的一部分。所以永遠不要過高地估計我們對世界的認知。
20年前,互聯(lián)網剛剛開始興起,那個時候人們覺得互聯(lián)網永遠無法取代電視、報紙、雜志和廣播,認為互聯(lián)網只會成為信息傳播的一種工具,而且最初人們只希望用互聯(lián)網來傳播知識,而拒絕使用互聯(lián)網從事商業(yè)行為。20年后的今天,互聯(lián)網的普及徹底改變了我們的生活方式。
我們經常說“以史為鑒”,其實就是研究事物發(fā)展的歷史,為我們研究新的事物做出指導,讓我們對未來的事物有更遠一點的估計。研究互聯(lián)網的發(fā)展歷史,能夠讓我們更好地估計或者預測同為信息技術的大數據技術在未來的發(fā)展。
互聯(lián)網從1995年開始推廣應用到2015年,整整20年的時間,其已經不再被看作是新的技術了,而是日常必不可少的一種技術應用,而且應用的范圍和領域也越來越廣,如下圖所示。如今我們已經真正進入到“互聯(lián)網+”的時代。
納斯達克歷史綜合指數也揭示了一個技術成長的過程,如下圖所示。因為納斯達克主要以互聯(lián)網新技術公司為主要的投資對象,該股票交易市場的主體是互聯(lián)網公司,其綜合指數直接體現出這些公司的市場價值。
著名的研究公司Gartner以研究技術發(fā)展和為技術公司提供咨詢服務為主。其跟蹤和研究各種新技術的發(fā)展歷程,并形成了一個關于技術發(fā)展周期的HypeCycle理論體系。此理論體系將技術的發(fā)展分成觸發(fā)期、過熱期、幻滅期、復蘇期和創(chuàng)新應用期。不同的技術發(fā)展會有不同的結局,有的會在發(fā)展的過程中就消逝了,有的成了影響人們生活的重要技術。在Gartner看來,不同的技術處在不同的階段,大家對其的期望會有不同,這在股票市值或者公司估值上能夠體現出來。
下圖是Gartner對新興技術的研究結論:不同的技術處在不同的時期。大數據技術在2014年曾經被Gartner認為進入幻滅期,目前其在中國仍然處在過熱期,大家都看好這個技術,動輒就投資幾十億元來推動大數據應用,而得到的實際應用價值還是非常少的,但是這個技術卻比互聯(lián)網更加能夠影響我們的生活。
通過研究互聯(lián)網技術的發(fā)展歷史,我們能夠預測未來大數據技術的發(fā)展。互聯(lián)網從觸發(fā)期到過熱期用了5年左右的時間,1999—2000年是互聯(lián)網技術的幻滅期,一直到2005年用了5年去復蘇,2005—2010年是互聯(lián)網技術的復蘇期,2010年開始進入創(chuàng)新應用期,2015年進入產業(yè)廣泛應用的“互聯(lián)網+”時期。每5年一次大的轉變,讓人們對該技術的看法徹底改變了。
大數據從2007年被提出來,到2012年爆發(fā),歷時5年;2012—2017年是幻滅期。當然國內對大數據的看法會有所不同,鑒于互聯(lián)網時期的泡沫,人類更加理性,大數據會存在泡沫,可能不會比當時互聯(lián)網技術存在的泡沫大?,F在大數據在國內仍然處在過熱期,各地都在建設大數據中心,包括以貴陽為代表的大數據交易平臺也在建設中。對于大數據能否像商品一樣用來交易,或是建成像高速公路這樣的基礎設施供大家使用,目前還沒有定論。而且在大數據領域中還有很多未能解決的問題,包括數據所有權問題、數據的安全性問題、隱私保護問題、數據犯罪問題等。
在2017年之后,大數據就會進入一個復蘇期。在這期間,大量的數據得到積累和整合,各種數據會關聯(lián)起來形成可用的數據集,新的應用算法和處理工具會得到普及,查詢數據、計算數據、展示數據都不再是少數專業(yè)人員的專利。這個時候大數據才會真正應用起來,企業(yè)會利用大數據服務來優(yōu)化自己的生產,會利用大數據來管理自己的企業(yè),并且貢獻自己的數據集,豐富整個大數據資源。
互聯(lián)網是一個公共資源,大數據也將是一個公共資源。筆者認為,把大數據作為一種商品拿來交易并構建交易平臺是一件不符合事物基本發(fā)展規(guī)律的事情,這個有待觀察。
講這些內容其實是在啟發(fā)讀者,“前車之鑒,后事之師”,互聯(lián)網技術的發(fā)展史留給我們太多的財富,我們需要分析和研究,而且要能夠馬上應用到大數據技術上,預測未來大數據的發(fā)展規(guī)律。
1.2?預測的必要性和誤差的必然性
事物是復雜的,我們對事物的認知是有限的,正因如此,事物在發(fā)展的過程中會發(fā)生超越我們預期的偶然事件和隨機事件,我們把這些叫作誤差,誤差是必然存在的。隨著我們對事物的認知越清楚,掌握的信息數據越完善,這個誤差就會越小,偶然事件就會越少。預測不準確是正常的,我們不能因為預測不準確而放棄對事物的預測。掌控未來發(fā)展是人類的本能,也是人類進化的動力。
互聯(lián)網、物聯(lián)網、智能設備、移動互聯(lián)網,以及數據分析與挖掘技術的聯(lián)合作用,讓大數據技術的發(fā)展如虎添翼。大數據技術必然會更加廣泛地應用到企業(yè)的生產和管理過程中,應用到生活的方方面面?,F在,我們在選擇出行路線時會根據地圖應用提供的交通流量信息,選擇最不堵車的路線,這是一個典型的應用場景——把大數據當作平臺和基礎設施的應用場景。未來會有越來越多的這種應用場景。
有了這些應用場景,我們就能夠預測未來可能會發(fā)生的事情。企業(yè)之間將不再是價格的競爭,而是根據消費者需求進行定制化的模式競爭,未來企業(yè)的規(guī)??赡軙冃?。大企業(yè)的存在是為了讓更多的人集結在一起做出少數人做不到的事情,大數據帶來了人工智能技術,當智能機器可以完成少數人無法完成的任務時,大企業(yè)存在的優(yōu)勢將不再顯現,而且企業(yè)越大,其個性化產品和服務就會越加不靈活。而且人類的組織方式都有可能會發(fā)生變化。
通常情況下,有四種預測的方法。
1.經驗法
所謂的經驗法就是按照過去的經驗來預測通過做什么來達到什么結果。例如一個市場總監(jiān)在A公司做了5年,對于每年花費多少廣告費帶來多少銷售額,用什么方法打廣告會更有效果,哪個時間段的廣告最能夠觸達客戶從而帶來更高的轉化率,他都積累了豐富的經驗,并且能夠形成準確的判斷。當他進入B公司后,能夠根據以前的經驗判斷該如何打廣告更加有效,讓公司的廣告效果增加1%,這就是靠經驗來預測事物未來的發(fā)展狀況。
2.類比法
所謂的類比法就是根據A事物的發(fā)展歷程來判斷B這個新事物可能會怎樣發(fā)展。通過類比相似的事物,把已知事物的發(fā)展規(guī)律應用到未知事物的發(fā)展規(guī)律上,這種方法就是類比法。前面我們介紹了通過研究互聯(lián)網技術的發(fā)展史來認知未來大數據技術的發(fā)展史,通過類比,就能夠對大數據技術有更加深刻的認知。
3.慣性法
事物的發(fā)展都會有慣性,這種慣性規(guī)律在經濟學上特別明顯。社會發(fā)展的慣性主要是根據人們的行為習慣。人們的行為習慣一旦養(yǎng)成后,如果要更改,則需要一定的時期,這個時期我們就稱為慣性期。我們利用事物發(fā)展的慣性,對事物未來的發(fā)展做出判斷的方法就是慣性預測法。
4.邏輯關系法
邏輯關系法是預測的終極武器。如果我們知道兩個事物之間的邏輯關系,則根據邏輯關系和一個事物直接得出另外一個事物的方法就是邏輯關系法。例如如果我們知道兩個數據之間的函數關系,就能夠根據一個變量的數據得到另外一個的數據,這就是邏輯關系預測法。
全文摘自《企業(yè)經營數據分析-思路、方法、應用與工具》趙興峰著
該文轉載已取得作者認可
版權說明:版權所有歸明悅數據所有,如需轉載請聯(lián)系我們,我們將在第一時間處理,或請注明內容出處(《企業(yè)經營數據分析》趙興峰著),非常感謝!【往期內容已在(明悅數據)公眾號同步發(fā)布】