新聞資訊

新數據還是新范式 —— 手機信令數據專題(四)

時間:2020-11-02 閱讀:110 分享

今天和諸位討論一下大數據在商業銀行選址中落地的問題,文中觀點僅代表個人觀點。

從2015年起,大數據話題開始在各行各業開始滲透的時候,公司內部就大數據這個話題開始持續的討論。有意思的是,就在一年前一次與行內領導交流的過程中,我幾乎仍無腦地支持對方的“大數據無用論”,在當時的我看來,大數據本身的“噪聲”和“精度”的問題在銀行網點選址中的應用是極其有限的。而當我今天面對這個話題的時候,大數據“準不準”和“有沒有用”已經不是我的關注問題,取而代之的是大數據應該“如何用”。而從整體關注來看,大數據熱度也已經逐步讓位人工智能這類算法和應用的話題。

圖:大數據和人工智能百度搜索指數

1.png

顯然在討論大數據如何落地之前,繞不開的一個問題是“大數據”的定義。在此,我認為從實用的角度,多談無意,而我想要討論的是在銀行布局選址中基于外部形成,區別于傳統抽樣調查的數據,如手機信令、互聯網用戶流量、商場消費、房產信息數據等。

不準的數據也能產生價值

當數據與常識發生沖突的時候,我們往往就會產生“數據不準”這個論調,大數據尤甚。大數據不精準是一個客觀事實,盡管我們將樣本等于總體作為大數據的主要理論特征,但n=all并不是輕易能做到的,主流大數據公司事實上提供的是其用戶行為產生的問題,這其中至少包含的兩個問題就是,第一,用戶的覆蓋率和代表性問題,我們并不知道用戶規模在實際人群中的比例,并且分布特征能否支持其代表性;第二,用戶行為與指標之間的差異,其行為與測量指標之間是否真的有關聯,比如刷卡金額能否代表真是消費水平。當然除此之外,還有諸如數據精度等問題。

但不精準的數據是否就沒有價值呢。顯然,我對這個問題的回答否定的。首先,大數據作為推斷的依據,或許在結果上具有一定片面性,但依然是可信的。如當我們細辨這個區域有多少人的時候我們會打上一個問號,但如果我們問這個區域人口相對等級是多大的時候,我們還會有那么大的懷疑嗎。其次,大數據不是獨立的。在這一個時代,數據應用的一個忌諱就是“一條路走到黑”,我想說的是,大數據與傳統數據(調研等)不對立,大數據和大數據之間也不對立,選址的角度是多元的,選址的數據也是多源的。

避免銀行選址的內卷陷阱

眾所周知的是,商業銀行網點選址是一項綜合性的工程,外涉及資源、商鋪,內涉及成本、戰略、定位,其因素相互關聯,有時候又相互掣肘。而我看到的是,過去那些完善的、成熟的選址理論中某些因素在逐漸的弱化。在今天,諸位與其把選址布局作為一件復雜的事,不如作為一件專業的事,把關注點聚焦到一些重要的指標,能真正為選址決策帶來有效支持的指標。而大數據也在為選址這件事情不斷增加新的指標,雖然為選址指標提供了優化的空間,但也要避免陷入不斷內卷的陷阱,畢竟選址只是銀行發展的其中一小環。

是數據之爭還是范式之爭

在新數據環境,如何用“大數據”在我看來也是一個頗值得思考的問題。隨著大數據被納入規劃選址研究的基礎體系,傳統分析得以騰籠換鳥,換上新的發動引擎,但新數據能否替代舊數據,能否帶來有效提升,在我看來,其中大數據帶來的價值是比較有限的。而事實上,新數據的規模得以讓機器學習等智能算法煥發生命力,在這個意義上規劃選址面臨著一種新的范式調整。在這種范式下,面臨的兩個問題是,特征工程和有效訓練集,即如何建立選址分析有效特征供模型分析和什么樣的訓練集才是合理的。在這兩個問題中,我們團隊都報以巨大的使命感,也許沒有人比我們更懂銀行選址的內涵,也許也沒有公司以上百個經過分析的城市案例數據庫更合適的訓練集了。

好了,今天就絮叨這些,之后還會繼續分享手機信令數據分析案例。以開放的心態,合適的方法,我相信大數據會帶來巨大的驚喜。


返回 下一篇:功能與規模之爭——手機信令數據專題(三)
十三水游戏源码 福彩高频彩助手官方下 幸运28正规吗? pk10一天赚200怎么做 山西11选5推荐 新疆时时彩中奖guize mg冰球突破1000押注 4肖中特10元赔多少钱 今晚快乐双彩开奖查旬 bg视讯厅是不是假的 今日四川快乐12开奖结果走势图 今天贵州11选5开奖号码 为什么叫腾讯分分彩 彩票开奖广西快乐双彩 亿客隆-登录 视讯中国娱乐怎样取消 塞班水果老虎机