當前位置:
網站首頁 > 觀點

大數據告訴你,上海市高峰人口有3000萬

劉培銳 / 2018-6-20 12:03:11

本文為上海脈策數據科技有限公司咨詢事業部合伙人劉培銳在上海金融與法律研究院“城市峰會2018:平臺·城市暨上海金融與法律研究院2017年報發布”上的演講內容,經本人審閱。

大家下午好。非常榮幸能夠來參加這次平臺·城市的論壇,我是脈策數據科技有限公司的劉培銳,大家可能對我們公司不是很了解,但是在微信上有一個公眾號叫城市數據團,可能大家多多少少會有一些了解,我們致力于大數據方法和技術在的城市研究領域的應用,做過一些比較有意思的研究,都在公眾號里面供大家閱讀和參考。

今天我跟大家分享的是我們在各行各業,包括政府、企業、研究機構做的一些大數據的研究,從中我們總結了一些技術方法和路徑,包括一些成果,在這里展示一下。


傳統城市研究本身的方法和技術手段是非常完善的,但是它大多用的是官方統計數據,包括經濟、人口、產業等等,在高速發展的階段,城市每天都在變化,所以統計數據的劣勢也在顯現,主要體現在數據精度和更新周期上,所以我們會去探索更多維度的新興數據來彌補統計數據的不足。

首先進入我們研究領域的是互聯網開源的數據,它成本較低,比較容易獲得,在精度和更新速度上優于傳統的統計數據,適合大數據研究初級的應用。同時,有越來越多的商業數據進入我們研究的領域,比如手機信令數據、工商注冊數據等等,這些數據的空間精度和更新頻率是非常高的,為我們城市研究提供了很多新方向和視角,但唯一的不足是成本較高。因此,大數據不是指數量有多大,它是一個多元數據的融合,通過多維度數據共同驗證,得到一些我們以前可能發現不了的結論。


上海有多少人  

先回答這樣一個問題,上海有多少人?

作為城市研究來說,其實最重要的是講清楚一個城市到底有多少人口,最新的上??傄幎艘粋€控制人口規模的上限——2480萬,暫時不評價控制人口本身正確與否,先來了解上?,F實到底有多少人?

來看這樣一條曲線,這是2017年春節前一直到2018年春節后的曲線,我們看到第一個波谷是春節時上海人全都回老家了,因為上海是全部流入勞動力的大城市,很多勞動力回到老家過年了,這時候上海人口僅有1500萬,是平時的一半。

春節之后大家回來了,人口規?;謴偷秸K?。

接下來我們看到在清明、五一、端午小長假期間出現三個小波谷,為什么呢?上海人都出去玩了,這時候人口規模會有略微下降。

接下來全國中小學生放暑假,全國人民都帶著小朋友來上海玩了,這時候達到高峰,是3000萬人。

十一小長假有更多人出去玩,流出去的人口會更多一點。十一以后是一個沒有假期的穩定期,再到2018年前的春節進入下一個變化周期。

總體看來,其實在我們討論上海到底有多少人的時候,它不是一個靜態的問題。經過我們的測算,我們知道上海最高峰大概三千萬人,上海年平均的人口是2780萬,上海人口最低值的是1500萬。

當我們知道這個數據的時候,我們的城市是要為3000萬人口提供服務,還是為2780萬人提供服務,還是為1500萬人提供服務,這是一個問題。


空間分布

第二我們想知道上海這些人在空間上是怎么分布的。我們通過手機信令數據,把人口分配在地圖上面。


總體來說,上海的人口密度隨著中心城區向外擴散呈現遞減的趨勢。

同時我們也發現,像黃浦、靜安這樣的中心城區人口已經不是最多的了,因為該拆的都拆了,這個地方的人并多,而在楊浦、寶山這樣一些區域居住人口比較更多。


居住環境

接下來,我們想看看他們的居住環境怎么樣?

我們把人口分布和上海760萬套住房做了空間匹配,可以來反映他們的居住情況。

我們得出這樣的數據,上海居住條件最好的地方是新江灣城,大概0.8人每套,而且我們知道新江灣城大部分是140平以上的大戶型,這里其實每戶里面居住的人口是最少的。

上海居住人口密度最高的地方是提籃橋地區,包括老城廂、老工房,這里每套住了8.1個人,我們也不知道他們怎么住進去的,但是可想而知是他們的居住條件和環境。

我們算了一下,平均上海平均每套房住3.2人,這是符合我們常規認知的。


營商環境

另外現在大家提得比較多的是“營商環境”,那我們來看看上海營商環境怎么樣?

利用工商數據庫做了這樣兩張圖,左邊是工商注冊企業的分布圖,由于各個區都有自己的企業的招商引資的政策,一些優惠的條件,因此在注冊企業上是呈分散均勻的分布特征。



右邊這張圖是企業實際辦公地址,它更多的呈現極化的特征,集中在內環以內,因為企業想要一個好的辦公環境、好的設施、好的交通環境,大家都會把辦公樓選在更靠近市中心的區域。

現在大家知道上海要打造 “科創中心”這樣一個目標,我們看一下科創企業分布,我們測算了一下它的分離度,大概有65%的企業注冊地和經營地不在一起,這是企業的市場行為選擇,跟規劃和政策引導可能都不太一樣。

這背后涉及到一個數據,在整個服務行業里面金融、商務服務、科創信息類的企業,他們對辦公的租金的承載力其實是不一樣的,我們一直說金融科技在一起,其實我們發現金融和科技他們對房租的承載其實是完全相反的兩個曲線,雖然看上去他們應該在一起,但是現實把他們推得越來越遠,他們在空間分布上越來越遠。


日常通勤

有了辦公,有了居住,我們看看上海人到底每天怎么上班的?

這張是我們通過手機信令畫出城市早高峰OD圖。


因為上海是一個多中心城市結構,除了中心城區有了一個聯系強度以外,中心城區和外圍新城、外圍新城之間都會有一些聯系,還有人從崇明島浦東、浦西來上班的情況。

這里分了幾個案例,第一個是人民廣場和陸家嘴,這兩個地方是上海市比較重要的城市中心,其實也是一個就業中心,工作在人民工廠和陸家嘴這些人他們在哪里居???

我們發現輻射的范圍非常廣,浦東浦西內環、外環以外都有他們的居住點,這些人每天往返在城市中心和外圍區域。

另外我們選擇了兩個區,一個是大寧,一個是江灣城,在這里工作的人他的居住限定在了一定的地域范圍內,由于城市副中心能級并沒有那么高,這里工作的人都分布在地鐵沿線和周邊臨近的一些區域。

有了這樣一些分布和分析,我們可以測算出,上海人平均每天出行上班要花多長時間,和花多長距離。


最遠的是世紀公園和虹橋商務區,通勤距離超過13公里,最近的大連路、大寧這些6公里不到,上海市平均的通勤距離大概是10公里左右。

共享單車

我們再來討論一下現在比較火的共享單車,我們說共享單車改變了我們的生活,有什么改變?

我們拿到摩拜的數據,我們取了每個用戶在騎行過程中的騎行軌跡,我們看到有些人在一個區域內騎行活動,有些人可能會跨區域分別在不同區域騎行活動。

說說共享單車對我們的生活有什么影響,這里我們拿共享單車之前和共享單車之后租房的價格和它離地鐵站的距離之間的關系,畫了一個曲線。

我們發現在共享單車之前2014、2015年之前市場對地鐵房有明確的概念,900米以外已經不再劃定為地鐵房,它的租金會呈斷崖式的下跌。

在共享單車之后,這個距離增加到了1600米,因為相同時間人騎車可以達到距離更遠,所以市場上面把地鐵1600米范圍內全部劃定為了地鐵房,所以共享單車在給我們帶來方便的同時,也讓大家承擔了更高的房租和更高的生活成本。

玩具→工具→datamap

說了這么多城市研究,大家會覺得有意思,會發現以前沒有的現象和成果。最開始我們也是把數據分析作為自己的愛好,憑興趣去做,我認為它是一個玩具。

后來我們覺得它應該不僅僅作為一個玩具,因為它還是能夠反映城市運行和城市空間實際的問題,后來我們逐漸想把它變成一種工具。

我們跟政府、企業各種城市研究的業務,我們有了這樣多維度、多元的數據,使我們在宏觀層面做人口、企業、交通分析時,我們有了更多的手段。


在城市內部,我們可以做更精細化的分析,有了這些數據和分析手段我們可以解決城市里面更復雜的問題。我們給城市不同的部門、不同企業,提供了更豐富的解決方案。

另外作為工具,我們認為應該不僅僅是我們自己使用,我們還是想讓更多人能夠使用大數據的方法和手段。

這里通過兩種方式,其一,城市數據團在網易云課堂開設了很多課程,我們會把自己所有數據采集、數據處理以及可視化的方法告訴大家。

另外針對企業和組織,我們做了一個叫Datamap的數據平臺系統,我們將跟城市空間相關、涉及到城市研究的大部分關鍵性指標數據,都集成起來形成這樣一款通用性的數據平臺。

舉幾個例子:人口方面,我們可以把人口分布在250X250米的柵格里面,在這個精度下我們可以做到任意街鎮、任意地塊、任意半徑范圍內查詢,日間人口規模、夜間人口規模以及人口結構。


人跡方面,我們通過手機識別出人的工作地、居住地,可以查詢任意范圍內居住人口的工作地以及工作人口的居住地等信息。

公共設施方面,我們把地圖POI信息做一些分類匯總,包括教育、醫療、衛生、交通設施等等,就可以分類別、分片區查詢這些設施在片區的分布,以及分析哪些區域設施不足等。

產業方面,我們可以查詢某個行業和企業怎么分布的,可以分析產業的集聚情況、產業的變化情況等。以前我們不知道這些數據從哪里來,不知道這些數據怎么分析,怎么利用數據去研究這個城市。

通過這個系統化平臺化的工具,方便更多的人,不用懂太高深的技術,也不用知道數據庫的用法,也不用懂的數據算法,就可以直接查詢并完成數據的空間可視化。

大數據應用

另外,我們也會給政府做一些定制化的業務場景。舉一個例子,叫做15分鐘生活圈,這是上??傄幮绿岢龅母拍?,是以家為中心,每個人出發15分鐘能夠走到的范圍內,要滿足基本的公共服務設施配置。


這個理念對公共服務配套提出了更高、更人性化的要求。傳統的公共服務設施布局是以設施為出發點,劃一個直線距離作為半徑,設施的服務半徑之外配另外一個設施,這是比較傳統的做法。

現在提出以人為出發點,我們引入了實時路徑規劃的技術方法,我們畫出了每個小區或者每個人從家里面出發,依據他周邊道路,15分鐘實際能夠到達的范圍,可以看到這是一個不規則的圖形,每個人出發的點都不一樣,全部疊在一起,形成了一個路徑范圍的圖。

這里面我們再把公共服務設施放進去,有些公共服務設施在15分鐘范圍內,我們判定它是滿足我們基本公共服務需求的。有些片區沒有這個設施,表示該片區的設施不滿足需求。

另外還有一種情況,周邊好像臨近有一個設施,但是15分鐘到不了,我們從便利性的考慮,這類設施它也是不滿足他的日常生活需要。

通過這種算法,我們更真實、更有效地反映公共服務設施的配套。除了空間距離以外,我們還要跟人口去匹配,浦東區有中心城區、有城市拓展區,也有外圍的新城,人口分布有非常大的差異。

因此需要通過人口密度分布,判斷哪些地區配什么樣的設施以及配多少設施。其實各個部門原來有自己的千人指標配置標準的,在15分鐘的原則上我們給它提出了更便利,或者更精確的,符合人的需求的公共服務設施配置的原則,通過這個原則我們去評價浦東新區各項設施到底是否符合要求,或者是否滿足。

另外,光評價是不夠的,評價之后我們必須提出改善建議,比較有效的方法是新增某個設施,那新增的設施在哪里選址,這個問題更復雜一點。

這幾張圖表現的是如何實現公共服務設施落點最優的算法,即用最少的配置的公共服務設施的點位,滿足最多人群的需求,這就是我們進行大概七輪的篩選,最后選出來這些紅色的區域是我們需要配置公共服務設施的區域,我們把這個結果交給規土部門,他們去做設施布局規劃和設施用地調整,他們有更詳實的基礎和更多的方法去做這個工作,到這里我們認為這是我們在大數據的技術層面上真正地解決了某個具體的業務問題,幫他們評價了公共服務設施,并且給出了公共服務設施的布局建議。

回來反思一下,數據對城市轉型到底起了什么作用?

這是城市研究常規的業務流程,基本上按照收集數據、整理數據、構建研究框架、完成報告、落實具體工作這樣的業務流程來進行,看起來沒什么問題,但是大家應該都注意到,所有研究成果中的數據在某一時間截面固化下來,缺少一個更新維護的機制,導致研究并沒有辦法充分反映城市發展的現實情況;另外在下一次工作周期中,所有的工作還是要從收集和處理數據開始,并沒有形成相應的數據沉淀作為后來的工作基礎。所有這些問題,我們總結下來,是由于目前的研究業務沒有形成數據流的概念。我們現在想幫助城市研究人員建立這樣數據流的概念,通過提供Datamap這樣一個便捷化的工具平臺,大家可以把各種各樣excel表格,包括帶空間屬性的,不帶空間屬性的,都匯總在一起,方便研究人員進行查詢和分析,以及做各種數據的可視化工作。

我們說大數據其實給我們帶來了什么改變?我覺得就是三個方面:

第一,沉淀數據資產。通過規范化的數據工作流程和工具,幫助其在業務過程中積累數據資源。使得數據得以持續的積累與增值。

第二,組織運轉提效。利用數據技術和先進的數據平臺工具,幫助分析人員快速地調用各類數據,生成圖表;為多部門協作管理提供數據服務和支持,提升組織運轉效率。

第三,支持精整決策。通過數據化轉型,結合歷史和多部門綜合數據,利用模型及算法,提供綜合評估,降低由于信息缺失帶來的決策風險。

最后總結一下,在整個城市研究或者數據分析領域中,我們有三個共識:

第一,數據科技的最終目的是解決實際問題。最終的目標是幫助企業、幫助城市研究團隊,幫助政府去解決實際的問題和需求。

第二,數據之“大”是且只是一個工程問題。我們發現后來我們做的15分鐘也好,做的城市研究也好,其實它的數據量并沒有多大,相比某些商業級數據來說它其實數據量很小,但是我們反過來卻可以用大數據的思維和技術方法去思考和解決這個問題。

最后,數據賦能大眾是我們的最終理想目標。我們想把數據的技術方法包括數據的思維推廣給更多的專業領域研究人員,給政府部門、給企業去灌輸這樣一個思想,讓他們認識到數據能夠產生更多的價值,這也是我們做Datamap以及公眾號最終的目標和理想。

謝謝大家。

提問:城市生活垃圾的產生量有多少,它可以反映一個城市的經濟實力和增長潛力嗎?

劉培銳:具體數字我也不是很清楚,但是在城市研究里面,我們確實用到居民的生活用電量、居民生活用水量以及生活垃圾的產生量這樣的數據做人口的分析和預測,目前的技術是成熟的。但是數據之間相關性不一定是因果性,我們不能拿某一個數據,單一維度的數據去判斷這個城市經濟怎么樣,或者它以后應該產生什么樣的結果,我覺得這個思路可能是不對的。因為一個城市是一個非常復雜的系統和體系,里面包括各種各樣多元的指標和數據,我們可能會從數據中間找到某些指標和我們的經濟發展非常相關的,但是它并不是說就按照這個趨勢和邏輯發展下去,直接推導出我們經濟未來發展。


  • 李步云法學獎
  • 數字經濟時代的城市連接
  • 【鴻儒論道】前瞻2020
  • 上海社會認知調查
  • SIFL年會2017
一波中特不夸张打一肖