研究

R/e/s/e/a/r/c/h

潘兰平:大数据支持下的上海郊野公园建设成效动态监测与评估

发表时间:2020-05-18

导言2020年伊始,上海空间规划设计研究院与《城乡规划》杂志、复旦大学空间规划研究中心联动,策划此次国土空间规划主题系列微谈活动。我们将持续从规划治理、经济发展、人口科学、生态发展、国家安全、地理安全、政府管理、公共卫生、信息科学等多领域专家视角,分享国土空间规划发展进程的全方位解析。

系列主题:本系列推出“智慧国土空间规划”主题微谈,邀请行业内不同部门、不同地域、不同专业的一线专家、学者,从多样融合、创新的视角与维度撰文,以期通过更多真知灼见的分享、交流、碰撞,为智慧国土空间规划的大厦添砖加瓦。

640.jpg

作者:

潘兰平:上海市房屋土地资源信息中心主任,高级工程师

刘利锋:上海市规划与国土资源管理局副处长,高级工程师


微谈主题:

本文介绍了利用多元大数据对上海郊野公园的建设成效进行动态监测与评估的全过程,分别从评估目的、组织方式、评估维度、关键技术以及评估结论等方面进行了详细的介绍,希望探寻出多元大数据助力规划动态评估的最佳实施模式。


着我国城市化的快速发展,城市面积迅速扩张,市中心人群拥挤,生态环境逐渐遭到破坏,如何在推动城镇化建设的同时,保护城市周边的自然资源并为人们提供旅游休闲的场所,成为政府编制城市规划的重点。


上海人多地少,从生态资源的数量看,截止到2008 年,上海生态用地占市域面积的比重不足50%,且重要的生态空间被逐步蚕食,城市的生态游憩空间相对匮乏,生态环境有待改善。


为落实生态文明建设的要求,上海编制了全域基本生态网络规划,确定了3500 平方千米的生态用地,建成区外围生态用地总面积达3160 平方千米以上,并在集中建设区外划定了以郊野公园为重要节点的结构性生态空间。





640.png


表1 上海市近期郊野公园试点建设一览表


2012 年年底,上海正式启动郊野公园规划选址工作,在全市规划21 座郊野公园,按照规划布局和近期实施可行性,确定了7 个郊野公园为近期试点(表1),规划总面积约为130 平方千米,其中一期面积约为50 平方千米。上海市委、市政府的目的在于通过郊野公园的建设,改善城市生态环境,筑牢生态安全屏障,增加市民生态福祉,为实现上海经济、社会永续发展提供良好的生态条件,并逐步形成具有上海特色的生态文明发展之路(图1)。


封面图.png

图1  2035 上海市城市总体规划布局30 座郊野公园







01评估实践








1.1

目的与意义


上海作为超大城市,在环境资源紧约束的情况下,如何在推动城镇化建设的同时,保护城市周边的自然资源并为人们提供旅游休闲的场所,是城市规划考量的重点。郊野公园位于城市边缘,具有开放性特点,拥有良好的乡村自然资源,既起到保护环境的作用,又提供了休闲旅游的场所。


目前,上海已经对外开放了六个郊野公园:浦江郊野公园、金山廊下郊野公园、青西郊野公园、长兴岛郊野公园、上海广富林郊野公园、嘉北郊野公园。根据最新的政府工作报告,2018 年要新增三个郊野公园,浦江郊野公园要开启二期建设。


为了汲取已经建成的郊野公园在运营过程中的经验、落实科学决策的思想,需要利用多渠道、大数据对郊野公园的运营现状进行分析,为后续郊野公园的选址、建设和运营等方面提供决策支撑。



1.2

组织模式和工作特点


此次郊野公园评估工作的正常开展主要依托于上海市房屋土地资源信息中心的大数据工作室组建的“大数据生态圈”。上海市房屋土地资源信息中心以业务为导向,依托协同平台,建立大数据工作室,搭建软、硬件全方位的计算分析环境,解决安全羁绊与旺盛需求之间的矛盾,唤醒沉睡数据,与有效需求进行对接,在确保安全的情况下,集中数据、组建团队,创造性地释放空间数据能量。


640 (2).jpg



在此次郊野公园评估工作中,中心依托大数据工作室的平台优势,链接土地整备中心的规划需求与园区运营方日常运营的需求,整合同济大学、外经贸大学、上海联通、上海数慧、杭州个推等高校与企业资源,为此次评估工作提供全面的业务解读、算法设计、大数据资源、大数据开发以及计算环境支撑,保障评估数据的连续性、计算的准确性以及评估工作的动态性。



1.3

数据来源与说明


本次研究引入了比较多元的大数据类型。除了上海市规划和土地资源管理局提供的“郊野公园及其周边三公里土地规划数据”以外,我们还引入了上海联通的手机信令数据以及杭州个推公司基于手机SDK 的数据,采集客流及人群画像信息。此外,我们结合合作单位“数说故事” 的12000 多条媒体舆情数据,以及自主收集的约25000 条社交平台数据,进行舆情口碑的文本分析,其中主要的数据来源列举见表2。


640 (2).png


表2 数据来源列举表



1.4

评估维度的确定


根据现有数据和郊野公园的建设成效监测评估所需要的研究维度,利用多元数据对现有的数据进行以下四个方面的研究:


(1)郊野公园游客来源分析


区分工作日、休息日、节假日,对郊野公园游客的来源地进行监测和分析。区分游客的来源地、到访时间、空间特征,评估各郊野公园的客流总量、服务范围。


(2)郊野公园内部设施使用成效分析


对郊野公园内部设施的使用成效进行评估,有助于了解其目前的情况,可以为郊野公园的后续建设和其他郊野公园的建设方向提供优化建议。根据评估目的和数据特点,主要评估内容分为两方面:郊野公园内部已有设施的到访情况分析和郊野公园内部游客的活动特征。


(3)郊野公园服务质量分析


此方面的评估工作,我们主要使用步行穿越问卷调查和网络评论细粒度文本建模来综合评价每个郊野公园的服务质量,反映公园的运营问题。


(4)郊野公园建设对周边影响情况分析


区分工作日、休息日、节假日,对郊野公园周边区域人流的来源地、到访时间、空间特征进行分析,进而评估郊野公园对外围设施的影响。郊野公园对周边的联动作用主要分两个方面来研究:一是通过来源地分布的一致性以及区内、区外各类游客占比的相似性来判断郊野公园的带动作用;二是通过郊野公园在单元休息日、工作日增加人数的差异度来比较分析其带动作用。



1.5

评估的技术路线及关键技术


  • 1.5.1  技术路线

以2017 年11 月之前开园的五个公园作为研究对象,通过手机信令、手机SDK、舆情、公园运营等数据,探究郊野公园的人群画像以及活动规律,从游客来源、内部设施使用成效、服务质量、对周边影响情况四个方面进行分析,辅助郊野公园的动态监测与评估(图2)。


640 (7).png


图2 各郊野公园评估技术线路


  • 1.5.2  关键技术


(1)基于手机信令数据的客流来源分析


通过手机信令数据识别居民的行为活动将分为数据质量检验、数据清理程序、特定数据算法三个部分。


数据质量检验:日变数据检验和每天时变(24 小时)规律的检验,确定活跃用户总数、信令条数总数、人均信令条数。


数据清理程序:此程序主要分为三个步骤,分别是排序、剔除、去重,之后进行参数的确定和调整。


640 (3).jpg



特定数据算法:主要通过算法来识别居住地、工作地和游憩地。居住地算法通过计算停留表、累计时间法、特征时间法得出居民的居住地。其中,从晚上8 点至次日凌晨6 点,计算人群累计停留时间最长的位置,且在该位置停留超过2 小时,则该点为当晚的居住地;如果当晚居住地相同且出现天数占比超过60%(整月数据有效的所有天数),则该位置为用户的常住地。


工作地算法同样通过计算停留表、累计时间法、特征时间法得出居民的工作地。计算从上午9 点至下午4 点,计算人群累计停留时间最长的位置,且在该位置停留超过两小时,则该点为当日工作地;如果当日工作地相同且出现天数占比超过60%(所有工作日的60%,以22 个工作日为例,那么60% 则为13 天),则该位置为用户的工作地。


游憩地算法通过计算停留表、累加位置时间法,确定每日的游憩地。从上午8 点至晚上11 点,计算人群累计停留时间最长的位置,且在该位置停留超过15 分钟,同时不是居民的工作地和居住地之一,则该点为当日游憩停留地,每日的游憩地可有多条。


(2)基于手机SDK 数据的客流精细画像


由于大部分郊野公园有开放式区域,没有准确的客流量数据,因此需要使用大数据进行客流量统计。在此项研究中,我们运用的数据来自杭州个推公司,杭州个推的SDK 数据为APP 用户提供信息推送服务的同时,积累了大量的业务数据。


数据覆盖全国数十亿个移动终端,在定位上使用地理围栏技术,根据手机Wi-Fi、基站、GPS 信号,混合定位出一个具体的经纬度位置,并带有时间戳。在实现客流量统计技术方面,我们根据手机定位到的位置,结合系统圈定的景区范围得到Geohash ,从而判断用户是否身处圈定的区域。


640 (4).jpg



我们以上述操作来获取游客人群的采样数,然后针对不同区域分别建模得到采样率,通过去重采样数和采样率得到最终的游客人数。


(3)基于细粒度情感模型的郊野公园服务质量分析


传统的服务质量研究一般使用问卷调查方式。本课题使用步行穿越问卷调查和网络评论细粒度文本建模来综合评价每个郊野公园的服务质量,反映公园的运营状况。我们使用了2017 年6 月至2018 年7 月间超过21000 条的大众点评和携程的游客评论数据。


我们发现评论文本口语化、内容和情感丰富,可以包含多个角度的描述。通过一般的词频和词云分析,能看出高度集中的问题,如浦江郊野公园的停车场和门票问题比较突出。但是,大量低频却同义的词被掩盖,看词频不知道具体发生了什么。因此,我们基于自然语言处理,实现快速、准确的自动文本分析,挖掘网络评论中的问题。其中使用了两个关键技术:细粒度情感模型和自动摘要。


(4)基于新闻舆情大数据的声量分析


我们的合作伙伴提供了海量的互联网舆情数据,覆盖全网90% 以上的互联网评论、新闻数据,综合了新闻舆情与社交网络舆情。其中全网与上海六大郊野公园的相关数据包括:微博2600 多条,论坛450 条,新闻网站、微信公众号等媒体舆情12000 多条。


从图3 的舆情声量来看,上海各郊野公园陆续开放一年来,舆情关注度较低,且2018 年整体关注度低于2017年。舆情主要通过微信公众号自媒体传播,新闻主流媒体的曝光度不足,微博传播也相对较低,因此需要加大这两种渠道的宣传力度。


640 (9).png


图3 媒体舆情声量





02评估结论






2.1

客流量动态监控成效



根据SDK 采集到的个推客流数据,我们对各郊野公园的客流量进行了动态监控。根据每小时客流量制作热力图,通过大屏反映景区内不同时段的客流集散情况,将采集到的每日客流量数据按照时间序列进行客流情况、人群轨迹分析。


(1)客流热力图


根据热力图上的数据变化,可以看出每个公园的热门景点。比如嘉北郊野公园的游客易集中在1 号门附近的景区,而游客的游踪则与公园内的观光车路线一致;长兴岛郊野公园的游客主要集中在靠近高速路的烧烤区和环保博物馆;青西郊野公园的游客大多沿湖观光;浦江郊野公园的“活力森林区”和“奇迹花园区”是较为热门的两个景点;廊下郊野公园的游客分布较散,但是“廊下生态园”和“锦江中华村”仍具有较明显的游客集中情况;在广富林郊野公园,“房车营地”“敞篷营地”和“马术俱乐部”三个景点往往有较多的游客聚集(图4)。


640 (4).png


图4 各郊野公园客流热力图


(2)客流量及轨迹分析


从图5 中可以看到,就客流量而言,浦江郊野公园得益于地理环境的优势,拥有相当高的游客数量,日均客流量超过了6700 人次;嘉北郊野公园和青西郊野公园在游客数量方面则略显落后,日均客流量不足500 人次;其余三个郊野公园的日均客流量均在2000 人次以上,表现不错。其中,廊下郊野公园的游客来源有着明显的地域性,即在客流量方面日均有400人次来源于当地居民,远超位居第二、第三位的广富林郊野公园和浦江郊野公园的日均70 余人次。在平均停留时长方面,廊下、青西、长兴岛等郊野公园的游玩时长都超过2.5 小时,最高的甚至达到3.5 小时左右,其余郊野公园均在1.5 小时左右。


640 (3).png


图5 各郊野公园客流情况示意图



2.2

郊野公园游客画像分析


我们将郊野公园的游客按照兴趣爱好、婚姻状况、年龄、消费水平、性别等维度进行分析(图6、图7)。


640 (8).png


图6 浦江郊野公园游客画像(2018 年5 月1 日和6 月1 日)


640 (5).png


图7 浦江郊野公园游客画像


在婚姻状况方面,绝大部分公园中,已婚游客占多数,而广富林郊野公园依托松江大学城的地理条件,单身游客数量更占上风。


从年龄段来看,25 — 34 岁游客仍是“中坚力量”。其中,在嘉北和浦江郊野公园,25 — 34 岁游客的数量直逼半数。反之,在高龄的游客数量方面,青西郊野公园45 岁以上游客占比约为30%,远高于其他几个郊野公园。


从消费水平来看,各公园的消费水平比较均衡,高消费水平的游客略少,约为25% 左右。只有浦江郊野公园的高消费水平游客数量达到约45%,低消费水平游客数量仅有不到20%。在游客性别画像方面,男性游客与女性游客的数量比大致呈现为6:4,男性占比最高的浦江郊野公园甚至接近75%。


继而,按照年龄段对用户画像做进一步挖掘,发现随着年龄增长,男性游客增多,在45 岁以上的游客中,男性游客的占比在75% 左右;35 —44 岁的游客中,高消费水平的游客最多,普遍占比达40% 以上,其中,浦江郊野公园甚至达到了约77%;购物、社交、影音是各年龄段游客的三大爱好。


此外,带小孩的游客集中在25 —44 岁的年龄段,而这也是游客私家车拥有量最高的年龄段。从纵向对比来看,浦江郊野公园的游客驾车率远高于其他五个郊野公园。



2.3

细粒度情感文本挖掘分析


我们将六个郊野公园的五个细粒度情感维度以雷达图的方式呈现(图8),可以清晰地比较各郊野公园的优缺点:


640 (6).png


图8 六个郊野公园情感细粒度雷达图


(1)在“消费”评价维度,廊下郊野公园存在突出的问题;


(2)在“餐饮”评价维度,廊下郊野公园“拔得头筹”,获得评价最高,嘉北和青西郊野公园较之略显逊色;


(3)在“交通”评价维度,各公园均有不错的舆情表现;


(4)在“生态”评价维度,除了廊下郊野公园稍显落后,其余郊野公园均在各项评价维度中占得优势。可见,出于生态保育为目的的郊野公园建设获得了游客不错的评价;


(5)在“设施”评价维度,在对廊下、广富林、青西郊野公园的评价中出现了较多的负面情绪。


我们还比较了六个公园的情感细粒度评论声量(图9):


640 (10).png


图9 六个郊野公园的情感细粒度评论声量


(1)在“生态”评价维度:除了嘉北郊野公园,其他郊野公园都有较高的关注度;


(2)在“设施”评价维度:游客对每一个郊野公园的设施都非常关注;


(3)在“交通”评价维度:浦江、青西、广富林和嘉北郊野公园的游客关注度更高;


(4)在“消费”评价维度:廊下和长兴岛郊野公园的声量较高,廊下郊野公园消费得分极低;


(5)在“餐饮”评价维度:廊下郊野公园的游客对于餐饮有更高的声量,且得分较高。


进一步分析,如图10,可以对所有负面评论按细粒度维度区分,自动生成“词云”,能体现出问题的所在。


640 (11).png


图10 负面评论按细粒度维度区分形成的“词云”


比如在“设施”的维度上展开负面评价的“词云”,可以看到浦江郊野公园和青西郊野公园的负面情绪均来自于停车场问题;在“餐饮”方面,浦江、青西、嘉北郊野公园的餐饮问题主要是餐厅不足,而长兴岛的餐饮问题体现在食物不好吃上。



2.4

郊野公园游客来源地监测和分析


区分工作日、休息日、节假日,对郊野公园游客的来源地进行监测和分析,可以得到以下结论:


(1)通过郊野公园的人流总量可以看出,浦江公园的人流密度最大,嘉北公园的人次数总量最大;


(2)从郊野公园游客来源地累加总量可以看出:在青西郊野公园,来自中心城区的游客占比相对其他公园较高;嘉北和长兴岛郊野公园的游客量则是沿所在地到中心城区逐渐降低;浦江郊野公园的游客来源主要集中在周边的街道、区县;廊下郊野公园的游客主要来源于周边,中心城区的游客占比少,出现一定的不连续性;


(3)根据郊野公园游客来源地区分节假日、休息日、工作日,可以看出:相比工作日和节假日,休息日的游客来源地分布更广,远距离分布更加明显;而工作日的游客来源地分布以邻近为主,远距离分布会稍微减弱;节假日的游客来源地分布则是邻近区域相对减少,远距离分布情况比工作日明显。


  • 2.4.1  青西郊野公园

青西郊野公园的游客来源主要以所在的青浦区为主,其中,来自青浦区的游客占比达到70.74%,区外游客占比为29.26%,来自中心城区内各街道游客也占有一定的比例(表3)。


640 (12).png


表3 郊野公园游客来源地分布表


  • 2.4.2  嘉北郊野公园

嘉北郊野公园的游客来源主要以所在的嘉定区为主,其中,来自嘉定区的游客占比达到71.81%,区外占比为28.19%,由嘉定区向中心城区方向的各街道游客也占有一定比例(表3)。


  • 2.4.3  廊下郊野公园

廊下郊野公园的游客来源主要以所在的金山区为主,其中,来自金山区的游客占比达到64.71%,区外游客占比为35.29%,来自中心城区内各街道游客占有少量比例(表3)。


  • 2.4.4  浦江郊野公园

游客来源主要以所在的闵行区为主,其中,来自闵行区的游客占比达到64.76%,临近的浦东新区、奉贤区的游客占有一定比例(表3)。


  • 2.4.5  长兴岛郊野公园

长兴岛郊野公园的游客来源主要以崇明区为主,其中,来自崇明区的游客占比达到33.41%, 区外游客占比为66.59%(为五个郊野公园中最高),由崇明区向中心城区方向的各街道游客占有相对高的比例(表3)。


以工作日、休息日各公园游客来源地的百分比排序可以看出,各郊野公园休息日的人数和来源地分布与工作日相比更多、更广,来自中心城区的游客占比也有所增加。但是嘉北郊野公园来自周边的游客人数增加更为明显,浦江郊野公园由于地处市中心,对比差异较弱。


综合上述五个郊野公园的情况,根据郊野公园所在区(县)和区(县)以外的游客人数占比进行分析,可以看出,除长兴岛公园区外游客人数大于区内之外,其余四个公园都表现出区内游客人数大于区外的特征,人流来源主要是以区内为主(表3)。



2.5

郊野公园内部设施使用成效


每个郊野公园所处位置和内部设施各有特色。从停留人次来看,公园内各个基站的差异普遍较大,位于公园边缘的基站,停留人次更多,处于公园内部的基站,停留人次普遍较少;从停留时间来看,节假日的停留时间长于休息日,休息日长于工作日;从游客在不同基站的停留时间来看,游客在公园边缘基站的停留时间一般长于内部基站(图11 — 图14)。


640 (13).png

图11 浦江郊野公园内部活动路径汇总

640 (15).png

图12 浦江郊野公园累计条数较多路径分布

640 (16).png

图13 浦江郊野公园各个基站停留平均时间统计

640 (14).png

图14 浦江郊野公园各个基站停留总人次统计


但是各公园之间也存在一些差异,浦江公园出现了一个分析基站到访数量明显高于其他基站的情况,而廊下公园人群分布相对平均。这一现象与公园自身的开发程度和周边设施条件有关,不同公园有不同的规律。


  • 2.5.1  浦江郊野公园内部设施使用成效

浦江公园位于闵行区,是近郊都市森林型郊野公园,内部共有六个分析基站。从停留人次和停留时间来看,浦江公园的5 号、6 号基站数据存疑,这两个基站位于浦江公园主要开发地区,数据量明显偏小。


1 号、2 号、3 号、4 号基站位于浦江公园滨江漫步区。从内部活动路径来看,由于5 号、6 号基站数据可能存在缺失现象,因此,从轨迹数据分布来看,主要轨迹集中于1 号、2 号、3 号、4 号四个基站。虽然考虑到3 号、4 号基站周边存在其他设施,可能与实际情况有出入,但是,仍然可以看出滨江步道对游客和周边居民的吸引力是很强的。


  • 2.5.2  廊下郊野公园内部设施使用成效

廊下郊野公园位于金山区,与浙江省平湖市相邻,东侧与廊下镇镇区相邻,廊下公园面积较大,内部共有七个分析基站。从内部基站停留人次上看,东侧人数较多,西侧较少,但是西侧开发的游憩设施较多,东侧则是廊下镇区,这一数据可能受镇区及周边设施影响。从停留时间来看,在镇区停留时间较长,公园内部停留时间较短。


从内部活动路径来看,4 — 5 路径人数较多,可能受到周边的影响比较大。2 — 6、3 — 6 路径人数较多,结合实际游憩设施,可能是实际游览路线的反映。相比其他公园,廊下各条路径所占比例相似,没有出现其他公园几条路径占绝对主导地位的状况,可能与廊下公园整体结构比较自由、游客可以比较随意地选择游览路线有关。


2.6

郊野公园周边村镇带动成效


从游客导流的情况来看,广富林郊野公园周边的客流量较大,对两个商业中心—开元地中海和松江万达的导流效果较好,均有30% 以上的游客从郊野公园被导流到目的地;廊下郊野公园周边的客流量小,对周边业态的导流效果不佳,只有不到1% 的游客被顺利导流。其余几个郊野公园的导流情况表现正常,均有6% — 18% 的客流被导流到目标商圈或景区(图15)。


640 (17).png

图15 各郊野公园周边游客情况及游客导流情况示意图





03结语





在这次评估实践中,我们依托上海市房屋土地资源信息中心大数据工作室的平台优势,首先以业务为导向,细化评估目标,设计指标体系;其次整合多元数据,启动大数据工程,挖掘客流的人群活动规律;最后通过对郊野公园进行持续监测,形成郊野公园的多维画像,辅助评估工作的开展。


此次评估的郊野公园可谓“麻雀虽小,五脏俱全”,我们凭借多元数据的优势,将实施评估工作从定性研究转变为定量分析,并通过数据指标对郊野公园进行刻画与描述,真实、具象地反映郊野公园各方面的状况,并在此基础上提出评估建议。


目前,上海郊野公园监测评估工作还在持续推进中,文章给大家介绍的还是利用大数据进行监测评估的初步成果,后期还会依托大数据工作室对评估指标进行动态监测,定期为郊野公园的运营与管理部门提供检测报告,并对关键指标进行预警,辅助郊野公园的规划、运营与管理。


(本文基于上海市房屋土地资源信息中心承担的上海规土空间大数据动态监测和辅助决策项目,由上海市房屋土地资源信息中心、上海市土地整理中心、上海同济大学、上海对外经贸大学、上海联通、上海数慧、杭州个推合作课题的部分成果整理形成。)| 来源:《城乡规划》杂志



Copyright  ©  2020 版权所有:上海空间规划设计研究院有限公司  沪ICP备20007340号-1