链家广州二手房的数据与分析——数据分析1

小插曲:懒洋洋的夏天到了连人也变得懒洋洋的了(借口!)。拖拖拉拉地等到了链家网页改版等到了二手房放盘数目又多了 10,000 + 套(楼市小复苏?),总之又不得不重新爬了一份 51,000 + 的数据。

Inspect Data

因为爬取数据的时候就有洁癖,所以简单的完成数据清洗的工作后就可以来八卦广州的二手房房价了。

总归广州还是一个仁慈的一线城市,手握 250w 就可以选个还不错的房子了。

print(subset(house, total_price == max(total_price))) #誉峰 2800w print(subset(house, total_price == min(total_price))) #荔城中区 50w print(subset(house, unit_price == max(unit_price))) #天銮 121433 print(subset(house, unit_price == min(unit_price))) #富力金港城南区 7471 print(mean(house$total_price)) # 268.3635w print(mean(house$unit_price)) # 34914.52 print(median(house$total_price)) # 228w print(median(house$unit_price)) # 33216

关注度最高的房子在海珠区客村附近,而关注度最低的房子则在花东镇, 太平镇,凤凰城等区域(就是有事没事别到那些地方买房子)。

print(subset(house, follow == max(follow))) # 金影花园 print(subset(house, follow == min(follow) & release_time >= 60)) #花东镇 太平镇 凤凰城 等 Data Visualization

广州房屋价格是近似于长尾分布的,总价和均价的中位数均低于均值。毕竟买不起千万豪宅的人儿终有被平均的命运~

01

而对房子单价影响较高的因素包括:1)交通(近地铁);(2)房子朝向;(3)房子户型;(4)房子装修;(5)房子地段。

00

好奇心指导下开始逐一研究各变量与房屋价格之间的关系,看看数据教我们怎么买房子。

户型

目前放盘的二手房的户型集中在2房1厅,2房2厅,3房1厅,3房2厅和4房2厅这5种户型中,而3房1厅和4房2厅这两种户型的价格明显高于其他主流户型。

02

面积

房子的单价和房子的面积的关系比不明显。

07

交通

众所周知,近地铁的房子要比离地铁远的房子贵,而在广州近地铁的房子均价(38000+)要比不近地铁(26000+)的高约 12000。

03

建筑年代

目前广州在售的二手房有超过一半是建于2000年代,与房地产发展的黄金十年是相符的。

04

而在2000年代建起的房子中大部分是在建于2000年。个人推测原因有两个:1)广州市政府在2000年左右组织建设了大量经济适用房;2)2000年代的房子即将届满20年,而楼龄超过20年的房子对于申请贷款是有难度的。

05

广州的二手房的价格和房子的建筑年代其实关系并不明显的正相关,相反还会有建筑年代越新单价越便宜的趋势。因为新建的房子大多位于位置较为偏远的区域,而老房子可能却因为位于市中心而更受追捧。

06

关注度

较为受关注(>100)的房子均价集中在20000-40000之间,总价集中在100w-300w之间, 而且总价在100w-200w之间的房子(上车盘)关注度更为高。

08

税费

尽管房产证满2年相较于房产证满5年而言税费会高很多,高税费也并不影响房屋的出售价格。从图可以看到房屋满2年和满5年的房价相差并不大。

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/wssfyx.html