技术准备有许多房价网站,有些乱的就像论坛,信息杂糅,也有些虚假繁荣,重复率很高,比如一套房子都能出现好几次,还有很多已经关闭的交易仍然挂在网上,价格还是n年前的。
相比,搜房网是历史久远的老牌网站,积淀多,但传说做低房价,数据不准,而且网站的组织比链家乱一些。俺用node.js写了个爬虫框架,开始搜房和链家的数据之旅。
整个曲线横跨1900年-2017年,没错,房子的建成年代还有2017年,因为链家已经把一些期房也考虑在里面了。06年以后,楼房的建设量一路往下走,13年之后,转向更加剧烈的下滑。
那时候全国都掀起了盖房的热潮,而很多房子在1994年房价下跌和调控的时候才刚刚建成。6. 最贵的房在哪?感觉里,上海的发展比较分散,杨浦、徐汇、黄浦、浦东都有很多繁华的地段,各为中心。
直到一位地产公司的学弟一语道破:去年宝钢搬出上海呀…没错,当你搜索宝钢,很多网点就在宝杨码头附近,而这就是宝山房价涨的最凶的区域,这片区域的房子也是这几个开发商建设的。12. 老房好还是新房好?