这个网站要实现以下功能:从腾讯新闻、网易新闻、新浪新闻中(当然以后可能会更多其它新闻网站)通过代码自动分析出哪些新闻内容是相似的,然后把相似的内容组织到一起,例如三个网站都有“北京成功申奥”这样的新闻,
要在自己的网站上展示新闻内容,就应该将下载好的新闻按照统一的格式处理好,这样前端(网页端)才能够方便地处理、展示。
contents : { link : http:news.qq.coma20140214015412.htm, title : 哈尔滨一夜清查酒店洗浴等2700余家, passage: 正文内容 }
boardId : news_guonei8_bbs, contents : { link : http:news.163.com140214149L2525NG0001124J.html, title : 哈尔滨
29471498, channelId : gn, contents : { link : http:news.sina.com.cnc2014-02-14142829471498.shtml, title : 哈尔滨