数据是测量的结果无论是古埃及人夜观天象,得到日月星辰的运转,还是今天我们用仪器设备去测定各种指标。本质都是”观察“,观察的结果就是数据。观察的角度不同,得到的数据也不一样。
这取决于我们观察的目的,所以数据分析一定是业务需求导向比如我们要做网站SEO。那么我们最直接就是观察排在最靠前的网站,都有什么特征。
几个可能影响排名的因素:网页大小、下载速度、网页链接数量、正文字数、url的目录层级、query在正文的出现次数、query分词后的词项在正文中的出现次数、query在title中的出现次数等十几个指标
知识是对信息的提炼,本质表达比如,上述信息,很容易表达成知识:网页正文字数和网页包含的链接会影响长尾词的排名覆盖长尾词的页面,保证正文字数控制在500字以上,网页中包含的链接控制在130以下,会提高网页出现在百度首页的概率智慧是人类的事情
关于作者:魏佳斌,互联网产品技术总监,北京大学光华管理学院(MBA),特许金融分析师(CFA),资深产品经理码农。偏爱python,深度关注互联网趋势,人工智能,AI金融量化。