数据科学领域里有太多优秀的创业公司,但我不会在这里列出它们,以避免利益冲突。Q3.如何验证一个用多元回归生成的对定量结果变量的预测模型。
像Google Trends, Alexa, Compete这样的工具可以用来确定趋势和分析你的竞争对手的网站。
Q10.有太多假阳性或太多假阴性哪个相比之下更好?说明原因。回答者:Devendra Desale这取决于问题本身以及我们正在试图解决的问题领域。
(以系统推荐条目为例)Last.fm创建一个“站”推荐的歌曲通过观察乐队和个人定期跟踪用户听和比较这些听其他用户的行为。最后一次。fm会跟踪不出现在用户的图书馆,但通常是由其他有相似兴趣的用户。
研究人员了测试太多假设而没有适当的统计控制,所以他们会碰巧发现一些有趣的事情和报告。不足为奇的是,下一次的效果,由于(至少一部分是)偶然原因,将不再明显或不存在。