注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

数据挖掘与数据分析

个人微信:datamen 欢迎交流

 
 
 

日志

 
 

Google Correlate 实验室项目帮你找到真实世界流行趋势的搜索序列  

2011-05-31 08:34:13|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
Google Correlate 实验室项目帮你找到真实世界流行趋势的搜索序列 - Data Mining - 数据挖掘与数据分析

 

Google Correlate是Google Labs里的一个新的实验室项目,它可以帮你找到真实世界里流行趋势的搜索序列,有两种呈现方式:按时间和按区域(暂时只支持美国地区)。比如咱们搜索“mittens”(手套),你就可以看到每年这个词汇的搜索热度(上图蓝色),每年都在冬季的时候火一下,然后迅速降温。同时Google会列出10个(或更多)跟手套相关的搜索关键字,比如“knit hats”(针织帽),你可以对比针织帽(上图红色)和手套在各个时间段上搜索热度的比较。由于搜索的趋势(曲线)很类似,所以Google觉得针织帽和手套是同一类东西,这么判断确实很有道理。

当然这也不是绝对的,比如搜索“losing weight”(减肥),可以看到人类真的是越来越胖了,对减肥的需求逐年增加(下图蓝色)。但这个趋势居然跟“outside wedding”(室外婚礼)近似(下图红色),你就不能说减肥跟室外婚礼是同一类东西吧(也许室外举办婚礼是为了减肥?):

Google Correlate 实验室项目帮你找到真实世界流行趋势的搜索序列 - Data Mining - 数据挖掘与数据分析

 

更厉害的是,你可以自己画一个趋势图,然后让Google给你匹配出最符合的关键字。比如我画这么一个曲线,想看看啥玩意突然在08年火了,之后又突然销声匿迹了:

Google Correlate 实验室项目帮你找到真实世界流行趋势的搜索序列 - Data Mining - 数据挖掘与数据分析

 

结果匹配出来的结果里,原来挪鸡鸭6120突然在08年火了,然后很快又死翘翘了:

Google Correlate 实验室项目帮你找到真实世界流行趋势的搜索序列 - Data Mining - 数据挖掘与数据分析

 除了时间匹配可以判断出二者可能是同一类事务,地区匹配也是一个因素。还拿“mittens”(手套)来说,可以看到美国哪些地区对手套的搜索量最高,同时右边则是针织帽的搜索量,二者在时间和地区上都很匹配,那基本可以证明它们是一类货了:

Google Correlate 实验室项目帮你找到真实世界流行趋势的搜索序列 - Data Mining - 数据挖掘与数据分析

 

Google Correlate是个挺有意思的研究工具,尤其是允许自己画趋势曲线图,大家不妨去试试看。

Via Google Labs


本站文章除注明转载外,均为本站原创编译
文章转载自:http://www.guao.hk/posts/google-correlate-finds-search-patterns-which-correspond-with-real-world-trends.html
  评论这张
 
阅读(2444)| 评论(1)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017