第1个回答 2015-09-16
谢邀,这个问题我很感兴趣,不过可能要先做一些Review,因此先简要的讲一些观点。首先是数据的来源,从微博,大众点评,Twitter,Yelp这类网站获取的,大部分是点评信息,也就是所谓的Review,最近正好看过几篇论文是讲ReviewHelpfulness,因此,研究对景点,目的地的点评实用度,进行智能推荐,这应该是一条路子。至于数据的获取方式,应该比较简单,除了Yelp对点评提取有限制,其他几个都有详细的API可供使用。另外的数据来源,我想还包括穷游网,蚂蜂窝这样的旅游游记网站,数据获取的方式会比较复杂,因为这样的网站并不一定提供API,所以需要直接从页面提取,另外提取出来的内容是大文本,需要进行大文本分析,也就是TextMining,可以进行Semantic,SentimentAnalysis,寻找对景点的评价和评级,进行智能推荐。另外,还可以进行AssociationRuleMining,寻找景点之间的关联度,这样可以推荐旅行的路线,或者一些联动性的分析。第三种数据来源,则应该是各种旅行社,酒店,飞机预订的网站数据,这些数据则更难获取,因为大部分为不公开的数据,且时效性强,不过数据的价值更高,针对性的可以对旅游的预算,价格的趋势,飞行路线的优化,进行统筹规划。一次旅行大体可以分为初步想法,线路规划,材料准备,旅行中,旅行回来的总结几个部分,上面说的也都有针对性,点评主要出现再规划和旅行中,游记则可能覆盖前三个部分,预订则是规划部分的重中之重。我认为还有其他数据来源,具体可能需要先做一下研究。最后回答下第二个问题,这些数据的分析研究是有价值的,但不同部分的研究成熟程度不一样,有些已经被很多学者完成了,有些则还是待开发的处女地,寻找出一个好的Gap和好的ResearchQuestion,往往是研究获得成功的第一步。以上只是我的一些初步想法,等我有时间看看相关的论文再上来修改。Over!