首页

通过新浪微博数据挖掘预测上证综指走向 02月08日

【摘要】社交网络在最近几年发展迅速,国内的新浪微博覆盖面广,其内容产生便捷,传播迅速,提供了海量的直接或间接数据,故本文选取新浪微博作为数据来源,通过抽取新浪微博中的文本数据,结合上证综指的涨跌信息,发掘二者之问的相关性,并尝试建立预测模型,进而为股市投资者提供一定的参考信息。新浪微博文本数据的抓取,主要是通过自己编写网络爬虫来实现的。其中,重点分析并解决了用户登陆、高级搜索、单位时间内IP访问次 […]