ROST News Analysis Tool 4.5
返回到主界面,点击搜索按钮or鼠标定位到输入新闻词文本框中按下Enter键,(在搜索的过程中可能会有点卡,常见因素有电脑的网速不是很给力,采集的页数过多,系统同时运行的程序过多等,请耐心等候!)程序会自动生成一系列的相关文本文件,如摘要文件。
(当设置连续采集0 页时,默认采集网站的搜索的最大页数。网页采集的最大页码分别是:搜狗新闻:100页,搜狗网页:100页、必应网页:35页、360新闻:32页、360网页:64页、百度新闻:38页、百度网页:76页)
1.2查看新闻
鼠标可直接单击输出文件文本框打开.txt文档经行浏览,或选择摘要文件、链接文件、域名文件浏览。
2词性识别与词性统计
作用:对文本文件里的词进行词性判断,如名词,动词等;以及
3
ROST News Analysis Tool 4.5 统计文本文件里词语出现的频率。本软件可以采用两种方式进行分析:
I软件自带数据采集功能,数据采集后可直接运行分析功能 II用户外部导入符合格式的文本文档,格式具体要求分析功能的页面经行说明。
分析数据:准备好待上传文件(文件格式仅限.txt格式),注意文本的格式是否点满足系统所提示内容,点击待处理文件最右边的按钮,在打开的文件中选择所保存文件路径(也可以将路径直接复制粘贴到待处理文件文本框中),点击分析按钮,程序会生成一系列的相关文本文件,如地名、总词频表.
4
ROST News Analysis Tool 4.5
添加过滤词:打开“添加过滤词”按钮,即可打开过滤词文本文件,添加所想过滤的关键词保存之后,软件需要重新启动一下,回到词性识别与词频统计界面再次导入上次所选文本文件 分析数据有效。
3社会网络与语义网络分析
作用:过滤无意义词组,统计文本文件中的词出现最多次数,分析每行文字中相关联的词组,用网状形式展现出他们之间的关系。
首先,导入文本文件;然后分步分析或快速分析
5
ROST News Analysis Tool 4.5
注意事项:如出现高频词、提取行特征、共现VNA文件为空时,请检查导入文件格式是否符合这几项要求:1文档是否有内容 2 txt文档大小超过1M 3 行与行之间是否有很多换行,4一句话或一段
6

