随着计算机研究领域突飞猛进的发展,由此产生的科技文献呈爆炸性增长。面对浩如烟海的资源,用户目前无法直接查询出他所关心的研究领域发展历程及当前该领域的研究热点,而依靠领域专家采用人工的方式来收集资料然后做手工的统计分析是不可取的,因此从科技文献中自动挖掘出相关领域的研究热点非常必要。 本文对计算机领域研究热点探测系统进行了研究。 其基本思想是:以计算机领域中发表的学术会议文章为资源,对其进行预处理获得科技文献的元数据,对元数据的引文进行解析,利用引文分析技术进行计算机主题领域识别。对每个领域的文章进行聚类每个聚类簇被认为包含同一潜在的热点主题。考虑主题的出现频度、被引用情况、主题领域作者影响值和发表机构的影响因子四个因素定义主题。根据定义好的主题表达方式,计算主题的各个属性值。综合主题的属性计算主题热度值,并对主题趋势进行检索以可视化方式显示。经过测试,Trensem系统能对计算机20多个主要发展领域给出自己的发展趋势并对它们的研究热点进行探测最后以图形化显示。 Trensem系统对各领域的趋势进行直观可视化的比较反映出差别。能给意欲投身于计算机科研领域的工作者以有力的支持。当用户输入感兴趣的关键字时,系统能自动将关键字映射到最有可能的科研领域,并给出该领域中比较知名的会议、文章及研究热点,具有很好的易用性。