数字文献资源高维聚合模型研究
图书简介
针对文本挖掘和信息检索中的文本或文献聚类与分类等问题,学术界基于VSM(向量空间模型)主要有两方面的研究:一是文献表示模型;二是算法。然而,传统的算法对高维稀疏的向量聚类存在不足,一些新的算法也不尽完美,更主要的是聚类算法的效果与数据本身的特征以及信息提取和表示密切相关,特别是在信息有限的情况下,聚类算法的优势也不能得到完美发挥。相比之下,信息的挖掘、提取和文献向量表示就尤为重要。如果只有关键词,文献的表示向量相比一般文本表示就表现得更加稀疏。面对这种情形,聚类算法即使是“巧妇”也“难为无米之炊”,因此,本书的重点突破是文献主题语义信息的提取、度量和文献高维向量的表示方法。
基于以上问题和现象,本书以数字文献资源为对象,本着在信息资源聚合中减少对背景知识的依赖,便于推广应用的宗旨,提出了基于文献集本身或者相关领域的共现信息而实现文献聚合的共现潜在语义向量空间模型,而且通过实验证实基于CLSVSM的文献聚类表现比基于VSM和GVSM(广义向量空间模型)显著地好。
本书还讨论了模型的性质以及通过数学和统计方法降低算法复杂度、提高聚类效率的多种思路,为模型在信息检索和搜索领域的广泛应用提供了一般范式。
作者简介
图书目录
相关推荐
-
图书 角色资源跨界增益的实现路径与模型研究
作者:袁梦莎 刘小浪
图书 角色资源跨界增益的实现路径与模型研究
-
2
图书 多维视域中的数字资本主义批判研究
作者:马俊峰 马乔恩
图书 多维视域中的数字资本主义批判研究
-
3
图书 社会网络环境下用户参与的图书馆数字信息资源建设模式研究
作者:刘磊
图书 社会网络环境下用户参与的图书馆数字信息资源建设模式研究
-
4
图书 中国科学院系统图书馆数字资源建设利用研究
作者:苏金燕
图书 中国科学院系统图书馆数字资源建设利用研究
-
5
图书 数字人文视域下的古籍开发与应用模式研究
作者:欧阳剑
图书 数字人文视域下的古籍开发与应用模式研究
-
6
图书 中国资源型城市绿色转型复合系统研究
作者:张晨
图书 中国资源型城市绿色转型复合系统研究
-
7
图书 环境友好、资源节约型外贸发展模式研究
作者:李小平
图书 环境友好、资源节约型外贸发展模式研究
-
8
图书 新时代中国数字文化产业高质量发展研究
作者:郑自立
图书 新时代中国数字文化产业高质量发展研究
-
9
图书 资源型城市经济社会转型及管理模式研究
作者:曹胜强 邹凡 陶道强
图书 资源型城市经济社会转型及管理模式研究
-
10
图书 高铁基础设施投融资PPP模式研究:框架构建、模型分析与政策建议
作者:陈都
图书 高铁基础设施投融资PPP模式研究:框架构建、模型分析与政策建议
豆瓣评论