返回总库    

学科分类

纵向数据和复杂生存数据下广义估计方程方法

作者: 赵目
出版日期:2019-01-01
浏览次数:46次
简介: 参数的估计和推断是数理统计这门学科重要内容,自上个世纪以来,许多统计学家提出了多种不同的参数估计和推断方法。事实上,矩估计、极大似然估计、拟似然估计以及最小二乘等诸多参数估计方法都可以统一到广义估计方程方法的框架之下。因此,广义估计方程方法是现代统计估计理论中应用最为广泛的一种方法。本书将重点介绍纵向数据、右删失数据以及长度偏差数据等一些统计热点数据类型下广义估计方程方法理论和应用研究。
关键词: 参数估计  统计推断  

数字文献资源高维聚合模型研究

作者: 牛奉高
出版日期:2017-01-01
浏览次数:132次
简介: 针对文本挖掘和信息检索中的文本或文献聚类与分类等问题,学术界基于VSM(向量空间模型)主要有两方面的研究:一是文献表示模型;二是算法。然而,传统的算法对高维稀疏的向量聚类存在不足,一些新的算法也不尽完美,更主要的是聚类算法的效果与数据本身的特征以及信息提取和表示密切相关,特别是在信息有限的情况下,聚类算法的优势也不能得到完美发挥。相比之下,信息的挖掘、提取和文献向量表示就尤为重要。如果只有关键词,文献的表示向量相比一般文本表示就表现得更加稀疏。面对这种情形,聚类算法即使是“巧妇”也“难为无米之炊”,因此,本书的重点突破是文献主题语义信息的提取、度量和文献高维向量的表示方法。基于以上问题和现象,本书以数字文献资源为对象,本着在信息资源聚合中减少对背景知识的依赖,便于推广应用的宗旨,提出了基于文献集本身或者相关领域的共现信息而实现文献聚合的共现潜在语义向量空间模型,而且通过实验证实基于CLSVSM的文献聚类表现比基于VSM和GVSM(广义向量空间模型)显著地好。本书还讨论了模型的性质以及通过数学和统计方法降低算法复杂度、提高聚类效率的多种思路,为模型在信息检索和搜索领域的广泛应用提供了一般范式。
关键词: 文献计量学  数字文献资源  

中文微博文本的大数据挖掘:情感分析视角

作者: 史伟
出版日期:2017-01-01
浏览次数:82次
简介: 随着计算机和网络技术的快速发展,互联网日渐成为各种信息的载体。人们在上面(包括新闻评论、产品评论、情感微博、网络社区等)主动的获取、发布、共享、传播各种观点性信息。这些观点性内容对于电子商务、舆情控制、信息检索等都具有重要的意义和实用价值,对网络文本的观点性内容进行自动情感分析成为Web信息处理的一个热点。《中文微博文本的大数据挖掘:情感分析视角》针对中文微博文本,探索从语义和情感本体的角度构建比较完整的情感分析技术,旨在为中文领域的用户、企业、政府等相关方提供更为方便和科学的中文微博文本挖掘工具。
关键词: 互联网络  传播媒介  数据处理  

版权所有:中国社会科学出版社 地址:北京西城区鼓楼西大街甲158号 邮编:100720

京ICP备05032912号-4