分类筛选
分类筛选:

关于文档硕士论文范文 跟基于个性化特征文档的联合参考咨询匹配模式*方面论文范文数据库

版权:原创标记原创 主题:文档范文 类别:发表论文 2024-04-17

《基于个性化特征文档的联合参考咨询匹配模式*》

该文是关于文档论文范本跟特征文档和个性化和匹配相关毕业论文题目范文。

[摘 要]联合参考咨询平台是文献共享计划服务的核心工作之一.通过现有的个性化搜索模式提出一种新的匹配方法,以提高联合参考咨询平台的用户满意度.该方法从用户个性化特征出发,将构建的用户特征文档与咨询员、资源特征文档进行相关性特征权重匹配运算,用于获取最优的咨询单解决方案.最后通过调查研究,证实了该模式的有效性.

[关键词]特征文档标签联合参考咨询相关性匹配

[分类号]G252.6

随着Web2.0技术的普及应用,自媒体(博客、微博、微信、贴吧、BBS等)已成为主流信息发布平台,网络信息呈现爆炸性、无序性增长.信息用户面临海量的信息资源,要从中汲取对自己有价值且符合情境的信息变得十分困难.联合参考咨询平台,作为权威的信息整合发布平台,致力于为信息用户个性化检索提供精准的服务,其中问题解答机制是关键.当前,我国国内联合参考咨询平台的咨询模式为:信息咨询用户提供咨询表单,咨询员领取任务表单解答问题.在信息资源检索中,精准度取决于查询关键词与资源描述的匹配程度.因而,寻求一种基于标签文件的个性化专家匹配咨询模式来提供私人式的精准服务是十分必要的.

目前,标签(Tag)应用非常广泛,作为资源的标识,已经成为网络信息资源不可或缺的元素之一.标签系统允许用户为任意资源通过标签的形式添加语义标注[1].因此,标签可以作为用户的特征标记来描述用户的知识体系及关注点,从而更加深入准确地反映出用户切实需求.

在个性化检索的课题研究中,如何获取咨询用户特征信息,并通过建立模型与查询系统相匹配,以提高信息检索系统的查全率、查准率和用户满意度是着重点.在这一方面的研究中,White·R·W等提出利用用户的检索记录来建立个人特征文档的方法来提高检索效率[2].He Yuyang等提出利用兴趣相似用户的用户配置文件来拓展用户兴趣模型,提高用户查找资源的精准度[3].Shen Xuehua等提出了在第一次的检索结果上利用重构的配置文件进行二次检索,得到更加精准的查询结果[4].Wu Men?glun等针对文献[3]的协同过滤导致的系统初期没有足够用户资源的稀疏性问题提出一种基于内容的新检索方法[5].胡妙等提出利用构建用户配置文件和资源配置文件,将查询与资源配置文件的结果与用户配置文件进行二次匹配,提高结果与用户兴趣的匹配程度[6].

笔者针对联合参考咨询平台的咨询体系,提出了一种新的检索匹配方法.首先利用逆文档词频分别构建用户、咨询员和资源的特征文档.在用户咨询的过程中,将用户的特征文档与咨询员的特征文档进行匹配,由相关度最高的咨询员利用用户关键词与资源进行检索匹配,使得解决问题更加符合用户的实际想法,以提升用户的满意度和归属感.

1 特征文档构建

在标签及其权重的算法中,有基于词频(TF)、逆文档词频(TF-IDF)和BM25等,笔者在考虑了标签使用频率的基础上选用应用较广的TF-IDF方法进行文档构建.配置文件采用V模型,由标签和权重两部分组成,权重代表每个标签的相关度.查询、资源、用户和咨询员都用同一标准的术语空间标记为向量.分别定义如下.

1.1 用户特征文档

在标签的使用过程中,用户根据自己的偏好来定义标签.通过资源标注的形式来界定资源的属性,所以说,标签是反映用户偏好的标识,而标签对应的权重代表用户对标签的使用程度.用户偏好定义如下:

其中,Ni,x 表示用户i标注标签x的使用频率,Ni 表示用户i标签的使用总频率,即标签标记资源总数,Ni,a 表示用户i使用过的标签数.当用户只标记过一个标签,该标签的权重等于1.

1.2 咨询员特征文档

咨询员在从事相关学习工作的过程中,具有一定的科研专业方向性和关注倾向性.因此,可以通过标签及其权重来定义咨询员的各个学科的专业属性及倾向程度.咨询员属性定义如下:

其中,Nj,x 表示咨询员j的擅长专业标签x的关注程度,Nj 表示咨询员j特征标签标记总数,Nj,a 表示咨询员i用过的标签数.当咨询员标记过特征标签数为一个的时候,该标签的权重值为1.

1.3 资源特征文档

通过建立资源特征文档,设置标签和权重,标签表示资源的具有某一特征属性,权重值表示标签与文档的相关程度.定义如下:

其中,Nk,x 表示使用标签x 标记资源k 的用户数,Nk 表示资源k的标记用户总数,Nk,a 表示标注过资源k的标签总数.当资源被标记过特征标签数为一个的时候,该标签的权重值为1.

2 咨询匹配模式

2.1 匹配算法

在利用标签的个性化检索系统实现的过程中,通常是通过某相似函数运算来比较资源特征和用户偏好的相关匹配程度.在参考咨询平台运行过程中,咨询表单由用户提交给系统,系统二次分配给相关咨询人员.因此,咨询人员的专业属性及关注偏好对解决相关咨询用户问题,获得较高用户满意度尤为重要.笔者提出在表单咨询过程中通过Cosine-Based函数算法来计算咨询员特征文档与用户特征文档,得到的相似性值越高,表面两者越匹配,该咨询员更能了解用户的潜在需求.进而在解决问题过程中越接近用户心中的答案.匹配算法如下:

(1)用户与咨询员的相关性匹配算法

其中,Nx 代表进行相关性匹配的标签数,Nu,x代表用户特征文档中的标签总数.

(2)查询关键词与资源特征相关性匹配算法

其中,Nx 代表进行相关性匹配的标签数,Nq,x代表查询表单文档中的标签总数.

2.2 咨询专家匹配流程

笔者提出的基于逆文档词频咨询匹配模式流程如图1所示.

在联合参考咨询平台中,用户提交咨询表单,系统通过用户咨询表单提取已经构建好的用户特征文档.通过基于Cosine-Based的匹配算法将用户特征文档与咨询员数据库中各个咨询员特征文档的标签进行匹配,寻求特征相关性最大的咨询员.最佳咨询员接收任务表单,利用表单提问关键词与资源特征文件的标签进行Cosine-Based匹配运算,获得的初步检索结果经过咨询员整合最终形成最符合用户期望的知识框架.

2.3 咨询匹配算法描述

在咨询匹配算法中,主要包括构建用户特征文档、咨询员特征文档和资源特征文档,用户和咨询员相关特征匹配,查询与资源相关特征匹配.具描述如下:

输入用户i提交的咨询单Q(qi),用户咨询员资源的特征标签数据集UCRT(UCRTi,UCRTj,UCRTk)输出检索资源结果return()

1.Usecase(UCRT);//在数据集中特征文档用例集

2.Reference(UCRT);//在数据集中查询用例集

3.Utvaule(Ui);//计算用户特征文档中的标签权重

4.Ufeafile(ai,Utvaulei);//构建用户特征文档Ufeafile等于{(ai,vi),……,(an,vn)}; ? ai∈Usecase(UCRT)

5.Ctvaule(Cj);//计算咨询员特征文档中的标签权重

6.Cfeafile(aj,Ctvaulej ) ;构建咨询员特征文档Cfeafile等于{(aj,vj),……,(an,vn)}; ? aj∈Usecase(UCRT)

7.Rtvaule(Rk);//计算资源特征文档中的标签权重

8.Rfeafile(ak,Rtvaulek);//构建资源特征文档Rfeafile等于{(ak,vk),……,(an,vn)}; ? ak∈Usecase(UCRT)

9.For(j等于1;j≤m;j++)//遍历咨询人员库中的咨询员,m为咨询人员总数

{

10.Renturn(Cj)等于 max(coo(r Ui,C)j );//计算咨询员与用户特征文档的相关程度,返回最大相似咨询员

11. }

12.For(k等于1;k≤n;k++)//遍历全部资源特征文档,n为资源总数

{

13. corr(Qi,Rk) ;//计算查询表单与资源特征文档的相关度

14. Rank(r);//按corr(Qi,Rk) 结果降序排列

}

15.Getfrom();//最优咨询员进行决策,解决表单问题,提交答案

16.Output();//输出答案

1匹配模式实证

笔者采用问卷调查法,利用LibQUAL+TM[7]中的用户满意度二级指标展开用户评价调查,从咨询的周期时长、与咨询的契合度和解决问题的覆盖面程度这3个维度进行评分.评价标准为每个用户分别从3个维度进行评价,每个维度包括3个指标:最低可接受程度值、期望值和实际感受值.每个指标的度量采用里克特五级量表,从1到5分别代表从“非常不满意”到“非常满意”的满意度区分值.

本次调研时间为2015年10月至12月,利用网络问卷和实地两种方式.调查对象分为两组,分为未涉及咨询专家匹配咨询模式组和参加咨询专家匹配咨询模式组.共发放问卷500份,每组250份,其中未参加专家匹配的回收问卷233份,有效问卷212 份,有效率84.8%;参加专家匹配的问卷回收225份,有效问卷206份,有效率82.4%.在调查样本中,本科生占38%,专科生占22%,科研人员占18%,教师占16%,其他人员占6%.该样本满足抽样大于200的样本原则及具有普遍性原则,具有一定的代表性.调查问卷采用Cronbach α信度系数进行问卷信度分析,利用SPSS统计分析得到结果见表1.可以看出该测试结果α系数大于0.7,表明问卷信度比较理想,具有较高的可信度.

通过调查结果的数据整理,计算出各项的平均值及相应差距值,如表2

从表2可以看出,参加专家匹配的用户在问题解决的契合度及覆盖面上,比未参加专家匹配的用户更加接近他们的期望值(期望值与实际感受值的差值线较小).因此,基于此调查结果,笔者提出的咨询匹配方法切实有效.

3 结语

笔者研究了联合参考咨询平台中如何进行有效构建用户特征文档并更好的和咨询员、资源进行有效匹配的问题.通过逆文档词频方法对用户、咨询员及资源的特征文档进行标签和权重构建,在此基础上利用Cosinc-Bascd函数相关性算法进行用户特征文档与咨询员特征文档、资源特征文档的匹配运算,力求为用户提供最优咨询员的最优问题解答,提高用户满意度.最后通过问卷调查,利用SPSS精细问卷信度和数据分析,表明笔者所提出的方法能更加贴近用户个性化需求,从而有效提高用户满意度,提高联合参考咨询服务平台的服务水平.

参考文献:

[1] 袁柳,张龙波.个性化搜索中的用户特征模型研究[J].计算机工程与应用,2011(15):19-24.

[2] White·R·W,Chu Wei,Hassan·A,et al.Enhanc?ing personalized search by mining and modelingtask behior[C].Proc of the 22nd InternationalConference on World Wide Web.2013:1411-1414.

[3] He Yuyang,Tang Yan.Research of user profilemodel in personalized search[J].Applied Mechan?

文档论文参考资料:

毕业设计文档

word文档论文格式

政论文范文

毛概论文格式

高被引论文

政论文

上文总结:该文是一篇关于特征文档和个性化和匹配方面的文档论文题目、论文提纲、文档论文开题报告、文献综述、参考文献的相关大学硕士和本科毕业论文。

和你相关的