社区问答系统,是一种基于web的应用,主要帮助用户从社区中寻找复杂的,与上下文相关的问题答案。
社区问答系统主要目标是在尽可能短的时间内我最近发布的问题提供最合适的答案。
相比于传统的检索系统,CQA系统能够利用隐性知识(各种不同社区中)和显性知识(已解决的问题)来回答新问题,可以从知识共享和协作学习两个角度理解。基于以上假设,早期的CQA系统提出了知识管理[13]等理论方法。
社区问答系统的两种主要方法是是内容/用户建模方法和自适应支持方法。
其中,内容/用户建模方法主要对各种用户特性,问题及对应答案进行建模,从而通过低层次问答互动中获得高层次属性,作为CQA功能的重要输入。例如,答案质量评估的输出可以用于对答案进行排序,Shah 等[14]通过从问题,答案好发布问题的用户中提取特征,够早了相当好的评估体系,沈旺等[18]提出的融合用户评价标准和数据特征的回答质量评价指标体系可以获得更高的分类准确率。
自适应支持方法建立在内容/用户建模基础上,通过问题检索和问题路由两种主要方法提高用户协作的成功率和有效性。问题检索主要针对已存档问题-答案对进行推荐,例如Zhang等[15]提出重用CQA系统中的内容的基础任务是为各种形式的查询检索相似的问题;问题路由则是在考虑到用户专业知识,用户活动和动机情况下推荐最佳潜在答案。例如Zhou等[16]从缺失值估计角度考虑问题路由,采用图正则化矩阵补全的方法对缺失值进行估计。
[14]Shah C, Pomerantz J. Evaluating and predicting answer quality in community QA[C]//Proceedings of the 33rd international ACM SIGIR conference on Research and development in information retrieval. 2010: 411-418.
[15]Zhang K, Wu W, Wu H, et al. Question retrieval with high quality answers in community question answering[C]//Proceedings of the 23rd ACM international conference on conference on information and knowledge management. 2014: 371-380.
[16]Zhao Z, Zhang L, He X, et al. Expert finding for question answering via graph regularized matrix completion[J]. IEEE Transactions on Knowledge and Data Engineering, 2014, 27(4): 993-1004.
[18] 沈旺,李世钰,刘嘉宇,李贺. 问答社区回答质量评价体系优化方法研究[J]. 数据分析与知识发现,,:1-18.
综述参考:
Srba I, Bielikova M. A comprehensive survey and classification of approaches for community question answering[J]. ACM Transactions on the Web (TWEB), 2016, 10(3): 1-63.