WAP手机版 RSS订阅 加入收藏  设为首页
凯发k8娱乐官方网站

凯发k8娱乐官方网站:我们应该扩展收集对象

时间:2020/7/23 7:49:37  作者:  来源:  浏览:0  评论:0
内容摘要:分析了政府部门中一个用户的示例。要求在线舆论专家对36个舆论事件(类别基本平衡)进行评分,这些事件通过这些标记的样本充分利用了专家知识和训练有素的参数。将不同类别案例的评分间隔作为损失函数而没有理想的交叉(例如,“一般”类别的最高评分应低于相邻“敏感”类型的最低评分),每种情况的...
分析了政府部门中一个用户的示例。要求在线舆论专家对36个舆论事件(类别基本平衡)进行评分,这些事件通过这些标记的样本充分利用了专家知识和训练有素的参数。将不同类别案例的评分间隔作为损失函数而没有理想的交叉(例如,“一般”类别的最高评分应低于相邻“敏感”类型的最低评分),每种情况的评分间隔类别应大致相等,所获得的多分类模型具有相当好的准确性。目前使用这种监督学习方法是可行的。

最后,李伟提出了当前模型存在的一些问题和改进方法。首先,当前的样本数量还不够,专家需要对其进行标记;其次,对于不同级别的事件,如何在得分超过的情况下确定阈值。为了解决这两个问题,李伟提出,首先,应扩大样本量,并使用一些未经训练的专家评分样本作为“验证集”。通过此方法进行迭代以使参数更合理。其次,我们应该扩展收集对象。目前,热值的收集对象仅仅是关于事件关键词报告的文章和网页,后续的收集可以增加文章本身的赞美和转发。第三,对于事件得分的不同水平和阈值的确定方法,应考虑更详细的规则。

基于知识图谱和自然语言处理的精细文本分类

李伟首先阐述了知识图谱和NLP精细文本分类的实际需求。在当前的文本分类中,通常根据上下文对其进行分类,但是在句子和单词的层次上并不能很好地理解它。因此,在知识图谱的基础上,应采用NLP技术消除单词的歧义,对文本进行语义识别以实现精细分类,从单词和句子两个层次解决问题。李伟还简要介绍了自然语言处理和知识图谱。 NLP旨在使人与机器之间的通信变得无障碍,

相关评论

本类更新

本类推荐

本类排行

本站所有站内信息仅供娱乐参考,不作任何商业用途,不以营利为目的,专注分享快乐,欢迎收藏本站!
所有信息均来自:百度一下 (鸿利官网)
苏ICP备10213604号-1