专业性、开放式、国际化的财经教育出版机构
首页 >> 图书中心 >> 图书详情

面向中文社交媒体评论的词法分析

“十二五”省级重点图书出版规划项目
  • 丛 书 名

    墨香财经学术文库
  • 作   者

    :张婧
  • 定   价

    :¥42
  • 译   者

  • 版   次

    :1-1
  • I S B N

    :978-7-5654-4168-4
  • 开   本

    :16
  • 出版时间

    :2021-04-08
  • 页   码

    :139
严正声明:我社网站提供的教学资源仅供教师会员下载后用于教学需要,严谨私自传播、用于商业用途。凡有侵权行为的个人、法人或其他组织,必须立即停止侵权并对其因侵权造成的一切后果承担全部责任和相应赔偿,否则我们将依据中华人民共和国相关法律、法规追究其经济和法律责任。
天猫旗舰店购买淘宝购买当当购买
本系列其他图书

双循环视阈下收缩地区产业结构转型升级:东北地区困境与突破
定价:86元

环境政策驱动经济高质量发展研究
定价:78元

国家治理视域下地方政府与社会组织的互动研究
定价:89元

水利事业单位一般性支出标准体系建设操作指南
定价:108元

国家治理视域下地方政府与社会组织的互动研究
定价:89元
本专业其他图书

工会发展与劳动雇佣管制比较研究
定价:86元

公司理财(第六版)
定价:62元
内容简介
  本书针对微博等社交媒体语料的特点研究了无监督学习的新词识别方法、基于半监督学习的主动学习方法的中文微博分词方法和基于半监督学习的协同训练的中文微博分词方法。与其他研究不同,本书研究工作能够自动获得高质量的微博分词训练语料,有效提高面向微博语料的中文分词器的性能,为面向社交媒体语料的文本处理与信息抽取打下基础,也为训练资源稀缺的研究任务提供了扩充训练语料的新思路。当然,本书的研究工作仍处于探索阶段,还需要继续深入研究。
章节目录
  


第1 章中文分词研究/1

1.1 研究背景和意义/2
1.2 中文分词研究现状/5
1.3 面临的问题与挑战/19
第2 章面向微博语料的新词识别/22
2.1 新词定义及其分析/23
2.2 新词识别的统计量/26
2.3 新词识别算法/33
第3 章面向微博语料的新词识别方法的作用/43
3.1 新词识别实验语料介绍/43
3.2 新词识别实验评价方法/44
3.3 普通新词识别实验设计及结果分析/45
3.4 低频新词识别实验设计及结果分析/50
3.5 小结/55
第4 章基于λ-主动学习的中文微博分词方法/57
4.1 候选样例池的构建/58
4.2 基于半监督学习方法的初始分词器/70
4.3 λ-主动学习方法/72
第5 章基于λ-主动学习分词方法的作用/79
5.1 λ-主动学习分词方法实验语料介绍/79
5.2 评价方法/80
5.3 基于规则修正的跨领域微博分词结果/80
5.4 初始分词器的分词结果/82
5.5 λ-主动学习扩充的语料对LSTM 分词器的影响/83
5.6 小结/86
第6 章基于深度神经网络的中文微博分词/88
6.1 神经网络/89
6.2 基于LSTM 神经网络的中文分词方法/90
6.3 基于BLSTM 神经网络的中文分词方法/93
6.4 基于BLSTM 和CRFs的协同训练微博分词框架/96
第7 章基于深度神经网络的中文微博分词的作用/107
7.1 基于深度神经网络的中文微博分词实验数据介绍/107
7.2 评价方法/107
7.3 λ-主动学习方法对LSTM 分词器的影响/108
7.4 协同训练方法的分词结果/110
7.5 小结/116
参考文献/118
索引/139
有事Q我!
X关闭