开卷题库
所有考题
计算机类
前端开发
HTML/HTML5
CSS/CSS3
Vue.js
React.js
Node.js
Bootstrap
Javascript
TypeScript
后端开发
Java
Python
PHP
Go
C
C++
C#
移动开发
Android
iOS
React Native
Flutter
运维 & 测试
运维
Linux
软件测试
数据库
MySQL
Redis
MongoDB
Oracle
云计算 & 大数据 & 机器学习
大数据
Hadoop
Spark
HBase
Storm
机器学习
ElasticSearch
Docker
Hive
HDFS
计算机等级考试
计算机四级
算法 & 数学
算法 & 数据结构
协议
前沿技术
区块链
软考
软考初级
软考中级
软考高级
人工智能
深度学习
PMI
PMP
ACP
厂商认证
华为认证
思科认证
红帽认证
微软认证
H3C认证
OCP认证
安全
网络安全
信息安全等级保护
建筑类
一级建造师执业资格
市政公用工程
一建建设工程项目管理
一建建设工程经济
一建机电工程
一建公路工程
一建市政公用工程
一建铁路工程
一建水利水电工程
一建通信与广电
一建民航机场工程
一建矿业工程
一建港口与航道工程
二级建造师
二建建设工程施工管理
二建建设工程法规
二建建筑工程管理与实务
二建公路工程管理与实务
其他
B 站 (bilibili)
bilibili 大会员
心理学
行为心理学
人力资源
四级人力资源
四级理论知识
三级人力资源
三级理论知识
二级人力资源
二级理论知识
一级人力资源
一级理论知识
职业考试
教师资格证
财务会计
会计
中级会计
初级会计
会计电算化
会计电算化(中级)
NIT 财税知识
财税知识基础应用
财税知识综合应用
CPA 注册会计师
财务成本管理
财务报表分析
教师资格证考试
小学教师资格考题
小学综合素质
教育教学知识与能力
小学教育心理学
小学教育学
中学教师资格
中学综合素质
教育知识与能力
初中语文学科
初中数学学科
注册安全工程师
中级注册安全工程师
试卷
讨论区
IT 问答
课程返现
登录
注册
全部试题
机器学习
基于统计的分词方法为()
1260
次浏览
A、正向最大匹配法
B、逆向最大匹配法
C、最少切分
D、条件随机场
小开
答案解析
第一类是基于语法和规则的分词法。其基本思想就是在分词的同时进行句法、语义分析,利用句法信息和语义信息来进行词性标注,以解决分词歧义现象。因为现有的语法知识、句法规则十分笼统、复杂,基于语法和规则的分词法所能达到的精确度远远还不能令人满意,目前这种分词系统还处在试验阶段。第二类是机械式分词法(即基于词典)。机械分词的原理是将文档中的字符串与词典中的词条进行逐一匹配,如果词典中找到某个字符串,则匹配成功,可以切分,否则不予切分。基于词典的机械分词法,实现简单,实用性强,但机械分词法的最大的缺点就是词典的完备性不能得到保证。据统计,用一个含有70000个词的词典去切分含有15000个词的语料库,仍然有30%以上的词条没有被分出来,也就是说有4500个词没有在词典中登录。第三类是基于统计的方法。基于统计的分词法的基本原理是根据字符串在语料库中出现的统计频率来决定其是否构成词。词是字的组合,相邻的字同时出现的次数越多,就越有可能构成一个词。因此字与字相邻共现的频率或概率能够较好的反映它们成为词的可信度。
mshare
挑战成功
条件随机场
2年前
mshare
挑战失败
最少切分
2年前
mshare
挑战失败
逆向最大匹配法
2年前
mshare
挑战失败
正向最大匹配法
2年前
chay99
挑战成功
条件随机场
3年前
chay99
挑战失败
逆向最大匹配法
3年前
熙风晨筱
挑战成功
条件随机场
3年前
熙风晨筱
挑战失败
最少切分
3年前
选项 A
选项 B
选项 C
选项 D
提交答案
相似测试题
线性回归的基本假设不包括哪个...
下面哪些对「类型 1(Type-1)...
给线性回归模型添加一个不重要...
关于 ARMA 、 AR 、 MA 模型的...
符号集 a、b、c、d ,它们相互...
下列哪个不属于常用的文本分类...
在数据清理中,下面哪个不是处...
统计模式分类问题中,当先验概...
关于SVM泛化误差描述正确的是
如果惩罚参数C趋于无穷,下面...
微信公众号
微信公众号:
geekdaxue