您好,欢迎来到化拓教育网。
搜索
您的当前位置:首页基于N-gram模型的哈萨克语语音识别及处理技术研究

基于N-gram模型的哈萨克语语音识别及处理技术研究

来源:化拓教育网
信息记录材料2 01 8年9月第1 9卷第9期 基于N-gram模型的哈萨克语语音识别及处理技术研究 孙晓杰 (伊犁师范学院电子与信息工程分院  伊宁 8 3 5 0 0 0) 【摘要l语言是人与人之间沟通的桥梁,语言识别技术作为一种非常重要的技术,对于促进世界文化交流有着十分 重要的意义。目前,N—gram模型是使用最为广泛的一种语言模型,它不仅能够压缩语音在识别过程中的搜索空间,还 能使语音识别准确率大幅提高。哈萨克语的黏着性较强,其组成结构复杂,这也使^们对哈萨克语的语音识别存在较大 困难。为此,本文便基于N—g ram模型对哈萨克语语音识别及处理技术进行深入的研究,在此基础上构建了哈萨克语语 音识别N-gram模型,最后对基于N-gram模型的哈萨克语语音识别及处理技术的应用效果进行了验证。 【关键词】N-gram模型;哈萨克语;语音识别;处理技术 【中图分类号】TP391.1 【文献标识码】A 【文章编号】1009—5624(2018)09—0097—03 1引言 的目的。在本文中,N—gram模型构建的文本数据库在数 哈萨克语作为一种黏着性较强的语言,这也使该语言 据来源上主要包括四个方面,分别是平面媒体、新闻媒体、 的语音识别较为困难,依据其语言特征,哈萨克语的形态 教材媒体与在线电子资源。在上述数据来源中按照类型将 及构词都是由词缀与词根组成的,不同词缀的连接都有着 其分别存储到磁盘的不同目录中,以便于后续进行管理与 不同的结构及语法意义,这也使许多学者致力于对哈萨克 加工处理,对相关信息进行提取,然后将其存储到相应的 语的语音识别与处理技术研究。在以往的语音识别技术中, 关系数据表中。关系数据表具备如下属性,其一,原文件 主要是基于机器学习的方法来实现的,但对于大词汇量连 信息,其是指原始文件的存储路径以及文件名等信息;其 续语音的识别则存在明显不足,而哈萨克语的连续性非常 二,原文件类型;其三,文本文件,对原始文件中的文本 强,这也使传统的机器学习方法难以适用于哈萨克语的语 进行提取,并进行句子切分、符号转换、错误修正等处理 音识别。而N—gram模型的出现,则为哈萨克语的语音识 后,使其处理为纯文本,并存储到特定的文件中。本文所 别与处理提供了可靠的技术保障。为此,以下便对N-gram 采用的URI串能够为不同的文件匹配不同的名字串。其四, 模型在哈萨克语语中的语音识别与处理技术进行深入的研 文档处理状态是指该字段所处的当前状态,其状态类型主 究。 要包括正在处理状态、完成状态、错误状态、副本状态及 2 N—gram模型在哈萨克语中的语音识别与处理技术研究 瑕疵文本状态;其五,关键词能够对文本属性中包含的关 2.1构建文本数据库 键词字符串进行描述。在构建文件数据库时,需要控制其 N~gram模型在对哈萨克语进行语音识别之前,需要构 数据冗余,也就是在数据库中进行文本添加时预防不同文 建相应的文本数据库,通过对语音文件中的相关信息进行 件URI中出现相同的文档内容。对数据冗余的控制主要有 提取,并将其与文本数据库进行匹配,进而达到语音识别 两种方法,分别是基于URI的冗余控制与基于文件内容的 4.4设计碰撞检查 精度。 B IM技术应用于碰撞检查中可分为单、多专业碰撞, 5结语 后者指结构、机电专业碰撞,多专业碰撞因为构件管道多, 长远来看,装配式结构符合我国工业化生产发展主要 所以需分组集合,分别进行碰撞检查。在对BIM模型检查 方向,依托BIM技术的集成分析优势,二者相辅相成,能 中,预制构件之间的碰撞检查作用极大。工厂生产预制构 够有效地强化国内设计施工水平,同时需要在实践中将二 件之后运至施工现场装配安装,如若施工过程中出现构件 者更紧密地结合与完善,推进国家建筑工业化发展。 之间的碰撞,需对预制构件进行开槽切角,然而预制构件 成型之后不能随意开切,需要新制预制构件至现场,容易 【参考文献】 造成损失与工期延误,预制构件之间的碰撞,主要是其与 [1]颜爽.BIM技术在装配式建筑构件中的应用探讨[J】.建材与 现浇结构之间的碰撞。 装饰,2017,(13):48-49.[2017-08—15】. 4.5产业链主体之间信息传递 [2]田东,李新伟,马涛.基于BIM的装配式混凝土建筑构件 BIM技术贯穿于整个工程生命周期,实现住宅产业信息 系统设计分析与研究【J】.建筑结构,2016,46(17):58-62. 化的同时可以将生产。施工运维阶段的实际需求与技术整 [2017-08-15]. 合到设计阶段,虚拟预演现实,真正实现BIM信息化应用。 BIM信息化与云技术相结合,有效地无缝转递信息, 作者简介:张忠超(1996-),男,汉族,黑龙江大庆,本科研 强化各部门横向联系,借助移动设备设置客户端,实时查 究方向:土木工程;通讯作者:黎虹(1969一),女,汉族,江 看项目所需信息,实现项目可移动办公进而提高项目完成 西宜春、教授级高工、学士研究方向:装配式建筑。 97 匾 堡: !±! 篁 !查箜!塑 要是对单词序列的概率进行计算,此外还可以通过更小单 位的使用来构造词典,进而使词汇变得更大。本文便对哈 萨克语语音识别N-gram模型进行了构建,利用N—gram模 型分别对哈萨克语的单词及音节进行识别,并进行效果对 比。在单词N—gram语言模型中,将哈萨克语词典中的各 个符号作为单词,在音节N—gram语言模型中,通过设置 单词分割令牌来进行处理。利用SRI语言模型训练工具来 对上述两个N—gram语言模型进行训练,并利用Kats模型 对哈萨克语中的低频词与未登录词进行平滑处理。 4基于N—gram模型的哈萨克语语音识别及处理技术的 效果验证 数据冗余控制。第一种控制方法需要在每次添加文件时对 UR I进行检查,第二种控制方法利用哈希算法对文本的哈 希值进行计算,然后与已添加文件的哈希值进行对比,以 此达到数据冗余控制的目的。 2.2处理被提取文本 在对原始文件中的文本提取后是不能直接使用的,它 还需要对文本进行进一步的处理才能使用。其在文本处理 分为以下步骤,其一是对字符编码进行处理,在哈萨 克字符中经常出现UNICODE编码问题,因此在进行处理时, 应对哈萨克字符的编码格式进行统一,通常情况下可以采 用UKK编码;其二,对句子进行切分,在对字符的编码格 式进行统一后,需要依据文本中的句号、感叹号、问号等 符号来对句子进行切分,然后将切分后的句子作为一行存 储到相应的文本文件中。其三,对缩略词进行替换,在哈 萨克语的新闻类文本中包含有许多缩略词,在进行处理时 需要将这些缩略词替换为相应的扩展形式。N—gram模型 利用正则表达式来搜索文本,进而找出所有与缩略词相匹 配的字串,并通过人工挑选的方式对哈萨克语缩略词进行 选出,然后对这些缩略词的扩展形式进行添加。其四,数 字扩展,在哈萨克语的原始文本中包含着许多阿拉伯数字 符号,这些阿拉伯数字符号主要包括序数词与基数词,由 于在哈萨克语的句子中各个单词都是由空格进行分隔的, 因此在对待处理文本进行读取时,可以先对句子进行切分, 然后再对词进行切分,这样较为容易实现。在切分完毕后 按照词串的顺序来对单词进行提取,对单词是否是由纯数 字字符组成进行判断,当判断其是由纯数字字符组成时, 可将其当作一个基数词,并调用基数词转换过程使其成为 相应的文字形式,如果判断其不是由纯数字字符组成的, 则需要对数字符号后的“一”进行检查,如果检查出存在 该符号,则将其当作序数词来进行文字转换。如不存在, 可以判断该句子出现拼写错误,需要将其从文本中删除。 2.3处理重复句子 在数据库中对文本进行添加时,会生成大量的重复语 句,这些重复语句有许多都是广告词语或标题,因此需要 对这些重复句子进行筛选与删除。可通过句子计数过滤器 来实现重复句子的删除,在该过滤器中主要是依据各个句 子的哈希值来对其在语料中的出现次数进行计算当,当哈 希值超出规定阈值时,便对后面同样的句子进行删除。如 果句子的出现次数较少,但其中包含有较多复杂数字符号、 集外词及外文字符时,可以通过错误句子过滤模块来对其 进行处理。 3哈萨克语语音识别N—gram模型 在连续语音识别中构建语言模型具有十分重要的意 义。哈萨克语的声学信号具备很强的随机性与动态时变 性,仅利用声学模型来对其进行匹配与判断,是很难对其 进行准确识别的,对于一个高效的语言模型来说,其不 仅能压缩搜索空间,还应具备较高的识别准确率。现阶 段,N-gram统计语言模型的使用范围非常广泛,可以利用 N-gram统计语言模型为哈萨克语提供上下文的关联信息, 进而有效弥传统声学模型中的不足。N—gram语言模型主 98 4.1语音数据及文本 利用文本来对语言模型进行训练,在该文本中包含 有10754245个单词,不重复单词为652538个。本文所 采用的语音识别方式为朗读式语音,利用贪婪算法来选 出4000条句子,将这些句子划分为l0组,每组中包含有 400个句子,由100名发音人构建语音语料库,利用智能 手机对语音进行录制,设定采样单位为16b i t,采样频率 为16kHz,总语音时长为100h,其中训练集时长为90h, 测试集为10h。 4.2困惑度验证 利用困惑度来衡量语言模型,根据各个音节中的困惑 度来替代单词数,为了使单词N—gram模型与音节N-gram 模型能够进行比较,需要对音节困惑度进行计算。在实验 中将4000句朗读文本当作测试集,在该测试集包括 46244个单词,并对上述两种N—gram语言模型的覆盖值 进行计算,其实验结果为单词N—gram语言模型的单位数 量为60000个,单节N—gram语言模型的单位数量为32782 个,集外词所占比例分别为19.8%与0.03%,命中率分别 为19.4%与98.4%,困惑值分别为4600与64600。从上述 实验结果了解到,音节N—gram语言模型能够对测试数据 集进行更好的覆盖,不过其困惑度和英语150之间的结果 相比较也是比较高的,这是因为哈萨克语所具备的黏着性 特性所产生的。比如,对于一个哈萨克语单词来说,其连 接构词与构型附加成分能够产生几种甚至几十种不同的变 体,依据实验数据表明,单词N—gram模型在困惑值上则 明显较低,这是因为该语言模型并没有对集外词进行考虑, 而且在该模型中的集外词所占比例将近20%,如果该模型 对集外词问题进行考虑,则其困惑度必然会大幅增涨。 4.3连续语音识别效果验证 将上文中所构建的单词N—gram语言模型与音节 N—gram语言模型在连续语音识别效果方面进行验证,利 用上述两种N—gram语言模型对哈萨克语中的34个音素进 行建模,在声学模型构建中则采用上下文结构的隐马尔科 夫模型,模型中的特征向量则采用维数为39的梅尔频率 倒谱系数,该系数共包括12阶倒谱系数,依据哈萨克语 的发音特点,将各个音素设置为5个输出状态,而静音模 型中则设置3个输出状态,在各个状态中包含了16个高 斯混合模型,同时利用HTK工具对声学模型进行训练,训 练结果表明,单词N~gram语言模型的连续语音错误识别 信息记录材料2 01 8年9月第1 9卷第9期 医疗信息系统中I CU重症监护分系统 丁 淼 (江苏省常州市武进人民医院信息科 江苏 常州 2 1 3 0 0 2) 【摘要】目的:探究ICU重症监护分系统的临床应用效果。方法:本次研究随机抽取我院2017年7月--2018年1 月收治的48例ICU重症监护患者作为研究样本,将本院ICU重症监护病房的24名护理人员作为观察对象,分析ICU重 症监护分系统应用前后的护理质量评分以及护理人员满意度情况.结果:应用ICU重症监护分系统后的护理质量评分显 著高于应用前,且应用Icu重症监护分系统后,护理人员的满意度显著升高。结论:应加强ICU重症监护分系统在护理 重症患者过程中的应用,提升患者的护理文书书写质量,增强数据采集的准确性,降低护理的整体成本,为护理人员更 加高效地工作提供方便。 【关键词】ICU重症监护分系统;护理文书;数据采集 【中图分类号】R197 【文献标识码l A 【文章编号】1009—5624(2018)09—0099—03 1引言 均具备护士执业资格证书,年龄区间为23~36岁,工作 随着医疗信息技术的不断发展和完善,加快医院医疗 年限在3~22年不等,其中,主管护师4人,护师8人, 信息系统的建设步伐成为一种必然选择。现阶段,各大医 普通护理人员12人。本次研究采取三班倒的护理模式, 院已经将完善医疗信息系统建设作为医院发展的重点,为 早班和午班各8名护理人员,晚班护理人员为8名。早班 了实现对护理质量的全面提升,促进护理过程的信息化管 和午班的护理人员每人负责护理3例患者,晚班护理人 理成为重要前提。I CU重症患者具有病情复杂、发展迅速 员每人需要负责6例患者。随机选取ICU重症监护分系统 和致死率高的特点,需要众多监护仪器同时使用才能够实 应用前的i00份护理文书和ICU重症监护分系统应用后的 现对患者病情变化情况的实时监测。如何实现对众多监护 i00例文书,探究护理文书的书写质量。 信息的有效管理,也成为困扰ICU病房医护人员的一大难 2.2方法 题。基于此,本次研究探究了ICU重症监护分系统的临床 2.2.1 ICU重症监护分系统的应用方法 将重症监护 应用效果,现阐述如下。 记录作为参考依据,建立ICU重症监护电子表格的模板, 2一般资料与方法 将ICU重症监护患者的各项生命体征如体温、尿量、引流 2.1一般资料 液、胃液等数据输入系统,实现对不同时间段内各项信息 本次研究随机抽取我院2017年7月一20l8年1月收 的自动显示,并自动生成体温变化、心率变化以及呼吸变 治的48例ICU重症监护患者作为研究样本,将本院ICU 化情况示意图。同时,利用数据采集模块实现对重症患者 重症监护病房的24名护理人员作为观察对象,护理人员 基本信息的实时记录,依据对患者基本信息的分析,制定 率为29.45%,而音节N—gram语言模型的连续语音错误识 应用,2016,52(24):i78-I8I. 别率则为32.78%,由此说明,音节N—gram语言模型在连 [2】热木土拉·麦麦提,古丽尼尕尔·买合木提,努尔波拉提 续语音识别方面有着更好的表现,而音节N-gram语言模 ·胡安,艾斯卡尔·艾木都拉.基于规则及N-gram模型的数字 型虽然能够构造很大的词汇表,但在词与词间的相关性及 数据转换成哈萨克语读音文字的方法[J].电脑知识与技术, 语义方面则较为缺失。 2017,13(14):I58-159+168. 5结语 【3】吾兰·努鲁别克,热木土拉·麦麦提,艾斯卡尔·艾木都拉.基 本文通过对N—gram模型在哈萨克语语音识别与处 于N-g r am模型的哈萨克词干提取方法[J].电脑知识与技术, 理技术进行深入的研究,以此构建了相应的单词与音节 2017,13(12):160—162. N-gram模型,通过对这两个模型在困惑度与连续语音识 【4】孙瑞娜,古丽拉·阿东别克.基于规则的哈萨克语基本名 别中的应用效果进行验证分析,以此探讨,N—gram模型 词短语识别研究【j】.计算机应用研究,2010,27(12):4511— 在哈萨克语语音识别与处理中的应用。虽然实验结果并不 451 3+4516. 是太理想,但这也说明N—gram模型在哈萨克语连续语音 识别中有着一定的辅助作用,能够为后续相关语音识别软 基金项目:伊犁师范学院科研基金2013年度一般项目: 哈萨 件的开发带来一定的启发。 克语音识别与处理技术研究)),课题编号:201 3YSYB20,项目负 责人:孙晓杰 【参考文献】 作者简介:孙晓杰(1976一),男汉族山东平度人伊犁师范学院 …I迭吾勒·阿布都哈依尔,努尔买买提·尤鲁瓦斯,刘艳.面 工学硕士,讲师,从事计算机教育,嵌入式系统开发,物联网 向哈萨克语LVCSR的语言模型构建方法研究【J】.计算机工程与 系统研究。 99 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- huatuo9.cn 版权所有 赣ICP备2023008801号-1

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务