初中人机对话评分原理.docx
评分原理计算机智能评分原理:过程:人工专家打分定标一提取采分特征一计算机算出采分特征权重一建立评分模型一应用正式评分;核心:通过人工智能技术把专家打分的标准量化,并且忠实无误、公平公正地执行专家的打分标准。(在语音评测中,影响机器评分的特征主要分为三类:语音的完整性;语音的音段质量;以及语法和语义的准确性;相对应在口语考试中,我们需要注音语音发音要到位、单词和句子要有重音和节奏、注意不要有过多的沉默卡顿、以及保证语法和语义表达的准确性。另外,会有很多人好奇机器是怎样来进行评分的?举例来说比如我们考察100O位学生对一段短文的朗读情况,在学生读完以后,会有部分同学的录音交由专家老师来进行人工评分。那在专家老师们打分的同时,机器会同步提取这些样本录音的音频特征,并参照专家老师给出的分数进行运算。然后通过对专家打分数据的分析,机器会找出了一个打分的规律、建立评分公式,并且进行反复的多样本验证,直到得出的分数跟专家老师的评分结果一致或误差可以忽略不计,才能确立最终的评分公式。所以,机器评分也是一个不断精准更新算法的过程,相对于人工评分来说,会更精确更客观。)不管是计算机评分还是人工评分,需要做到以下几个关键步骤:1、提取采分特征一段录音的评分过程实际上就是对多个特征进行打分的过程。影响评分的特征主要可分为三类:语音的完整性语音的音段质量语法和语义计算机智能评分系统是通过三种技术实现对评分特征的抽象提取,分别是:语音转文字技术、语音模型分析技术和深度神经网络技术。影响评分的特征主要可分为三类:语音的完整性;语音的音段质量;语法和语义。 通过语音转文字技术,实现语音完整性评测。 通过语音模型分析技术,实现对音段质量及韵律节奏的评测。 通过深度神经网络技术,实现对语法及语义的评测。通过语音转文字技术通过语音模型分析技术通过深度神经网络技术完整性特征音段质特征语法、语义特征通过以上三种技术,计算机智能评分系统就可将所有特征都提取出来。2、计算采分特征权重提取出所有的特征之后,再通过人工智能技术对专家打分数据进行分析,计算出每个特征权重。每次考试的成绩都会先抽取一部分样本录音,经过人工专家进行打分,人工专家会根据评分标准对每一段录音进行打分,但此时的评分标准实际上只是一些描述性的语句(如朗读短文满分标准为:能连贯地朗读,语音、语调正确,有节奏感、有感情)无法进行定量表达。而且,专家打分的过程是一个综合性思考的过程,专家自己也无法将所有特征都列举出来。这时候,只有通过人工智能技术,对专家打分的数据进行分析,才能把每个特征相对应的权重计算出来,从而建立该道题的评分模型一一我们可以简单理解为一个公式。通过人工智能技术对专家打分数据进行分析,算出每个特征权重:得分二满分* (单词*0.75+语调*0,25)举例:原文:Ilikedogs.(总分4分);录音专家打分特征提取评分公式录音1)4单词正确,语调正确4=4*(1*0.75+1*0.25)录音24)1单词错误,语调正确1=4*(0*0.75+1*0.25)录音3,)3单词正确,语调错误3=4*(1*0.75+0*0.25)录音40单词错误,语调错误0=4*(0*0.75+0*0.25)建立评分公式3、根据评分模型进行打分将建立好的评分模型输入到计算机智能评分系统中,该评分系统才可以真正运用于其他录音的评分。对于每一段新的录音,该评分系统都会根据建立好的评分模型提取出该段录音相应的特征,并且根据不同特征的相关权重进行打分。从而确保该评分系统的评分标准与专家的评分标准保持一致。总结:科大讯飞智能评分系统,是通过三种技术将所有语音特征提取出来,再通过大数据分析将专家打分的数据反算出所有特征相应的权重,建立一个评分模型,确保评分标准与专家完全一致,通过该评分模型就可以实现对其他录音的精准评分。通过了解计算机智能评分原理,我们可以对所有题型的采分点进行分析,便于老师和学生进行针对性备考。