语音识别技术应用于现有三维绘图软件的探索

语音识别技术应用于现有三维绘图软件的探索邝展鹏摘要:随着人工智能技术不断取得突破,人机交互的模式逐渐从传统的鼠标键盘交互和触屏交互向自然交互发展。在这种大环境下,为了提高现有三维绘图软件的工作效率,提出了一种利用开放平台的语音识别技术辅助绘图的方法。在保留三维绘图软件原有的鼠标键盘操作模式下,增加了语音指令辅助设计的方式。关键词:语音识别;语音绘图;智能语音:TP311文献标志码:A:2095-2945(2019)12-0168-021概述随着语音识别技术和自然语言处理技术的发展,科大讯飞、云知声和百度智能等开放平台日趋成熟,这为当前开发应用级别的语音辅助系统提供了良好的技术支持。无论是在移动智能手机上的语音助手,还是风靡各个家庭的智能音箱,都代表着语言交互这一种我们日常生活中使用最广泛也是最重要的交互方式融入到人机交互中是不可避免的趋势。Solidworks是一款专门用于工程制图的三维绘图软件,在国内广泛应用于机械设计与评估。其内置应用程序编程接口(API),便于开发者进行二次开发。百度智能语音平台为开发者提供的软件开发工具包(SDK)具有强大且完善的功能,包括语音识别、词法分析、语音合成等圈。这两者的结合让语音识别技术应用于现有的三维绘图软件,从而提高设计师的工作效率成为可能。2语音识别和语义理解语音识别技术是以人的语音信号为研究对象,能通过模式识别或深度学习的方法将语音信号转换成文字信息。目前国外的开源语音识别引擎(ASR)有CMUSphinx、HTK、Kaldi等,国内有讯飞语音、百度智能等开放平台提供语音识别服务。其中,国内的大型开放平台在中文语音识别的准确率已经达到了95%以上。然而语音识别技术只能将语音信息转换成文字,进行语音识别后获得的文本信息还需要让计算机理解后才能转化成具体的指令,从而执行相应的任务以满足我们的需要。语义理解是在自然语言处理(NLP)技术的基础上,针对文本信息中人的意图进行识别并让计算机理解的过程。首先需要使用NLP中的词法分析对文本信息进行处理。词法分析是一种能够对文本信息进行分词、词性识别和专名识别的技术,其处理过程如图1所示。进行词法分析后,计算机就可以对结果所得的词汇进行检索,并使用匹配模型匹配对应的用户意图。匹配模型包括一個唤醒关键字和数目不等的参数,例如“绘制圆柱”这个意图对应的匹配模型包括了唤醒关键字“绘制”、参数“圆柱”、还有圆柱对应的高度和直径尺寸。计算机只有获取到满足匹配模型的所有参数才能准确按照用户的意图进行操作。语义理解的结构如图2所示。3SolidWorks动作宏要实现语音控制绘图软件进行工作,就需要绘图软件能够通过除了鼠标键盘输入指令之外的方式进行绘图。SolidWorks自带宏工具,用户可以通过录制/编辑/执行宏提高工作效率。录制并保存的宏文件可以保存为C#、VB.NE3F等格式。因此,使用动作宏进行绘图是该绘图软件的第三种输入方式。由于宏文件使用了C#、VB等高级语言进行编辑和运行,因此可以通过读取XML等外部文件进行信息传递,从而根据外部指令控制绘图软件进行不同的操作,如图3所示。Solidworks的动作宏具有强大的功能,例如捕捉绘图空间中的焦点、调用任意绘图工具、移动窗口镜头等,完全能够满足开发者需求。因此宏文件的编写关键是对各个绘图工具的使用进行结构化设计,通过读取外部文件的信息得知满足用户的意图需要调用哪个绘图工具,以及具体的绘制参数是什么。4系统设计通过前文对于当前语音识别、语义理解技术的探索以及Solidworks软件本身研究,可知在理论上能够将语音识别技术运用于三维绘图软件的辅助绘制上。整个系统的结果框图如图4所示。用户可以通过原有的鼠标键盘使用绘图软件进行图形绘制,也可以通过麦克风使用语言进行指令输入。使用语音输入时,语音识别程序先将语音信号转化成计算机指令并保存在信息文件中,用户执行动作宏读取信息文件中的指令并执行,达到语音辅助制图的效果。5用户与系统的语音交互方式用户通过语音向系统发出指令以及系统回应用户的交互过程关乎到用户的使用体验。也就是说,系统需要知道用户什么时候开始说话,用户需要知道系统有没有听到自己说话。这样才...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

笔杆子文秘
机构认证
内容提供者

为您提供优质文档,供您参考!

确认删除?