笔下文学 > 暴改全世界 > 第158章 智能语音输入法

第158章 智能语音输入法

第158章 智能语音输入法

牛雨离开之后,冯子默可以说已经完成了此次来帝都的所有任务。

原本冯子默打算着在事情办完之后在帝都游览一番,不过现在冯子默却是改变了主意,因为有了新的计划要完成。

至于新的计划,自然是关于翻译软件的神助攻了。

而被冯子默视为神助攻的,则是足以与超级语言互译相媲美的另一样法宝“智能语音输入法”。

现在市面上做的最好,应用最为广泛的语音输入法当数飞音语音输入法,飞音语音在长句语音识别方面做的相当不错,只要环境不是特别嘈杂,飞音语音可以通过结合上下文的语境方式,基本做到将大段的语音完全识别出来,准确率相当高。

不过冯子默认为,还不够好,尤其是在短词汇方面,比如人名、术语、同音词组等方面飞音语音都表现的不尽人意,而且在嘈杂环境的表现更是一场灾难!

冯子默想象中的语音输入法应该更加智能,分辨更加精准,抗干扰能力更加强大,足以同人耳媲美,甚至比人耳具有更强分辨力的软件。

简单来说,就是一种具有真正智能,可以在使用过程中根据用户的使用习惯不断进行调整和深度学习,最终达到完美识别用户语音的境界。

对于准备打造的这款智能语音输入法的核心智能模块,冯子默可以说是胸有成竹,毕竟有着之前版本的经验以及在扶桑开发的那款车辆应急系统都用到了类似的智能模块。

唯一让冯子默有些头痛的是对千差万别的用户群语音数据的收集和识别。

毕竟冯子默主打的是智能识别,但是哪怕再智能,也是需要进行深度的语言学习。

普通话,作为全国推广的官方语言自是需要首先被攻克的,不过普通话对冯子默想要打造的智能识别系统来说,恰恰最没有难度。

毕竟普通话有着规范且健全的发音准则,只要这些准则都深度学习一遍,就可以在相当程度上对普通话进行精准识别。

然后就是各地方言,在初步评估中,冯子默将方言分为两类,一类是粤语、闽南语这种总结出了类似于普通话那种成体系的发音规则,并且有一套所谓正宗发音原则的方言。

另一类则是只有语言的使用者可以意会,却是不能言传他人的方言。

对于第一类方言,倒是可以和普通话同样对待。

但是第二类方言就不能如此省事儿了。

能听懂普通话和第一类方言,是冯子默对智能语音识别系统的最基本要求。

在此基础上,冯子默将对第二类方言的识别与带有地方口音的普通话或者第一类方言的识别作为智能语音识别系统的需要具备的进阶版能力。

毕竟听的懂标准版的普通话乃至特色方言都没什么大不了,能听懂带有地方口音甚至个人口音的普通话以及特色方言才算牛。

冯子默之前就听过一个段子:说一位南闽籍的老板将一位员工叫到办公室,让他帮你买仙人掌,还特意交代要“黄糊色”。

员工当时就懵了,心中更是嘀咕着:黄糊色是的什么颜色,没见过仙人掌有黄糊色的啊!

老板看着一脸懵然的员工,又特意指着电脑桌面图案中高悬的太阳再次强调道:黄糊色、黄糊色!

员工晕晕乎乎的走出老板办公室,满面愁容,口中还一直念叨着“黄糊色”。

恰在此时,一位南闽籍同事问这位员工发生了何时,员工将事情完整的讲述了一遍,还一本正经的问同事,黄糊色到底是什么颜色。

这位南闽籍的同事却是哈哈大笑道:不是黄糊色,是防!辐!射!

段子虽然是段子,但冯子默深知这个段子反应的却是客观现状,不仅南闽群众“”、“”不分,自己作为千湖省的一员,哪怕在国家普通话考核中拿到了二级甲等的证书,同样经常在不经意间在发音上弄混“”与“”,至于像“灰化肥会挥发”这种简短的绕口令更是从来没有清晰、快速、正确的念出来过。

而诸如此类的口音迁移问题在各种版本的普通话和方言中数不胜数。

因此,想要具备分辨不同口音和不成体系的方言这种能力,冯子默能想到的唯一办法就是深入到群众中去学,向使用这种语言的人群去学。

第158章 智能语音输入法

当然,不是冯子默自己去学习,而是让准备打造的这款智能语音识别系统去学习。

至于智能语音识别系统如何到群众中去学习地道的当地语言,自然只能靠语音数据库了。

要说语音数据库,冯子默第一个想到的却不是飞音集团,尽管飞音集团所研发的语音输入早已进入市场多年,不仅有着不少忠实拥趸,更是有着数量众多的语音输入用户,势必收录有数量庞大且丰富的语音样本。

不过,飞音语音虽然支持普通话以及数十种方言,但是对于口音问题和第二类方言,飞音输入法自身都不能识别,自然也就没人会在使用飞音输入法的时候说不能被识别的方言。

因此,在这一类型的乡音、方言的语音标本,飞音集团应该也是寥寥。

真正被冯子默第一个想到拥有这种资源的公司则是国内社交领域的绝对霸主迅腾,该公司旗下的和微书信两款应用软件占据了社交领域绝大部分份额,可谓是无孔不入,装机量更是遥遥领先。

冯子默具体看中的正是具有发送语音消息功能的微书信,微书信作为社交领域的两座高峰之一,几乎成为了一款装机必备软件。

坐拥数以亿计的庞大用户群,微书信自是通过语音消息功能收录有近乎国内所有语种、口音的语音标本,而且数据量极为丰富。

至于社交领域的另一座高峰,虽然也有相同的功能,但是冯子默认为微书信的语音消息的使用频率应该高于。

而且,更重要的是,冯子默认为使用微书信语音消息的人群分布的更为广泛,更具有普遍代表性。

当然,作为语音标本数据库,论语音标本的丰富程度,还有好几家公司可以与迅腾公司相媲美,比如移不动、联不通,电不信这三大通讯运营商。

虽然这三家公司不会对所有电话进行录音,但是如果他们想获取语音标本,那完全是不费吹灰之力,而且可以做到精准录音,各种语音标本自是可以做到应有尽有。

不过这三家公司好歹都是国企,节操在一定程度上还是有的,况且大瑞宪法第四十条明确规定:大瑞公民的通信和通信秘密受法律的保护。

冯子默相信,以这三家公司的高傲,绝不会弯下身段与自己搞合作,更是不会铤而走险冒着违法的风险,给自己提供语音标本。

是以,冯子默将最理想的合作对象定为迅腾公司,虽然在一定意义上来说,微书信中的用户语音信息应该也是受到法律保护,哪怕是迅腾公司自己也不能轻易查看。

但是冯子默相信,办法总比困难多,只要付出足够的利益,肯定会有办法的。

其实在冯子默看来,哪怕近乎可以听懂所有语音的进阶版语音输入法也就勉强达到行业领先标准,仍谈不上智能,更不能说完美。

所谓智能,在冯子默的构想中,至少要善解人意,并且可以在复杂的环境中准确无误的听懂用户说的每一句话、每一个词、甚至每一个字。

这就要求智能语音的识别不能局限于听到的这一截语音,如果仅是单截语音,尤其是同音词汇,甚至同音字,那完全没法分辨,智能语音必须要有联系上文和语境进行推理的能力。

同时,智能程序还需要进行进一步的特异性深度学习,学习的对象不再是宽泛的语音标本,而是要具体到用户,在用户使用智能语音的过程中,智能语音就同步进行记忆和学习。

随着用户语音使用时长的累计,智能语音的学习程度也随之逐渐深入,进而对用户的语言习惯和发音方式进行透彻的解析和模拟,最终达到和用户自身分辨能力相当的地步。

也就是说,智能语音要做到用户一句话说出口,只要用户自己能听明白在说什么,智能语音都可以做出完全一致的识别。

可以说,到了这种程度的语音输入法,虽然不能说比用户自己更懂用户,但绝对可以说是比用户以外的任何人都要懂用户说的话。

也只有达到这种境界的软件,才被冯子默认为可以称得上智能。

不过,哪怕到达这种境界,依然不是冯子默所想的那种完美状态。

冯子默构想的完美状态智能语音输入法应该具有比用户更懂用户的能力。

也就是用户一句话说出口,有时可能会出现口误或者其他表述不清或不当的情形,这个时候智能语音输入法可以在保留用户原意的基础上,根据用户的日常用语习惯进行自动纠错和调整。

不过冯子默深知,哪怕他将智能语音输入法编写出来,想进化到完美形态也是需要一个漫长的过程,当然这些都是后话。

却说冯子默在完成了对智能语音输入法的整体构思和预期设定后,就开始埋头编起了这款在未来具有统治地位的语音智能输入法,

 

(https://www.xbxxs.com/novel/McbK64A8JAL.html)


  请记住本书首发域名:www.xbxxs.com。笔下文学手机版阅读网址:https://m.xbxxs.com/