要说语音数据库,冯子默第一个想到的却不是飞音集团,尽管飞音集团所研发的语音输入早已进入市场多年,不仅有着不少忠实拥趸,更是有着数量众多的语音输入用户,势必收录有数量庞大且丰富的语音样本。
不过,飞音语音虽然支持普通话以及数十种方言,但是对于口音问题和第二类方言,飞音输入法自身都不能识别,自然也就没人会在使用飞音输入法的时候说不能被识别的方言。
因此,在这一类型的乡音、方言的语音标本,飞音集团应该也是寥寥。
真正被冯子默第一个想到拥有这种资源的公司则是国内社交领域的绝对霸主迅腾,该公司旗下的和微书信两款应用软件占据了社交领域绝大部分份额,可谓是无孔不入,装机量更是遥遥领先。
冯子默具体看中的正是具有发送语音消息功能的微书信,微书信作为社交领域的两座高峰之一,几乎成为了一款装机必备软件。
坐拥数以亿计的庞大用户群,微书信自是通过语音消息功能收录有近乎国内所有语种、口音的语音标本,而且数据量极为丰富。
至于社交领域的另一座高峰,虽然也有相同的功能,但是冯子默认为微书信的语音消息的使用频率应该高于。
而且,更重要的是,冯子默认为使用微书信语音消息的人群分布的更为广泛,更具有普遍代表『性』。
当然,作为语音标本数据库,论语音标本的丰富程度,还有好几家公司可以与迅腾公司相媲美,比如移不动、联不通,电不信这三大通讯运营商。
虽然这三家公司不会对所有电话进行录音,但是如果他们想获取语音标本,那完全是不费吹灰之力,而且可以做到精准录音,各种语音标本自是可以做到应有尽有。
不过这三家公司好歹都是国企,节『操』在一定程度上还是有的,况且大瑞宪法第四十条明确规定:大瑞公民的通信和通信秘密受法律的保护。
冯子默相信,以这三家公司的高傲,绝不会弯下身段与自己搞合作,更是不会铤而走险冒着违法的风险,给自己提供语音标本。
是以,冯子默将最理想的合作对象定为迅腾公司,虽然在一定意义上来说,微书信中的用户语音信息应该也是受到法律保护,哪怕是迅腾公司自己也不能轻易查看。
但是冯子默相信,办法总比困难多,只要付出足够的利益,肯定会有办法的。
其实在冯子默看来,哪怕近乎可以听懂所有语音的进阶版语音输入法也就勉强达到行业领先标准,仍谈不上智能,更不能说完美。
所谓智能,在冯子默的构想中,至少要善解人意,并且可以在复杂的环境中准确无误的听懂用户说的每一句话、每一个词、甚至每一个字。
这就要求智能语音的识别不能局限于听到的这一截语音,如果仅是单截语音,尤其是同音词汇,甚至同音字,那完全没法分辨,智能语音必须要有联系上文和语境进行推理的能力。
同时,智能程序还需要进行进一步的特异『性』深度学习,学习的对象不再是宽泛的语音标本,而是要具体到用户,在用户使用智能语音的过程中,智能语音就同步进行记忆和学习。
随着用户语音使用时长的累计,智能语音的学习程度也随之逐渐深入,进而对用户的语言习惯和发音方式进行透彻的解析和模拟,最终达到和用户自身分辨能力相当的地步。
也就是说,智能语音要做到用户一句话说出口,只要用户自己能听明白在说什么,智能语音都可以做出完全一致的识别。
可以说,到了这种程度的语音输入法,虽然不能说比用户自己更懂用户,但绝对可以说是比用户以外的任何人都要懂用户说的话。
也只有达到这种境界的软件,才被冯子默认为可以称得上智能。
不过,哪怕到达这种境界,依然不是冯子默所想的那种完美状态。
冯子默构想的完美状态智能语音输入法应该具有比用户更懂用户的能力。
也就是用户一句话说出口,有时可能会出现口误或者其他表述不清或不当的情形,这个时候智能语音输入法可以在保留用户原意的基础上,根据用户的日常用语习惯进行自动纠错和调整。
不过冯子默深知,哪怕他将智能语音输入法编写出来,想进化到完美形态也是需要一个漫长的过程,当然这些都是后话。
却说冯子默在完成了对智能语音输入法的整体构思和预期设定后,就开始埋头编起了这款在未来具有统治地位的语音智能输入法,