语音数据包微信对语音输入的升级是否在收集大量训练数据?-创新互联

微信对语音输入的升级是否在收集大量训练数据?这是毫无疑问的。事实上,语音识别的算法近年来并没有得到很大的更新,最重要的是依靠大量的数据,通过大量的数据来训练模型的准确性,这就是所谓的数据驱动方法。语音数据包 微信对语音输入的升级
是否在收集大量训练数据?

语音识别在其早期发展中有两个方向。一个方向是根据语法和语义进行识别,但这种方法长期以来没有取得突破。第二个方向是让计算机学习大量的数据,然后通过大量的数据来训练模型的准确性。这一方向在互联网时代,已经取得了长足的进步,并逐渐取得了主导地位。毫不夸张地说,当算法之间的差异不大时,数据量越大,精度就越好。微信此举显然正是出于这一考虑。

创新互联云计算的互联网服务提供商,拥有超过13年的服务器租用、四川绵阳服务器托管、云服务器、网页空间、网站系统开发经验,已先后获得国家工业和信息化部颁发的互联网数据中心业务许可证。专业提供云主机、网页空间、域名注册、VPS主机、云服务器、香港云服务器、免备案服务器等。用同一数据集训练神经网络,每次训练结果不一样,有时正确率很高,有时很低,为什么?

其实这个问题的实质是,如果我们用机器学习算法对数据集上的数据模型进行一次训练,保存模型,然后用同样的算法和同样的数据集以及数据排序对其进行再次训练,那么第一个模型和第二个模型是一样的吗?

这可能是因为神经网络用增益或权重的随机值初始化,然后每个模拟在训练阶段有不同的起点。如果您希望始终保持相同的初始权重,可以尝试为初始权重修复种子以消除问题。

如果我们深入研究这个问题,我们可以根据ml算法的“确定性”来对其进行分类。当从同一个数据集进行训练时:

一个是总是生成相同的模型,并且记录以相同的顺序呈现;

另一个是总是生成不同的模型,并且记录顺序不同。

在实践中,大多数是“不确定的”。模型变化的原因可能是机器学习算法本身存在随机游走、不同权值的随机初始化、不同分量的概率分布抽样来分配优化函数。

虽然模型的“不确定性”可能会对单个训练结果造成干扰,但我们也可以用“不确定性”来确认模型的稳定性,如决策树、支持向量机(SVM)、神经网络等,最终可以通过多次迭代来确认模型的稳定性。

是否存在通用的神经网络模型,可以处理图像,语音以及NLP?

对于目前的深度学习模型,虽然深度学习的目标之一是设计能够处理各种任务的算法,但是深度学习的应用还需要一定的专业化,目前还没有通用的神经网络处理模型。然而,每一种模式也在相互学习、相互融合、共同提高。例如,一些创新可以同时改进卷积神经网络和递归神经网络,如批量标准化和关注度。一般模型需要在将来提出。

图像和视频处理,计算机视觉,最流行的是CNN,卷积神经网络,它的变形和发展,CNN适合处理空间数据,广泛应用于计算机视觉领域。例如,alexnet、vggnet、googlenet、RESNET等都有自己的特点。将上述模型应用于图像分类识别中。在图像分割、目标检测等方面,提出了更有针对性的模型,并得到了广泛的应用。

语音处理,2012年之前,最先进的语音识别系统是隐马尔可夫模型(HMM)和高斯混合模型(GMM)的结合。目前最流行的是深度学习RNN递归神经网络,其长、短期记忆网络LSTM、Gru、双向RNN、层次RNN等。

除了传统的自然语言处理方法外,目前的自然语言处理深度学习模型也经历了几个发展阶段,如基于CNN的模型、基于RNN的模型、基于注意的模型、基于变压器的模型等。不同的任务场景有不同的模型和策略来解决一些问题。


本文名称:语音数据包微信对语音输入的升级是否在收集大量训练数据?-创新互联
标题URL:http://azwzsj.com/article/gijcj.html