算法与算力在智能语音系统中的应用

人工智能的“智”与“能”

人工智能核心技术就是算法与算力,即“智”与“能”。算法决定了人工智能的智力高低,它是未来智力高低的关键;算力即运算速度、计算能力,它决定了AI处理数据能力大小。算法与算力结合起来决定了AI的智能水平,并且应用到各行各业。现在热门的大数据、人工智能、区块链、视觉渲染、医学影像、图像识别、视频点播、气象生成等等,都是通过强大的算法与算力相结合,这些科技的改变,给我们的生活带来翻天覆地的变化。

1

算力与算法

算力,就是计算的能力。算力的大小代表着对数字化信息处理能力的强弱。算法,就是计算的方法和规则。线性回归算法、逻辑回归算法、决策树算法、朴素贝叶斯算法、支持向量机算法(SVM)、K- 最近邻算法(KNN)、K- 均值算法、随机森林算法、降维算法、人工神经网络算法(ANN)等,当前最具代表性的,目前的人工智能算法有人工神经网络遗传算法、模拟退火算法、群集智能蚁群算法和例子群算等等。

算力越强、算法越优,人工智能就越牛。在快速发展的“算力时代”,算力和算法已成为推进经济社会数字化转型和产业变革的最大变量,是衡量数字发展水平和科技实力的重要标志。

算法与算力在智能外呼应用

智能外呼系统的工作原理

智能外呼机器人是人工智能在语音识别方面的典型应用,他能够自动发起外呼,以语音合成的自然人声形式,主动与客户实现交互。在外呼期间,他可以利用语音识别和自然语言处理技术,而后采用针对性话术与用户实现多轮交互会话。最后对客户进行分类、并自动记录每通电话的关键点,以完成外呼工作。

在这个过程中,首先通过ASR自动语音识别技术,将人的语音转化为文本,再通过NLP自然语言处理技术,把人的自然语言转化为计算机可以阅读的指令,最后通过TTS语音合成技术,将文本转化为自然语言,实现精准对话。

2

算法在语音识别中的应用

第一种:基于动态时间规整(Dynamic Time Warping)的算法,在连续语音识别中仍然是主流方法。该方法的运算量较大,但技术上较简单,识别正确率高。在小词汇量、孤立字(词)识别系统中,也已有许多改进的DTW算法被提出。例如,利用频率尺度的DTW算法进行孤立字(词)识别的方法。

第二种:基于参数模型的隐马尔可夫模型(HMM)的方法,该算法主要用于大词汇量的语音识别系统,它需要较多的模型训练数据,较长的训练和识别时间,而且还需要较大的内存空间。一般连续隐马尔可夫模型要比离散隐马尔可夫模型计算量大,但识别率要高。

第三种:基于非参数模型的矢量量化(VQ)的方法,该方法所需的模型训练数据,训练和识别时间,工作存储空间都很小。但是VQ算法对于大词汇量语音识别的识别性能不如HMM好。在孤立字(词)语音识别系统中得到了很好的应用。

另外,还有基于人工神经网络(ANN)的算法和混合算法,如ANN/HMM法,FSVQ/HMM法等。

3

算力在外呼系统中的应用

在智能语音机器人系统中,算力是以高性能计算系统通过综合采集、识别、处理分析各种语音数据,最终算出识别结果的过程。它是对数据的处理能力,存在于手机、笔记本、超级计算机等各种智能硬件设备。设备的算力水平越高意味着对数字化信息处理能力越强。

人工智能的趋势

随着人工智能行业的不断发展,机器深度学习技术取得了快速提高。数据,尤其是大数据和算法、算力的融合,现在正成为人工智能行业的发展主要方向,特别是机器学习等方面,在AI与应用结合的趋势下,带动产业数字化经济快速发展。