咨询:029-85396651

详细内容

CONTENT

语音交互将成为物联网时代最流行也是最普遍的交互方式

浏览次数:951次    发布时间:2017-02-24

  根据VoiceLabs发布的《2017年语音报告》(The 2017 Voice Report)。报告对亚马逊Alexa和谷歌Google Home的开发者和消费者进行了调查,总结了目前的智能语音市场,并对2017年的趋势做出预测。2017年,语音产业结构将按照硬件产品、AI软件、语音应用Apps、生态系统服务相结合的架构继续向前发展。预计2450万台以语音为主要交互方式的智能硬件产品发货,市场总量将达到3300万台,市场规模超过200亿美元。而对各种智能语音助手以及语音交互app而言,竞争将更加激烈。


  目前,在语音交互相关的领域已经出现了一批玩家和产品,国外的有Google Now、微软的Cortana(小娜)、Facebook的Message Platform、苹果的Siri、亚马逊的Echo、Google Home的智能音箱,国内的科大讯飞、百度的智能机器人(度秘)、搜狗语音、微信的语音功能等,虽然这么多大牌玩家进入语音交互的领域,但由于技术和社会环境的限制,语音交互还处在起步阶段,相关的语音交互技术还无法支持大规模的应用和推广。
 
  要想让语音交互流行起来,必须合理解决以下几点客观的限制:
 
  1、语音识别技术还处于起步阶段。
 
  语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。语音识别的研究工作可以追溯到20世纪50年代AT&T贝尔实验室的Audrey系统,它是第一个可以识别十个英文数字的语音识别系统。并且一些行业巨头也都是在2010年左右才开始加大对语音技术的投入。各大巨头各自为战,语音识别领域里面还没有形成统一的行业标准和应用生态。
 
  2、使用场景有限。
 
  语音识别技术对环境要求苛刻;在识别的准确率上受较多因素的影响,比如背景噪音、口音、语速、特定领域的专有名词等都影响准确率。有一项这样的测试,有人随机截取了几段网络课程用主流的云端引擎测试识别准确度,基本上准确率在70%左右;然后又截取了一段新闻联播的音频,用同样的云端引擎做测试,准确率达到了95%左右。由这个测试我们可以清楚的看到客观因素对语音识别准确率的影响,要知道在这个行业5%的准确率就是可以引起行业变革的。目前的技术先限制导致语音交互体验的机器感特别强,缺乏人性化的感知,没有人喜欢跟呆板的机器一直做交流的。
 
  3、语音交互是非可视化的,非常消耗用户的注意力,增加记忆负担。
 
  人在与系统做交互的时候,能记住的信息也就10秒左右。举一个常用的场景,有时候打银行的客服电话,你必须集中精力听语音播报,一旦被打断就又得从头听一遍。
 
  4、用户习惯还未完全养成。
 
  没有人愿意对着冰冷的机器说话,然后得到毫无感情的甚至是错误的回应。用户对语音交互对象的要求不但是可以听懂,还应该能人性化的给以回应,人类更期望通过语音达到人人交互的感受,而不是人机交互,这也是为什么语音交互的普及很大程度上依赖于人工智能技术的发展。
 
  语音交互将成为物联网时代最流行也是最普遍的交互方式


(来源:微信号:agoodesign)

QQ在线客服

咨询热线

  • 02985396651