科学网—阿西莫机器人新本领:能同时听3个人讲
时间:2017-12-07

  科学网 - 阿西莫机器人新技能:同时听三个人

  Asimo机器人可以同时听三个人

  据北京时间6月12日消息,据英国“新科学家”杂志报道,日前,日本的高端仿生机器人阿西莫(Asimo)拥有了一个全新的强大功能,可以同时听三个人讲话。

  目前,Asimo有能力同时判断三个人的声音,并期望识别相应的识别软件来处理更多的语音量和复杂的句子。 Asimo的这一新功能得益于由京都大学奥野博士和本田研究院的Nakadai开发的新设计的HARK软件。

  HARK软件使用八个置换麦克风来计算每个声音的来源,并隔离来自其他声源的声音。这八个麦克风的作用就像机器人的耳朵一样,能够可靠地计算提取的单个声源,然后通过语音识别软件进行解码。 Hiroshi Okuno告诉“新科学家”,HARK软件系统的分辨率比正常的听力要高得多,它可以同时听到几个声音,而不是专注于一个独特的声音源。当从复杂的语音环境中提取单一声源时称为鸡尾酒效应(Cocktail Effect),能够同时关注多个语音源,称为白马王子(Prince Charming)效应。他说根据日本传说,白马王子可以同时听十个请愿书。

  他们指出,虽然HARK软件不能同时区分10个语音来源,但它能同时解决3个讲话者中70-80%的语音。 Kazuhiro Nakadai说,分别将8个麦克风放在Asimo机器人的脸部和身体上,这将有助于Asimi准确地检测和隔离同时发出的声音。英国谢菲尔德大学的Gay Brown指出,尽管Asimo机器人主要基于语音处理组件,例如位于本地的麦克风以及使用自动化软件来阻止无法解释的录音,但他对这项研究仍然非常感兴趣。

  今年5月,奥野浩和Kazahhiro Nakadai在加州2008年IEEE机器人与自动化国际研讨会上介绍了最新的机器人功能。