亚洲工业智能制造领域专业门户网站 - 亚洲自动化与机器人网

 
當(dāng)前位置: 首頁(yè) » 行業(yè)資訊 » 機(jī)器人»機(jī)器人語(yǔ)言“天賦”嶄露頭角;
   

機(jī)器人語(yǔ)言“天賦”嶄露頭角;

 46.1K
     [點(diǎn)擊復(fù)制]
放大字體  縮小字體 發(fā)布日期:2016-10-09   瀏覽次數(shù):340
核心提示:智能機(jī)器人如何與人溝通?簡(jiǎn)單的指令輸入早已不能滿足這個(gè)快節(jié)奏的社會(huì),如果能夠語(yǔ)音操作該有多好。但是現(xiàn)在大部分智能機(jī)器人
       智能機(jī)器人如何與人溝通?簡(jiǎn)單的指令輸入早已不能滿足這個(gè)快節(jié)奏的社會(huì),如果能夠語(yǔ)音操作該有多好。但是現(xiàn)在大部分智能機(jī)器人對(duì)于語(yǔ)言的識(shí)別與回應(yīng)并不盡如人意,有些只能識(shí)別普通話,有些則只能進(jìn)行一對(duì)一回應(yīng),如果是多人聊天模式,或者是在嘈雜的背景下,智能機(jī)器人就會(huì)“暈頭轉(zhuǎn)向”,不知所云。
       想要解決這個(gè)問(wèn)題并不簡(jiǎn)單,不過(guò)近日,在美國(guó)舊金山舉行的第四屆國(guó)際多通道語(yǔ)音分離和識(shí)別大賽,中國(guó)參賽團(tuán)隊(duì)通過(guò)完成六麥克風(fēng)、雙麥克風(fēng)和單麥克風(fēng)場(chǎng)景下的語(yǔ)音分離和英文識(shí)別任務(wù),最終奪冠。而這個(gè)技術(shù)解決的最重要問(wèn)題,就包括在噪音環(huán)境下的語(yǔ)音識(shí)別。此次比賽的獲獎(jiǎng)團(tuán)隊(duì)來(lái)自科大訊飛,目前,他們已經(jīng)把這項(xiàng)技術(shù)應(yīng)用在了名為AIUI的人機(jī)交互解決方案上。
       與機(jī)器人對(duì)話
       語(yǔ)音識(shí)別技術(shù),小到手機(jī)指令大到智能家居控制都有所體現(xiàn),這讓生活變得更加便捷。但這并非語(yǔ)音識(shí)別的終極目標(biāo)。如果在噪音環(huán)境下,多個(gè)人給同一個(gè)智能機(jī)器人下了命令,那么后者應(yīng)該聽(tīng)誰(shuí)的,又應(yīng)該如何應(yīng)對(duì)呢?國(guó)際多通道語(yǔ)音分離和識(shí)別大賽比的就是如何解決這一類問(wèn)題。
       若想弄明白多通道語(yǔ)音,先明白語(yǔ)音識(shí)別的概念。首先,語(yǔ)音識(shí)別是指從語(yǔ)音到文本的轉(zhuǎn)換,也就是讓機(jī)器能夠聽(tīng)懂人說(shuō)的話。這其中包括兩層意思,一層是指把用戶所說(shuō)的話逐詞逐句轉(zhuǎn)換成文本;二是指正確理解語(yǔ)音中所包含的要求,作出正確的應(yīng)答。這其中語(yǔ)音語(yǔ)言學(xué)、信號(hào)處理、模式識(shí)別、概率論和信息論、發(fā)聲機(jī)理和聽(tīng)覺(jué)機(jī)理、人工智能的交叉學(xué)科,是中文信息處理領(lǐng)域的一項(xiàng)前沿技術(shù),解決的主要問(wèn)題就是如何將文字信息轉(zhuǎn)化為可聽(tīng)的聲音信息。
       智能機(jī)器人對(duì)于人的語(yǔ)音的處理,與人類自身理解完全不同,它們先將連續(xù)的句子分解為詞、音素等單位,在理解語(yǔ)義的規(guī)則基礎(chǔ)上讀取其中的含義。如果說(shuō)話的主體語(yǔ)音模糊或者口音較重時(shí),智能機(jī)器人若沒(méi)有設(shè)置過(guò)相關(guān)的規(guī)則,則無(wú)法識(shí)別。甚至一個(gè)人在認(rèn)真說(shuō)話與隨意說(shuō)話時(shí)的語(yǔ)調(diào)在智能機(jī)器人聽(tīng)起來(lái)都有區(qū)別。再加上采集聲音時(shí)周?chē)h(huán)境的噪聲等,都會(huì)對(duì)機(jī)器人產(chǎn)生干擾,進(jìn)而導(dǎo)致語(yǔ)音識(shí)別的誤差率增加。而多通道語(yǔ)音識(shí)別是指,通過(guò)多個(gè)麥克風(fēng)采集聲源,再用麥克風(fēng)陣列技術(shù)進(jìn)行降噪之后,語(yǔ)音識(shí)別將會(huì)更加精確。
 
       科大訊飛AIUI研發(fā)總監(jiān)趙艷軍在接受《中國(guó)科學(xué)報(bào)》記者采訪時(shí)介紹說(shuō),AIUI同時(shí)擁有的回聲消除、置信度判決、連續(xù)語(yǔ)音解密等技術(shù),人可以在任何時(shí)候?qū)C(jī)器進(jìn)行打斷發(fā)出需求,AIUI在遠(yuǎn)場(chǎng)識(shí)別方面支持3~5米的識(shí)別距離,識(shí)別率達(dá)到90%。“AIUI還支持方言識(shí)別,全雙工交互,以及自動(dòng)糾錯(cuò)的功能。同時(shí),用戶在和機(jī)器交流的時(shí)候發(fā)出的非相關(guān)語(yǔ)音,機(jī)器可以有效拒識(shí)。”趙艷軍說(shuō)。
 
       AIUI是目前世界上正在開(kāi)發(fā)的人機(jī)交互解決方案之一。作為未來(lái)智能機(jī)器人的主流配置之一,商業(yè)化的語(yǔ)音交互平臺(tái)也是不少I(mǎi)T巨頭的研發(fā)重點(diǎn)。比如微軟的Speech API,是微軟推出的包含語(yǔ)音識(shí)別(SR)和語(yǔ)音合成(SS)引擎的應(yīng)用編程接口(API),依托Windows平臺(tái),可以之和朗讀英文、中文、日文等。另外一個(gè)巨頭是IBM,它是較早開(kāi)始語(yǔ)音識(shí)別方面的研究的機(jī)構(gòu)之一,在1984年時(shí),IBM發(fā)布的語(yǔ)音識(shí)別系統(tǒng)在5000個(gè)詞匯量級(jí)上達(dá)到了95%的識(shí)別率。
 
       自然流暢的交互體驗(yàn)
 
       在之前公布的一段視頻中,幾個(gè)人給一個(gè)搭載了AIUI的機(jī)器人半成品下達(dá)不同的命令,先是搜索歌曲,再來(lái)問(wèn)天氣,然后讓訂機(jī)票,之后還有人要求機(jī)器人搜索一首歌手與歌名完全不符的歌曲。雖然只是半成品,但是視頻中的機(jī)器人不緊不慢地“接招”,還“毫不客氣”地指出歌名與歌手信息有誤,并善意地提醒是否要重新搜索。
 
      “準(zhǔn)確的反應(yīng)歸結(jié)于硬件與軟件的不斷更新。”趙艷軍回應(yīng)道。首先要克服的是交互環(huán)境的復(fù)雜性,比如用戶交互時(shí)各類的噪聲、多樣的口音、以及其他不可預(yù)知的干擾因素。其次,就是AIUI識(shí)別平臺(tái)中既長(zhǎng)又復(fù)雜的研發(fā)鏈路,從前端的麥克風(fēng)陣列技術(shù)到后端的語(yǔ)音喚醒、語(yǔ)義理解等服務(wù),需要各組的人員協(xié)調(diào)、配合、溝通、合作,“這對(duì)整個(gè)項(xiàng)目團(tuán)隊(duì)的要求是很高的。”
 
       硬件方面,AIUI 也從之前的4+1麥克風(fēng)陣列到最新的6+0麥克風(fēng)陣列,讓其聲源定位、回聲消除、噪聲抑制等能力不斷增強(qiáng),可以從容應(yīng)對(duì)各種復(fù)雜的環(huán)境。“后續(xù)我們將持續(xù)優(yōu)化和完善AIUI,進(jìn)一步提升效果。如提高遠(yuǎn)場(chǎng)識(shí)別的識(shí)別率,增加方言識(shí)別的自適性,提高語(yǔ)義理解的能力等,使得AIUI的體驗(yàn)越來(lái)越完美。”趙艷軍說(shuō)。
 
       智能生活更進(jìn)一步
 
      語(yǔ)音交互技術(shù)的進(jìn)步并不是孤立呈現(xiàn)的,它在智能機(jī)器人與人類溝通功能的提升中所做的貢獻(xiàn)功不可沒(méi)。這一貢獻(xiàn)體現(xiàn)在智能設(shè)備適用人群范圍擴(kuò)大以及領(lǐng)域拓寬。比如,隨著智能設(shè)備和網(wǎng)絡(luò)的普及,越來(lái)越多的老齡人群、低齡人群、身體殘障人群使用智能設(shè)備。對(duì)于這些人群,觸控的交互方式并不方便,語(yǔ)音交互則突破了年齡障礙。甚至,有人曾經(jīng)預(yù)測(cè),語(yǔ)音交互可能會(huì)成為繼搜索引擎、瀏覽器、智能手機(jī)OS之后,第四代的入口。
 
      同時(shí),依托云技術(shù)以及大數(shù)據(jù)的發(fā)展,智能語(yǔ)音技術(shù)的迭代和優(yōu)化速度也在加快。智能機(jī)器人、智能車(chē)載、智能家電等領(lǐng)域的多款產(chǎn)品都可以依托這一技術(shù)。
 
 
 
 
 
[ 行業(yè)資訊搜索 ]  [ 加入收藏 ]  [ 告訴好友 ]  [ 打印本文 ]  [ 關(guān)閉窗口 ]
 
 
展會(huì)更多+
視頻更多+
點(diǎn)擊排行
 
網(wǎng)站首頁(yè) | 網(wǎng)站地圖 | 排名推廣 | 廣告服務(wù) | 積分換禮 | 網(wǎng)站留言 | RSS訂閱
主站蜘蛛池模板: 花纹铝板,合金铝卷板,阴极铝板-济南恒诚铝业有限公司 | 工业rfid读写器_RFID工业读写器_工业rfid设备厂商-ANDEAWELL | 钛合金标准件-钛合金螺丝-钛管件-钛合金棒-钛合金板-钛合金锻件-宝鸡远航钛业有限公司 | 首页|光催化反应器_平行反应仪_光化学反应仪-北京普林塞斯科技有限公司 | 山西3A认证|太原AAA信用认证|投标AAA信用证书-山西AAA企业信用评级网 | 顺景erp系统_erp软件_erp软件系统_企业erp管理系统-广东顺景软件科技有限公司 | 定制/定做冲锋衣厂家/公司-订做/订制冲锋衣价格/费用-北京圣达信 | 青岛侦探_青岛侦探事务所_青岛劝退小三_青岛调查出轨取证公司_青岛婚外情取证-青岛探真调查事务所 | 标策网-专注公司商业知识服务、助力企业发展 | 专业生物有机肥造粒机,粉状有机肥生产线,槽式翻堆机厂家-郑州华之强重工科技有限公司 | 不锈钢反应釜,不锈钢反应釜厂家-价格-威海鑫泰化工机械有限公司 不干胶标签-不干胶贴纸-不干胶标签定制-不干胶标签印刷厂-弗雷曼纸业(苏州)有限公司 | 山东钢格板|栅格板生产厂家供应商-日照森亿钢格板有限公司 | 回转支承-转盘轴承-回转驱动生产厂家-洛阳隆达轴承有限公司 | 慢回弹测试仪-落球回弹测试仪-北京冠测精电仪器设备有限公司 | 土壤水分自动监测站-SM150便携式土壤水分仪-铭奥仪器 | 北京网站建设首页,做网站选【优站网】,专注北京网站建设,北京网站推广,天津网站建设,天津网站推广,小程序,手机APP的开发。 | 低压载波电能表-单相导轨式电能表-华邦电力科技股份有限公司-智能物联网综合管理平台 | 新疆乌鲁木齐网站建设-乌鲁木齐网站制作设计-新疆远璨网络 | X光检测仪_食品金属异物检测机_X射线检测设备_微现检测 | 干式变压器厂_干式变压器厂家_scb11/scb13/scb10/scb14/scb18干式变压器生产厂家-山东科锐变压器有限公司 | 沧州友城管业有限公司-内外涂塑钢管-大口径螺旋钢管-涂塑螺旋管-保温钢管生产厂家 | 东莞螺丝|东莞螺丝厂|东莞不锈钢螺丝|东莞组合螺丝|东莞精密螺丝厂家-东莞利浩五金专业紧固件厂家 | 甲级防雷检测仪-乙级防雷检测仪厂家-上海胜绪电气有限公司 | 龙门加工中心-数控龙门加工中心厂家价格-山东海特数控机床有限公司_龙门加工中心-数控龙门加工中心厂家价格-山东海特数控机床有限公司 | 油漆辅料厂家_阴阳脚线_艺术漆厂家_内外墙涂料施工_乳胶漆专用防霉腻子粉_轻质粉刷石膏-魔法涂涂 | 列管冷凝器,刮板蒸发器,外盘管反应釜厂家-无锡曼旺化工设备有限公司 | 耐磨陶瓷管道_除渣器厂家-淄博浩瀚陶瓷科技有限公司 | 齿辊分级破碎机,高低压压球机,立式双动力磨粉机-郑州长城冶金设备有限公司 | 合金耐磨锤头_破碎机锤头_郑州市德勤建材有限公司 | 珠光砂保温板-一体化保温板-有釉面发泡陶瓷保温板-杭州一体化建筑材料 | 手板_手板模型制作_cnc手板加工厂-东莞天泓 | 杭州实验室尾气处理_实验台_实验室家具_杭州秋叶实验设备有限公司 | 进口便携式天平,外校_十万分之一分析天平,奥豪斯工业台秤,V2000防水秤-重庆珂偌德科技有限公司(www.crdkj.com) | 杜康白酒加盟_杜康酒代理_杜康酒招商加盟官网_杜康酒厂加盟总代理—杜康酒神全国运营中心 | 福州仿石漆加盟_福建仿石漆厂家-外墙仿石漆加盟推荐铁壁金钢(福建)新材料科技有限公司有保障 | 液压油缸-液压站生产厂家-洛阳泰诺液压科技有限公司 | 盐水蒸发器,水洗盐设备,冷凝结晶切片机,转鼓切片机,絮凝剂加药系统-无锡瑞司恩机械有限公司 | 泵阀展|阀门展|水泵展|流体机械展 -2025上海国际泵管阀展览会flowtech china | 背压阀|减压器|不锈钢减压器|减压阀|卫生级背压阀|单向阀|背压阀厂家-上海沃原自控阀门有限公司 本安接线盒-本安电路用接线盒-本安分线盒-矿用电话接线盒-JHH生产厂家-宁波龙亿电子科技有限公司 | 中控室大屏幕-上海亿基自动化控制系统工程有限公司 | 球形钽粉_球形钨粉_纳米粉末_难熔金属粉末-广东银纳官网 |