亚洲工业智能制造领域专业门户网站 - 亚洲自动化与机器人网

 
當(dāng)前位置: 首頁 » 行業(yè)資訊 » 機(jī)器人»人工智能:讀書“破萬卷”,難答“小兒科”
   

人工智能:讀書“破萬卷”,難答“小兒科”

 46.1K
     [點擊復(fù)制]
放大字體  縮小字體 發(fā)布日期:2018-04-08   瀏覽次數(shù):777
核心提示:(從左至右)崔磊、韋福如、周明、楊南。微軟亞洲研討院天然說話盤算研討組供圖  瀏覽來自維基百科的536篇文章,答復(fù)10萬個基于文章內(nèi)容的成績,除題量年夜一點,這場競賽挺像年夜學(xué)英語六級測驗的瀏覽懂得測試。

人工智能:讀書“破萬卷”,難答“小兒科”
(從左至右)崔磊、韋福如、周明、楊南。微軟亞洲研討院天然說話盤算研討組供圖

  瀏覽來自維基百科的536篇文章,答復(fù)10萬個基于文章內(nèi)容的成績,除題量年夜一點,這場競賽挺像年夜學(xué)英語六級測驗的瀏覽懂得測試。

  但你弗成能聽到科場里奮筆疾書的“唰唰”聲,由于“參賽者”只是一段代碼。輸出文章和成績后,盤算機(jī)的中心處置器(CPU)和圖形處置器(GPU)開端高速盤算,最初交出答卷,由出題者批閱。

  對來自世界列國的研討者來講,這是一場沒有止境的比賽——任何人可以在隨意率性時光參加,排行榜及時更新;即便是第一位,不堅持“進(jìn)修”和“更新”,隨時有能夠被新參加者超出。它能夠產(chǎn)生在你吃飯和睡覺的時刻,而“敵手”不外是“啪啪啪”地敲擊了一串代碼。

  這場比賽全稱SQuAD(Stanford Question Answering Dataset)文本懂得挑釁賽,由斯坦福年夜學(xué)在2016年9月提議,是業(yè)內(nèi)公認(rèn)的機(jī)械瀏覽懂得尺度程度測試,也是這個范疇的頂級賽事。

  在2018年1月3日之前,人類一直堅持著搶先的優(yōu)勢——歷來沒有任何一個團(tuán)隊可以或許設(shè)計出一種答題準(zhǔn)確率跨越人類的算法。這一天,微軟亞洲研討院天然說話盤算組提交的新模子取得了82.650的準(zhǔn)確婚配分?jǐn)?shù),跨越了人類得分82.304。僅過了兩天,阿里巴巴iDST-NLP團(tuán)隊也拿到了82.440的準(zhǔn)確婚配分?jǐn)?shù)。

  微軟亞洲研討院院長洪小文告知中國青年報·中青在線記者:“這對微軟和天然說話處置(NLP)研討范疇來講,都是一個主要的里程碑。盤算機(jī)文本懂得才能初次超出人類,預(yù)示著該范疇的研討將會有更年夜沖破。”

  在盤算機(jī)看來,人間萬物都是一串?dāng)?shù)字

  微軟亞洲研討院副院長、天然說話盤算組擔(dān)任人周明博士坐在盤算機(jī)前,重要地期待測試成果。經(jīng)由1個多月對模子和算法的更新,他們提交了最新代碼。

  這支團(tuán)隊在SQuAD挑釁賽早期,一度以穩(wěn)固的成就歷久位居排行榜榜首,但周明曉得,這場比賽的排名瞬息萬變。2017年最初兩個月里,科年夜訊飛與哈工年夜結(jié)合試驗室、騰訊DPDAC NLP團(tuán)隊前后跨越了他們。

  新選手參賽年夜約兩三分鐘后,體系就完成了約50篇數(shù)百詞的文章瀏覽和約1萬個成績的答復(fù)。即便母語是英語的成年人,這個時光也才委曲讀完5篇文章。

  “對人類來講,讀完一篇文章就會在腦海中構(gòu)成必定的印象,好比這篇文章講的甚么人,產(chǎn)生了甚么故事。人們可以或許易如反掌地歸結(jié)出文章里的重點內(nèi)容,但對盤算機(jī)來講不是如許。”周明告知中國青年報·中青在線記者。

  在SQuAD測試中,盤算機(jī)須要瀏覽一段資料,然后答復(fù)諸如人名、地輿地位等成績。分歧于相似測試,SQuAD測試的答復(fù)能夠是一段短語,而非某個單詞或單個內(nèi)容。它能夠遭受同義詞調(diào)換、句子構(gòu)造變換等情形,乃至須要綜合多個句子停止邏輯推理。

  為懂得決這個成績,研討組模仿人類做瀏覽懂得進(jìn)程的方法,他們將全部進(jìn)程分紅了四步。拿到測試題后,盤算機(jī)起首會進(jìn)修文本和成績,就像我們做瀏覽題時,起首會通讀文章,然后審題,取得一個全體印象。

  下一步,盤算機(jī)遇將成績和文章停止比對,找出相干段落,就像人類定位癥結(jié)信息的環(huán)節(jié)。接上去,盤算機(jī)遇把初步成果放到高低文里比對,相似人會綜合全文對待成績。最初,它會推敲并選出最像謎底的內(nèi)容。

  在這場比賽中,分歧團(tuán)隊設(shè)計的答題形式能夠完整分歧。周明引見說,他們的設(shè)計中,最奇特的就是第3步,是經(jīng)由過程“留意力機(jī)制”到達(dá)的。這讓癥結(jié)信息像被畫上了重點一樣,成為盤算機(jī)眼中高亮的部門。

  “除天然說話處置,留意力機(jī)制在圖象辨認(rèn)范疇也是癥結(jié)的概念。”美國哥倫比亞年夜學(xué)盤算機(jī)系碩士生何欽堯告知中國青年報·中青在線記者。

  人類視覺可以或許經(jīng)由過程疾速掃描全體圖象后,找到須要重點存眷的區(qū)域,并投入更多留意力,以取得更多細(xì)節(jié),克制其他無用信息。研討者也測驗考試讓盤算機(jī)進(jìn)修并應(yīng)用這類機(jī)制。分歧于人類具有動植物、山水河道的概念,一切單詞和圖象在盤算機(jī)看來都是一串?dāng)?shù)字。它必需從數(shù)字面前奧妙的接洽中,洞悉它們的意義。

  真諦隱蔽在數(shù)據(jù)和幾率里

  周明地點團(tuán)隊?wèi)?yīng)用的盤算機(jī)其實不是平空學(xué)會做題。加入SQuAD比賽前,它就像“學(xué)霸”考前刷題一樣,先看過了約500篇文章和與之對應(yīng)的10萬道標(biāo)題、謎底。

  但周明表現(xiàn),“今朝基于深度進(jìn)修的機(jī)械瀏覽懂得模子都是黑盒的狀況,很難直不雅地表現(xiàn)機(jī)械停止瀏覽懂得的進(jìn)程和成果。將來,可說明性的深度進(jìn)修模子值得進(jìn)一步探討。”

  經(jīng)由過程年夜量進(jìn)修,盤算機(jī)明確了甚么數(shù)字意味著與文章內(nèi)容相干,如何的接洽意味著這就是成績的謎底。

  “真諦就隱蔽在數(shù)據(jù)和幾率里,我們這個范疇的研討者年夜多都這么看。”何欽堯說。一個1歲人類孩童看過狗今后,就可以辨認(rèn)各類體型、種類和分歧拍攝角度的狗,構(gòu)成概念,但盤算機(jī)須要看過許多照片后,能力斷定某個物體是否是狗。“我們不曉得人類是怎樣構(gòu)成這個概念的,但對盤算機(jī)來講,概念是靠積聚數(shù)據(jù)、靠盤算幾率得來的。”

  直到20世紀(jì)90年月之前,人們還在試圖讓盤算機(jī)學(xué)會人類說話的規(guī)矩,從而懂得面前的寄義。但說話在應(yīng)用時常常不標(biāo)準(zhǔn),機(jī)械沒法處置偏離規(guī)矩的內(nèi)容。后來,人們開端讓機(jī)械本身停止進(jìn)修,獲得說話常識。

  成長到明天,天然說話處置范疇的研討曾經(jīng)根本可以敷衍單個句子,懂得句子成份。各年夜手機(jī)廠商也推出了本身的人工智能語音體系,可以辨認(rèn)并完成用戶的指令,還能停止簡略的交換和對話。

  “長文本的懂得一向是難點,這觸及句子之間的連接性、高低文連接和邏輯推理等更高難度的內(nèi)容。”周明說。

  當(dāng)我們告知盤算機(jī),“萊茵河上最年夜的城市是德國科隆,它是中歐和西歐區(qū)域的第二長河道,位于多瑙河以后”,并問它“甚么河比萊茵河長”時,許多盤算機(jī)遇答復(fù)“科隆”。

  若何懂得代詞“它”、懂得“位于……以后”表現(xiàn)比擬而非物理上的前后,成為這些“選手”很年夜的妨礙。人類具有“科隆是城市而非河道”這類知識,簡直不會在這個成績上出錯,但盤算機(jī)沒法懂得這個概念。

  SQuAD比賽不是第一個盤算機(jī)“超出”人類的范疇

  盤算機(jī)很早就在盤算、記憶的范疇碾軋人類,后來又擊敗了人類最優(yōu)良的國際象棋、圍棋棋手。

  “其實,盤算、下棋、機(jī)械翻譯等只聚焦單一義務(wù)自己的人工智能都屬于弱人工智能,”周明說,“不外弱人工智能其實不弱,它可以具有超出人類的某些才能,有很年夜的價值,然則弱人工智能還沒法真正懂得它吸收到的信息,而這就使得通往能人工智能的途徑非常艱苦。”

  60多年前,曾有人測驗考試讓盤算機(jī)用6條規(guī)矩和200個辭匯做俄英翻譯,這被以為是最早的人工智能測驗考試。那時的研討人員信念滿滿,傳播鼓吹能在5年內(nèi)完整處理一種說話到另外一種說話的主動翻譯成績。

  這個目的至今沒有完成,人工智能也由于研討停頓遲緩閱歷過兩次高潮。一向到近10年,盤算機(jī)機(jī)能的年夜幅度晉升和機(jī)械進(jìn)修實際的鼓起讓人工智能再次熱了起來。人們發(fā)明,盤算性能夠?qū)懺娫~、與人對話,它變得愈來愈像人。

  據(jù)統(tǒng)計,21世紀(jì)以來新開辦的人工智能企業(yè)中,有近三分之二是在5年內(nèi)開辦的。比來3年,人工智能范疇的失業(yè)崗?fù)?shù)目飆升近8倍。在亞洲,曩昔17年內(nèi)投向人工智能范疇的51億美元中,有95%是在曩昔5年內(nèi)投入的。

  翻看SQuAD比賽排行榜,前3名都是來自中國的團(tuán)隊。“這在曩昔是不敢想象的。”周明說。放在20年前,中國乃至還沒有在這個范疇的頂級會議上揭橥過文章。而如今,中國揭橥的文章數(shù)曾經(jīng)穩(wěn)居世界第二,2017年還有5篇文章當(dāng)選該會議的22篇出色論文。

  在SQuAD比賽中,盤算機(jī)得分比人類高0.346分,可以懂得為異樣做1萬道題時,盤算機(jī)多做對35道。“這遠(yuǎn)不代表盤算機(jī)超出了人類的瀏覽懂得程度。”周明告知中國青年報·中青在線記者。也有人質(zhì)疑,這里代表“人類”的,不外是眾包平臺上一小時掙9美元、受教導(dǎo)程度良莠不齊的人。

  一個公認(rèn)的人工智能的尺度是可以或許經(jīng)由過程“圖靈測試”——假如一臺機(jī)械可以或許與人停止交換,而且被人誤認(rèn)為是人,那它就具有智能。

  “ ‘能懂得、會思慮’,這個中,懂得天然說話是最焦點的成績。”周明說。今朝,盤算機(jī)照樣很難在平常交換中懂得雙關(guān)和譏諷。在中文語境下,盤算機(jī)還須要面臨若何將一個句子拆分為數(shù)個辭匯的成績。許多對人類而言無需進(jìn)修的工作,例如堅持均衡、用手拿起一個杯子,對機(jī)械而言也是非常艱苦的工作。

  機(jī)械沒有經(jīng)由幾億年的演變,也沒有人類年夜腦里由神經(jīng)元數(shù)百萬次電脈沖轉(zhuǎn)化成的觸覺、聽覺或是視覺。在人類法式員的馴導(dǎo)下,它把一切轉(zhuǎn)化為數(shù)字。

  懂得辨認(rèn)特征的工程師可以經(jīng)由過程肉眼沒法辨認(rèn)的微調(diào),讓盤算機(jī)把小狗圖片當(dāng)做鴕鳥,或是將一片馬賽克認(rèn)成獵豹。有時,把中文翻譯成英文再翻譯回來,整句話都變得面貌全非。

  在人工智能威逼論不停于耳的明天,周明簡直沒有擔(dān)憂,他向中國青年報·中青在線記者舉了SQuAD比賽中的一個例子。

  機(jī)械瀏覽了“按質(zhì)量算,氧氣是宇宙中第三多的元素,排在氫和氦以后”,面臨“甚么是第二多的元素”的成績,它的答復(fù)倒是“氧”。不論是微軟照樣阿里巴巴團(tuán)隊設(shè)計的算法,都不克不及處理這個再簡略不外的成績。

  這不只是人工智能之間的比賽,也是人類和本身的比賽。

只要你關(guān)注機(jī)器人,你就無法錯過睿慕課

 
 
 
[ 行業(yè)資訊搜索 ]  [ 加入收藏 ]  [ 告訴好友 ]  [ 打印本文 ]  [ 關(guān)閉窗口 ]
 
 
展會更多+
視頻更多+
點擊排行
 
主站蜘蛛池模板: 回收二手冲床_金丰旧冲床回收_协易冲床回收 - 大鑫机械设备 | 仿古瓦,仿古金属瓦,铝瓦,铜瓦,铝合金瓦-西安东申景观艺术工程有限公司 | BAUER减速机|ROSSI-MERSEN熔断器-APTECH调压阀-上海爱泽工业设备有限公司 | 天津散热器_天津暖气片_天津安尼威尔散热器制造有限公司 | 英超直播_英超免费在线高清直播_英超视频在线观看无插件-24直播网 | 交通信号灯生产厂家_红绿灯厂家_电子警察监控杆_标志杆厂家-沃霖电子科技 | 仿古瓦,仿古金属瓦,铝瓦,铜瓦,铝合金瓦-西安东申景观艺术工程有限公司 | 岸电电源-60HZ变频电源-大功率变频电源-济南诚雅电子科技有限公司 | 气动隔膜泵厂家-温州永嘉定远泵阀有限公司 | 电镀整流器_微弧氧化电源_高频电解电源_微弧氧化设备厂家_深圳开瑞节能 | 招商帮-一站式网络营销服务|互联网整合营销|网络推广代运营|信息流推广|招商帮企业招商好帮手|搜索营销推广|短视视频营销推广 | 刺绳_刀片刺网_刺丝滚笼_不锈钢刺绳生产厂家_安平县浩荣金属丝网制品有限公司-安平县浩荣金属丝网制品有限公司 | 热处理温控箱,热处理控制箱厂家-吴江市兴达电热设备厂 | 神马影院-实时更新秒播 | cnc精密加工_数控机械加工_非标平键定制生产厂家_扬州沃佳机械有限公司 | 油罐车_加油机_加油卷盘_加油机卷盘_罐车人孔盖_各类球阀_海底阀等车用配件厂家-湖北华特专用设备有限公司 | 气动调节阀,电动调节阀,自力式压力调节阀,切断阀「厂家」-浙江利沃夫自控阀门 | 膜结构_ETFE膜结构_膜结构厂家_膜结构设计-深圳市烨兴智能空间技术有限公司 | 杜康白酒加盟_杜康酒代理_杜康酒招商加盟官网_杜康酒厂加盟总代理—杜康酒神全国运营中心 | 水压力传感器_数字压力传感器|佛山一众传感仪器有限公司|首页 | 定制/定做冲锋衣厂家/公司-订做/订制冲锋衣价格/费用-北京圣达信 | 电子万能试验机_液压拉力试验机_冲击疲劳试验机_材料试验机厂家-济南众标仪器设备有限公司 | 不锈钢水箱厂家,不锈钢保温水箱-山东桑特供水设备 | 体视显微镜_荧光生物显微镜_显微镜报价-微仪光电生命科学显微镜有限公司 | 韦伯电梯有限公司| 永嘉县奥阳陶瓷阀门有限公司 | 拉力机-万能试验机-材料拉伸试验机-电子拉力机-拉力试验机厂家-冲击试验机-苏州皖仪实验仪器有限公司 | BESWICK球阀,BESWICK接头,BURKERT膜片阀,美国SEL继电器-东莞市广联自动化科技有限公司 | 全国国际学校排名_国际学校招生入学及学费-学校大全网 | 蒜肠网-动漫,二次元,COSPLAY,漫展以及收藏型模型,手办,玩具的新媒体.(原变形金刚变迷TF圈) | 书法培训-高考书法艺考培训班-山东艺霖书法培训凭实力挺进央美 | 协议书_协议合同格式模板范本大全 | 卫生纸复卷机|抽纸机|卫生纸加工设备|做卫生纸机器|小型卫生纸加工需要什么设备|卫生纸机器设备多少钱一台|许昌恒源纸品机械有限公司 | 换网器_自动换网器_液压换网器--郑州海科熔体泵有限公司 | 光谱仪_积分球_分布光度计_灯具检测生产厂家_杭州松朗光电【官网】 | 润滑脂-高温润滑脂-轴承润滑脂-食品级润滑油-索科润滑油脂厂家 | 电加热导热油炉-空气加热器-导热油加热器-翅片电加热管-科安达机械 | 游戏版号转让_游戏资质出售_游戏公司转让-【八九买卖网】 | 天津中都白癜风医院_天津白癜风医院_天津治疗白癜风 | 电车线(用于供电给电车的输电线路)-百科 | 广州各区危化证办理_危险化学品经营许可证代办 |