當(dāng)前位置: 首頁 » 行業(yè)資訊 » 機(jī)器人»人工智能：讀書“破萬卷”，難答“小兒科”

人工智能：讀書“破萬卷”，難答“小兒科”

發(fā)布日期：2018-04-08 瀏覽次數(shù)：777

核心提示：（從左至右）崔磊、韋福如、周明、楊南。微軟亞洲研討院天然說話盤算研討組供圖　　瀏覽來自維基百科的536篇文章，答復(fù)10萬個基于文章內(nèi)容的成績，除題量年夜一點，這場競賽挺像年夜學(xué)英語六級測驗的瀏覽懂得測試。

人工智能：讀書“破萬卷”，難答“小兒科”
（從左至右）崔磊、韋福如、周明、楊南。微軟亞洲研討院天然說話盤算研討組供圖

　　瀏覽來自維基百科的536篇文章，答復(fù)10萬個基于文章內(nèi)容的成績，除題量年夜一點，這場競賽挺像年夜學(xué)英語六級測驗的瀏覽懂得測試。

　　但你弗成能聽到科場里奮筆疾書的“唰唰”聲，由于“參賽者”只是一段代碼。輸出文章和成績后，盤算機(jī)的中心處置器（CPU）和圖形處置器（GPU）開端高速盤算，最初交出答卷，由出題者批閱。

　　對來自世界列國的研討者來講，這是一場沒有止境的比賽——任何人可以在隨意率性時光參加，排行榜及時更新；即便是第一位，不堅持“進(jìn)修”和“更新”，隨時有能夠被新參加者超出。它能夠產(chǎn)生在你吃飯和睡覺的時刻，而“敵手”不外是“啪啪啪”地敲擊了一串代碼。

　　這場比賽全稱SQuAD（Stanford Question Answering Dataset）文本懂得挑釁賽，由斯坦福年夜學(xué)在2016年9月提議，是業(yè)內(nèi)公認(rèn)的機(jī)械瀏覽懂得尺度程度測試，也是這個范疇的頂級賽事。

　　在2018年1月3日之前，人類一直堅持著搶先的優(yōu)勢——歷來沒有任何一個團(tuán)隊可以或許設(shè)計出一種答題準(zhǔn)確率跨越人類的算法。這一天，微軟亞洲研討院天然說話盤算組提交的新模子取得了82.650的準(zhǔn)確婚配分?jǐn)?shù)，跨越了人類得分82.304。僅過了兩天，阿里巴巴iDST－NLP團(tuán)隊也拿到了82.440的準(zhǔn)確婚配分?jǐn)?shù)。

　　微軟亞洲研討院院長洪小文告知中國青年報·中青在線記者：“這對微軟和天然說話處置（NLP）研討范疇來講，都是一個主要的里程碑。盤算機(jī)文本懂得才能初次超出人類，預(yù)示著該范疇的研討將會有更年夜沖破。”

　　在盤算機(jī)看來，人間萬物都是一串?dāng)?shù)字

　　微軟亞洲研討院副院長、天然說話盤算組擔(dān)任人周明博士坐在盤算機(jī)前，重要地期待測試成果。經(jīng)由1個多月對模子和算法的更新，他們提交了最新代碼。

　　這支團(tuán)隊在SQuAD挑釁賽早期，一度以穩(wěn)固的成就歷久位居排行榜榜首，但周明曉得，這場比賽的排名瞬息萬變。2017年最初兩個月里，科年夜訊飛與哈工年夜結(jié)合試驗室、騰訊DPDAC NLP團(tuán)隊前后跨越了他們。

　　新選手參賽年夜約兩三分鐘后，體系就完成了約50篇數(shù)百詞的文章瀏覽和約1萬個成績的答復(fù)。即便母語是英語的成年人，這個時光也才委曲讀完5篇文章。

　　“對人類來講，讀完一篇文章就會在腦海中構(gòu)成必定的印象，好比這篇文章講的甚么人，產(chǎn)生了甚么故事。人們可以或許易如反掌地歸結(jié)出文章里的重點內(nèi)容，但對盤算機(jī)來講不是如許。”周明告知中國青年報·中青在線記者。

　　在SQuAD測試中，盤算機(jī)須要瀏覽一段資料，然后答復(fù)諸如人名、地輿地位等成績。分歧于相似測試，SQuAD測試的答復(fù)能夠是一段短語，而非某個單詞或單個內(nèi)容。它能夠遭受同義詞調(diào)換、句子構(gòu)造變換等情形，乃至須要綜合多個句子停止邏輯推理。

　　為懂得決這個成績，研討組模仿人類做瀏覽懂得進(jìn)程的方法，他們將全部進(jìn)程分紅了四步。拿到測試題后，盤算機(jī)起首會進(jìn)修文本和成績，就像我們做瀏覽題時，起首會通讀文章，然后審題，取得一個全體印象。

　　下一步，盤算機(jī)遇將成績和文章停止比對，找出相干段落，就像人類定位癥結(jié)信息的環(huán)節(jié)。接上去，盤算機(jī)遇把初步成果放到高低文里比對，相似人會綜合全文對待成績。最初，它會推敲并選出最像謎底的內(nèi)容。

　　在這場比賽中，分歧團(tuán)隊設(shè)計的答題形式能夠完整分歧。周明引見說，他們的設(shè)計中，最奇特的就是第3步，是經(jīng)由過程“留意力機(jī)制”到達(dá)的。這讓癥結(jié)信息像被畫上了重點一樣，成為盤算機(jī)眼中高亮的部門。

　　“除天然說話處置，留意力機(jī)制在圖象辨認(rèn)范疇也是癥結(jié)的概念。”美國哥倫比亞年夜學(xué)盤算機(jī)系碩士生何欽堯告知中國青年報·中青在線記者。

　　人類視覺可以或許經(jīng)由過程疾速掃描全體圖象后，找到須要重點存眷的區(qū)域，并投入更多留意力，以取得更多細(xì)節(jié)，克制其他無用信息。研討者也測驗考試讓盤算機(jī)進(jìn)修并應(yīng)用這類機(jī)制。分歧于人類具有動植物、山水河道的概念，一切單詞和圖象在盤算機(jī)看來都是一串?dāng)?shù)字。它必需從數(shù)字面前奧妙的接洽中，洞悉它們的意義。

　　真諦隱蔽在數(shù)據(jù)和幾率里

　　周明地點團(tuán)隊?wèi)?yīng)用的盤算機(jī)其實不是平空學(xué)會做題。加入SQuAD比賽前，它就像“學(xué)霸”考前刷題一樣，先看過了約500篇文章和與之對應(yīng)的10萬道標(biāo)題、謎底。

　　但周明表現(xiàn)，“今朝基于深度進(jìn)修的機(jī)械瀏覽懂得模子都是黑盒的狀況，很難直不雅地表現(xiàn)機(jī)械停止瀏覽懂得的進(jìn)程和成果。將來，可說明性的深度進(jìn)修模子值得進(jìn)一步探討。”

　　經(jīng)由過程年夜量進(jìn)修，盤算機(jī)明確了甚么數(shù)字意味著與文章內(nèi)容相干，如何的接洽意味著這就是成績的謎底。

　　“真諦就隱蔽在數(shù)據(jù)和幾率里，我們這個范疇的研討者年夜多都這么看。”何欽堯說。一個1歲人類孩童看過狗今后，就可以辨認(rèn)各類體型、種類和分歧拍攝角度的狗，構(gòu)成概念，但盤算機(jī)須要看過許多照片后，能力斷定某個物體是否是狗。“我們不曉得人類是怎樣構(gòu)成這個概念的，但對盤算機(jī)來講，概念是靠積聚數(shù)據(jù)、靠盤算幾率得來的。”

　　直到20世紀(jì)90年月之前，人們還在試圖讓盤算機(jī)學(xué)會人類說話的規(guī)矩，從而懂得面前的寄義。但說話在應(yīng)用時常常不標(biāo)準(zhǔn)，機(jī)械沒法處置偏離規(guī)矩的內(nèi)容。后來，人們開端讓機(jī)械本身停止進(jìn)修，獲得說話常識。

　　成長到明天，天然說話處置范疇的研討曾經(jīng)根本可以敷衍單個句子，懂得句子成份。各年夜手機(jī)廠商也推出了本身的人工智能語音體系，可以辨認(rèn)并完成用戶的指令，還能停止簡略的交換和對話。

　　“長文本的懂得一向是難點，這觸及句子之間的連接性、高低文連接和邏輯推理等更高難度的內(nèi)容。”周明說。

　　當(dāng)我們告知盤算機(jī)，“萊茵河上最年夜的城市是德國科隆，它是中歐和西歐區(qū)域的第二長河道，位于多瑙河以后”，并問它“甚么河比萊茵河長”時，許多盤算機(jī)遇答復(fù)“科隆”。

　　若何懂得代詞“它”、懂得“位于……以后”表現(xiàn)比擬而非物理上的前后，成為這些“選手”很年夜的妨礙。人類具有“科隆是城市而非河道”這類知識，簡直不會在這個成績上出錯，但盤算機(jī)沒法懂得這個概念。

　　SQuAD比賽不是第一個盤算機(jī)“超出”人類的范疇

　　盤算機(jī)很早就在盤算、記憶的范疇碾軋人類，后來又擊敗了人類最優(yōu)良的國際象棋、圍棋棋手。

　　“其實，盤算、下棋、機(jī)械翻譯等只聚焦單一義務(wù)自己的人工智能都屬于弱人工智能，”周明說，“不外弱人工智能其實不弱，它可以具有超出人類的某些才能，有很年夜的價值，然則弱人工智能還沒法真正懂得它吸收到的信息，而這就使得通往能人工智能的途徑非常艱苦。”

　　60多年前，曾有人測驗考試讓盤算機(jī)用6條規(guī)矩和200個辭匯做俄英翻譯，這被以為是最早的人工智能測驗考試。那時的研討人員信念滿滿，傳播鼓吹能在5年內(nèi)完整處理一種說話到另外一種說話的主動翻譯成績。

　　這個目的至今沒有完成，人工智能也由于研討停頓遲緩閱歷過兩次高潮。一向到近10年，盤算機(jī)機(jī)能的年夜幅度晉升和機(jī)械進(jìn)修實際的鼓起讓人工智能再次熱了起來。人們發(fā)明，盤算性能夠?qū)懺娫~、與人對話，它變得愈來愈像人。

　　據(jù)統(tǒng)計，21世紀(jì)以來新開辦的人工智能企業(yè)中，有近三分之二是在5年內(nèi)開辦的。比來3年，人工智能范疇的失業(yè)崗?fù)?shù)目飆升近8倍。在亞洲，曩昔17年內(nèi)投向人工智能范疇的51億美元中，有95％是在曩昔5年內(nèi)投入的。

　　翻看SQuAD比賽排行榜，前3名都是來自中國的團(tuán)隊。“這在曩昔是不敢想象的。”周明說。放在20年前，中國乃至還沒有在這個范疇的頂級會議上揭橥過文章。而如今，中國揭橥的文章數(shù)曾經(jīng)穩(wěn)居世界第二，2017年還有5篇文章當(dāng)選該會議的22篇出色論文。

　　在SQuAD比賽中，盤算機(jī)得分比人類高0.346分，可以懂得為異樣做1萬道題時，盤算機(jī)多做對35道。“這遠(yuǎn)不代表盤算機(jī)超出了人類的瀏覽懂得程度。”周明告知中國青年報·中青在線記者。也有人質(zhì)疑，這里代表“人類”的，不外是眾包平臺上一小時掙9美元、受教導(dǎo)程度良莠不齊的人。

　　一個公認(rèn)的人工智能的尺度是可以或許經(jīng)由過程“圖靈測試”——假如一臺機(jī)械可以或許與人停止交換，而且被人誤認(rèn)為是人，那它就具有智能。

　　“ ‘能懂得、會思慮’，這個中，懂得天然說話是最焦點的成績。”周明說。今朝，盤算機(jī)照樣很難在平常交換中懂得雙關(guān)和譏諷。在中文語境下，盤算機(jī)還須要面臨若何將一個句子拆分為數(shù)個辭匯的成績。許多對人類而言無需進(jìn)修的工作，例如堅持均衡、用手拿起一個杯子，對機(jī)械而言也是非常艱苦的工作。

　　機(jī)械沒有經(jīng)由幾億年的演變，也沒有人類年夜腦里由神經(jīng)元數(shù)百萬次電脈沖轉(zhuǎn)化成的觸覺、聽覺或是視覺。在人類法式員的馴導(dǎo)下，它把一切轉(zhuǎn)化為數(shù)字。

　　懂得辨認(rèn)特征的工程師可以經(jīng)由過程肉眼沒法辨認(rèn)的微調(diào)，讓盤算機(jī)把小狗圖片當(dāng)做鴕鳥，或是將一片馬賽克認(rèn)成獵豹。有時，把中文翻譯成英文再翻譯回來，整句話都變得面貌全非。

　　在人工智能威逼論不停于耳的明天，周明簡直沒有擔(dān)憂，他向中國青年報·中青在線記者舉了SQuAD比賽中的一個例子。

　　機(jī)械瀏覽了“按質(zhì)量算，氧氣是宇宙中第三多的元素，排在氫和氦以后”，面臨“甚么是第二多的元素”的成績，它的答復(fù)倒是“氧”。不論是微軟照樣阿里巴巴團(tuán)隊設(shè)計的算法，都不克不及處理這個再簡略不外的成績。

　　這不只是人工智能之間的比賽，也是人類和本身的比賽。

下一篇：要布局“人工智能+醫(yī)療”

上一篇：人工智能技術(shù)打造企業(yè)級反欺詐系統(tǒng) 覆蓋線上線下交易風(fēng)險

[ 行業(yè)資訊搜索 ] [ 加入收藏 ] [ 告訴好友 ] [ 打印本文 ] [ 關(guān)閉窗口 ]

同類行業(yè)資訊

• 四川：加快推進(jìn)人型機(jī)器人、四足機(jī)器人、智能無 • 消息稱三星 AI 家庭伴侶機(jī)器人 Ballie 推遲上市
• 人形機(jī)器人從實驗室“手搓”走向量產(chǎn)，供應(yīng)鏈廠 • 山東印發(fā)機(jī)器人產(chǎn)業(yè)高質(zhì)量發(fā)展行動計劃
• 廣東打造千億級機(jī)器人產(chǎn)業(yè)集群 • 斯坦德機(jī)器人港股IPO：去年減虧，無錫國資新晉
• 黃仁勛預(yù)言：繼AI之后，機(jī)器人將成為英偉達(dá)最強(qiáng) • 中金：人形機(jī)器人逐步放量以及硬件成本的下降有
• 向“智”！中國機(jī)器人“跑”起來 • 哈工程牽頭研制出新型四足機(jī)器人助力核能安全

共0條 [查看全部] 相關(guān)評論

展會更多+

2026第17屆中國國

2025第25屆中國國

2026上海國際清潔

第26屆上海國際清

07-022025第十一屆亞洲教育裝備博覽會暨人工智能教育大會

07-022026第17屆中國國際物流裝備與技術(shù)展覽會|廣州物流裝備展

06-272025第25屆中國國際數(shù)控機(jī)床與金屬加工展|激光設(shè)備展

06-252026上海國際清潔技術(shù)與設(shè)備博覽會|智能清潔機(jī)器人展

06-12中國濟(jì)南國際智能機(jī)器人展覽會

視頻更多+

中舟智能固守科技

玉灃科技：精研滑

新松機(jī)器人自動化

羅克韋爾自動化（

10-11中舟智能固守科技創(chuàng)新新品首發(fā)添彩中國夢

10-11玉灃科技：精研滑臺十二載遙遙領(lǐng)先的模組

08-05新松機(jī)器人自動化股份有限公司

07-18羅克韋爾自動化（中國）企業(yè)宣傳片

07-18凌華科技機(jī)器手臂視覺導(dǎo)引解決方案

點擊排行

深圳加速落地全國首個“機(jī)器人街

埃夫特：高性能工業(yè)機(jī)器人產(chǎn)能有

增收不增利樂動機(jī)器人赴港遞表

機(jī)器人競爭開啟“搶人”模式部

斯坦德機(jī)器人港股IPO：去年減虧

向“智”！中國機(jī)器人“跑”起來

中金：人形機(jī)器人逐步放量以及硬

廣東打造千億級機(jī)器人產(chǎn)業(yè)集群

哈工程牽頭研制出新型四足機(jī)器人

黃仁勛預(yù)言：繼AI之后，機(jī)器人將

亚洲工业智能制造领域专业门户网站 - 亚洲自动化与机器人网

我的供應(yīng)

我的求購

商鋪管理

工業(yè)機(jī)器人及行業(yè)應(yīng)用

智能機(jī)器人

工業(yè)自動化

智能裝備

人工智能：讀書“破萬卷”，難答“小兒科”

• 四川：加快推進(jìn)人型機(jī)器人、四足機(jī)器人、智能無	• 消息稱三星 AI 家庭伴侶機(jī)器人 Ballie 推遲上市
• 人形機(jī)器人從實驗室“手搓”走向量產(chǎn)，供應(yīng)鏈廠	• 山東印發(fā)機(jī)器人產(chǎn)業(yè)高質(zhì)量發(fā)展行動計劃
• 廣東打造千億級機(jī)器人產(chǎn)業(yè)集群	• 斯坦德機(jī)器人港股IPO：去年減虧，無錫國資新晉
• 黃仁勛預(yù)言：繼AI之后，機(jī)器人將成為英偉達(dá)最強(qiáng)	• 中金：人形機(jī)器人逐步放量以及硬件成本的下降有
• 向“智”！中國機(jī)器人“跑”起來	• 哈工程牽頭研制出新型四足機(jī)器人助力核能安全

2026第17屆中國國	2025第25屆中國國
2026上海國際清潔	第26屆上海國際清

中舟智能固守科技	玉灃科技：精研滑
新松機(jī)器人自動化	羅克韋爾自動化（