亚洲工业智能制造领域专业门户网站 - 亚洲自动化与机器人网

 
當(dāng)前位置: 首頁(yè) » 行業(yè)資訊 » 機(jī)器人»AI芯片之爭(zhēng)白熱化的當(dāng)下,如何設(shè)計(jì)一款真正適用于終端的AI芯片?
   

AI芯片之爭(zhēng)白熱化的當(dāng)下,如何設(shè)計(jì)一款真正適用于終端的AI芯片?

 46.1K
     [點(diǎn)擊復(fù)制]
放大字體  縮小字體 發(fā)布日期:2018-04-08   瀏覽次數(shù):793
核心提示:  2017年,人工智能最火的風(fēng)口必定是AI芯片?! I芯片的涌現(xiàn),與深度進(jìn)修技巧的成熟及運(yùn)用密弗成分。深度進(jìn)修的進(jìn)程可以簡(jiǎn)化懂得為應(yīng)用年夜量標(biāo)注的數(shù)據(jù)停止練習(xí),練習(xí)出一個(gè)卓有成效的模子,再將這一模子應(yīng)用于

  2017年,人工智能最火的風(fēng)口必定是AI芯片。

  AI芯片的涌現(xiàn),與深度進(jìn)修技巧的成熟及運(yùn)用密弗成分。深度進(jìn)修的進(jìn)程可以簡(jiǎn)化懂得為應(yīng)用年夜量標(biāo)注的數(shù)據(jù)停止練習(xí),練習(xí)出一個(gè)卓有成效的模子,再將這一模子應(yīng)用于新數(shù)據(jù)的揣摸。

  這個(gè)耳熟能詳?shù)谋钏惴ㄊ菢?shù)立在多層年夜范圍神經(jīng)收集之上的,后者實(shí)質(zhì)上是包括了矩陣乘積和卷積操作的年夜運(yùn)算量函數(shù)。常常須要先界說(shuō)一個(gè)包括回歸成績(jī)的方差、分類時(shí)的穿插熵的價(jià)值函數(shù),再數(shù)據(jù)分批傳遞進(jìn)收集,依據(jù)參數(shù)求導(dǎo)出價(jià)值函數(shù)值,從而更新全部收集模子。這平日意味著至多幾百萬(wàn)次的相乘處置,盤算量偉大。淺顯來(lái)講,包括了數(shù)百萬(wàn)次A*B+C的盤算,算力消費(fèi)偉大。

  為處理這一成績(jī),AI芯片應(yīng)運(yùn)而生。2017年開(kāi)端,環(huán)繞AI芯片,半導(dǎo)體行業(yè),戰(zhàn)事進(jìn)級(jí),賽場(chǎng)上新老玩家暗流涌動(dòng),連橫合眾,年夜有“AI芯片太多,裝備都不敷用了”之勢(shì)。

  時(shí)光進(jìn)入2018年,備受存眷的年夜小公司都將正式推出自研AI芯片。這些芯片也都被業(yè)界寄與厚望,能否能處理或許部門處理終端盤算困難?甚么樣的芯片能力夠真正順應(yīng)終端智能的需求?

  這些都是我們非常獵奇且存眷的成績(jī)。因而也與一些創(chuàng)業(yè)者停止了交換。本文等于個(gè)中的一篇,來(lái)自于與探境科技CEO魯勇的訪談。今朝探境科技正研發(fā)實(shí)用于終真?zhèn)€AI芯片,在創(chuàng)業(yè)前魯勇曾在芯片廠商Marvell任高管,從事過(guò)存儲(chǔ)芯片的相干任務(wù),而存儲(chǔ)恰是盤算以外一切芯片另外一焦點(diǎn)?;谶^(guò)往的閱歷、經(jīng)歷與不雅察,魯勇以為,做實(shí)用于終真?zhèn)€AI芯片,除要在盤算方面晉升,存儲(chǔ)優(yōu)化異樣相當(dāng)主要。

  以下為注釋,來(lái)自36氪對(duì)魯勇的訪談內(nèi)容,36氪基于訪談內(nèi)容對(duì)其不雅點(diǎn)停止了整頓。

  一

  AI算法在芯片完成時(shí)碰到的焦點(diǎn)成績(jī)不是盤算資本而是存儲(chǔ)成績(jī),強(qiáng)如GPU供給浩瀚的盤算資本,而現(xiàn)實(shí)盤算才能與盤算資本年夜為下降。

  歸納綜合來(lái)講,存儲(chǔ)成績(jī)分為兩個(gè)部門,一個(gè)是帶寬成績(jī),一個(gè)是功耗成績(jī),這兩個(gè)成績(jī)的處理其實(shí)也是耦合在一路的。

  詳細(xì)來(lái)講,深度進(jìn)修算法應(yīng)用年夜量存儲(chǔ)資本,即包含靜態(tài)模子參數(shù),也包含收集層之間的靜態(tài)數(shù)據(jù)。關(guān)于靜態(tài)模子參數(shù)權(quán)重,動(dòng)輒幾十兆上百兆樣本數(shù)目,沒(méi)法在片上SRAM保留,是以須要存入內(nèi)部DRAM。DRAM與AI盤算芯片間帶寬無(wú)限,假如芯片上盤算資本很年夜,但受存儲(chǔ)帶寬的瓶頸限制,現(xiàn)實(shí)盤算力年夜為降低。

  打比喻來(lái)講,擔(dān)任存儲(chǔ)的DRAM和與擔(dān)任盤算的芯片就像是位于河兩岸的倉(cāng)庫(kù),全部運(yùn)算的進(jìn)程可以類比從存儲(chǔ)的倉(cāng)庫(kù)搬取數(shù)據(jù)、搬運(yùn)過(guò)橋,將數(shù)據(jù)搬入盤算的單位停止處置,并高速輪回來(lái)去。而以后的AI芯片技巧重點(diǎn)晉升將數(shù)據(jù)搬入盤算單位后的處置速度,但由于搬出數(shù)據(jù)、過(guò)橋的進(jìn)程根本未發(fā)送變更,是以全體的效力晉升還絕對(duì)無(wú)限。

  與之對(duì)應(yīng)的辦法等于戰(zhàn)勝存儲(chǔ)帶寬的手腕:一是削減數(shù)據(jù)量,下降所需數(shù)據(jù)帶寬,就是說(shuō)想方法只需從倉(cāng)庫(kù)搬出大批數(shù)據(jù),便可以到達(dá)異樣的后果;二是更迷信的調(diào)劑數(shù)據(jù)應(yīng)用,晉升調(diào)劑的效力。

 ?。?)削減數(shù)據(jù)容量

  假如數(shù)據(jù)量下降了,這將整體上削減對(duì)DRAM的拜訪,在DRAM物理帶寬堅(jiān)持不變的條件下,下降了DRAM的依附性,進(jìn)步了全體機(jī)能,同時(shí)削減DRAM拜訪也將年夜幅削減體系功耗開(kāi)支。是以起首須要處理的成績(jī)是削減靜態(tài)參數(shù)權(quán)重的年夜小。平日的處理方法包含參數(shù)定點(diǎn)化,將每一個(gè)32bit浮點(diǎn)數(shù)削減為16bit以下的定點(diǎn)數(shù),至多能下降50%乃至75%的存儲(chǔ)容量,也異樣幅度的下降了存儲(chǔ)帶寬的需求。理論證實(shí)16bit定點(diǎn)化可以采取線性量化的方法,而16bit以下定點(diǎn)化依據(jù)模子的分歧,有些須要采取非線性量化才可以到達(dá)保持模子機(jī)能的目標(biāo)。

  今朝重要有模子剪枝、設(shè)計(jì)適于終端裝備的簡(jiǎn)化收集兩種完成方法。模子剪枝作為進(jìn)一步下降模子容量和存儲(chǔ)帶寬的方法,是基于神經(jīng)收集模子存在年夜量冗余信息的基本,而另外一種從泉源開(kāi)端從新設(shè)計(jì)適于終端裝備的簡(jiǎn)化收集的方法也在逐步鼓起,從異樣范圍的收集機(jī)能來(lái)看,新設(shè)計(jì)的收集能夠比舊收集經(jīng)由過(guò)程剪枝再練習(xí)的方法更加簡(jiǎn)略快捷,機(jī)能也更好。

 ?。?)更迷信的調(diào)劑數(shù)據(jù)應(yīng)用

  深度進(jìn)修的盤算年夜量應(yīng)用乘累加,即完成AXB+C的任務(wù),這類乘累加單位(MAC)每次運(yùn)算須要三個(gè)輸出,完成一個(gè)輸入。介入運(yùn)算的數(shù)據(jù)包含事前預(yù)備好的權(quán)重參數(shù)和收集層發(fā)生的中央數(shù)據(jù)。每一個(gè)乘累加完成后的輸入平日也會(huì)作為下一次運(yùn)算的輸出,是以若何調(diào)劑這些數(shù)據(jù)成為癥結(jié)。

  功耗角度來(lái)講,從DRAM獲得數(shù)據(jù)所消費(fèi)的功耗最年夜,從SRAM中獲得數(shù)據(jù)其次,從當(dāng)?shù)卮娣牌髦蝎@得數(shù)據(jù)消費(fèi)功耗最低,但從本錢角度斟酌恰好相反,是以這三個(gè)分歧條理的存儲(chǔ)器的應(yīng)用異常癥結(jié),我們?cè)竿M量削減DRAM的拜訪,最幻想的成果是僅從DRAM中讀取一次事前存好的模子參數(shù),而不依附DRAM做任何其他任務(wù)。

  從微觀上看,全部深度進(jìn)修運(yùn)算盤算一次,進(jìn)入MAC的總數(shù)據(jù)量弘遠(yuǎn)于靜態(tài)數(shù)據(jù)的容量,由于不管是模子參數(shù)照樣中央數(shù)據(jù)都屢次被反復(fù)應(yīng)用,是以現(xiàn)實(shí)所需的數(shù)據(jù)帶寬異常年夜,而且當(dāng)一切這些數(shù)據(jù)都僅經(jīng)由過(guò)程DRAM被緩存應(yīng)用時(shí),其功耗開(kāi)支也是驚人的,是以充足應(yīng)用各級(jí)緩存的特征異常主要,設(shè)計(jì)一個(gè)公道的數(shù)據(jù)流,將屢次被反復(fù)應(yīng)用的數(shù)據(jù)放在離盤算資本較近的處所,大批讀取的數(shù)據(jù)放在DRAM中,將進(jìn)步盤算機(jī)能,下降體系功耗。

  二

  那末成績(jī)來(lái)了,若何能力設(shè)計(jì)一款真正實(shí)用于終真?zhèn)€AI芯片。

  簡(jiǎn)略的設(shè)計(jì)一個(gè)卷積加快器其實(shí)不能帶來(lái)深度進(jìn)修盤算機(jī)能上的進(jìn)步,及格的盤算架構(gòu)須要聯(lián)合對(duì)存儲(chǔ)成績(jī)的剖析來(lái)設(shè)計(jì),不只要斟酌盤算架構(gòu),也要斟酌存儲(chǔ)的數(shù)據(jù)流掌握,是以深度進(jìn)修的盤算特色并不是是一個(gè)簡(jiǎn)略粗魯?shù)牟⑿斜P算成績(jī)。

  起首照樣要斟酌浮點(diǎn)和定點(diǎn)盤算的成績(jī),8 位的整數(shù)乘法比IEEE 754尺度下16位浮點(diǎn)乘法下降 6 倍的能耗,占用的芯單方面積也少 6 倍;而整數(shù)加法的差別是13倍的能耗與38倍的面積,是以終端AI芯片采取定點(diǎn)盤算將取得偉大收益。當(dāng)定點(diǎn)成為設(shè)計(jì)目的的時(shí)刻,要充足斟酌軟硬件的聯(lián)合,分歧收集對(duì)定點(diǎn)位數(shù)的影響水平是紛歧樣的,數(shù)據(jù)量化的詳細(xì)方法也有差別,有線性量化也有非線性量化的辦法,是以針對(duì)運(yùn)用場(chǎng)景聯(lián)合軟件協(xié)同設(shè)計(jì)異常有需要。

  其次深度進(jìn)修不是簡(jiǎn)略粗魯?shù)牟⑿斜P算但依然有顯著的并行盤算特點(diǎn),是以斟酌存儲(chǔ)成績(jī)后放入更多的盤算資本會(huì)年夜幅進(jìn)步盤算機(jī)能。起首將最多被反復(fù)應(yīng)用的數(shù)據(jù)放在接近盤算資本的處所,這相符較為風(fēng)行的In Memory Computing(存儲(chǔ)盤算一體化)的思惟,而且斟酌到以后工業(yè)程度,這更加現(xiàn)實(shí),而經(jīng)由過(guò)程從新設(shè)計(jì)包含盤算單位的存儲(chǔ)單位或采取ReRAM等方法是將來(lái)的 成長(zhǎng)偏向。

  第三要斟酌到深度進(jìn)修數(shù)據(jù)的另外一主要特征,即數(shù)據(jù)稀少化特征,也就是說(shuō)在介入運(yùn)算的數(shù)據(jù)中有年夜量的零值數(shù)據(jù)存在,這些零值數(shù)據(jù)便可以在存儲(chǔ)中被緊縮寄存,下降存儲(chǔ)容量和帶寬需求,也能夠在盤算中被進(jìn)一步驟度,削減運(yùn)算壓力,進(jìn)步運(yùn)算的有用機(jī)能。這些零值數(shù)據(jù)不只存在于模子參數(shù)中,也年夜量存在于神經(jīng)收集各層運(yùn)算的中央數(shù)據(jù)中,這兩方面都須要停止斟酌。稀少數(shù)據(jù)在多焦點(diǎn)并行盤算中的調(diào)劑是個(gè)龐雜的成績(jī),而分歧收集構(gòu)造也會(huì)帶來(lái)分歧的影響,是以將軟硬件協(xié)同設(shè)計(jì),靜態(tài)調(diào)劑的調(diào)劑器長(zhǎng)短常龐雜的設(shè)計(jì)難點(diǎn)。

  最初要斟酌針對(duì)分歧收集的資本有用應(yīng)用率成績(jī),因?yàn)樯窠?jīng)收集差別化較年夜,假如愿望針對(duì)分歧收集都有較高的資本有用應(yīng)用率,則須要在較細(xì)的顆粒度長(zhǎng)進(jìn)行優(yōu)化,進(jìn)一步加深了數(shù)據(jù)流調(diào)劑器的龐雜度。

只要你關(guān)注機(jī)器人,你就無(wú)法錯(cuò)過(guò)睿慕課

 
 
 
[ 行業(yè)資訊搜索 ]  [ 加入收藏 ]  [ 告訴好友 ]  [ 打印本文 ]  [ 關(guān)閉窗口 ]
 
 
展會(huì)更多+
視頻更多+
點(diǎn)擊排行
 
主站蜘蛛池模板: 膜结构_ETFE膜结构_膜结构厂家_膜结构设计-深圳市烨兴智能空间技术有限公司 | 耐高温硅酸铝板-硅酸铝棉保温施工|亿欧建设工程 | 带锯机|木工带锯机圆木推台锯|跑车带锯机|河北茂业机械制造有限公司| | ETFE膜结构_PTFE膜结构_空间钢结构_膜结构_张拉膜_浙江萬豪空间结构集团有限公司 | 自清洗过滤器,浅层砂过滤器,叠片过滤器厂家-新乡市宇清净化 | crm客户关系管理系统,销售管理系统,crm系统,在线crm,移动crm系统 - 爱客crm | 滑板场地施工_极限运动场地设计_滑板公园建造_盐城天人极限运动场地建设有限公司 | 电机修理_二手电机专家-河北豫通机电设备有限公司(原石家庄冀华高压电机维修中心) | 贝壳粉涂料-内墙腻子-外墙腻子-山东巨野七彩贝壳漆业中心 | 国际学校_国际学校哪个好_国际课程学校-国际学校择校网 | 培训中心-海南香蕉蛋糕加盟店技术翰香原中心官网总部 | 辐射色度计-字符亮度测试-反射式膜厚仪-苏州瑞格谱光电科技有限公司 | 并离网逆变器_高频UPS电源定制_户用储能光伏逆变器厂家-深圳市索克新能源 | 多功能真空滤油机_润滑油全自动滤油机_高效真空滤油机价格-重庆润华通驰 | 石膏基自流平砂浆厂家-高强石膏基保温隔声自流平-轻质抹灰石膏粉砂浆批发-永康市汇利建设有限公司 | 金属雕花板_厂家直销_价格低-山东慧诚建筑材料有限公司 | 活性炭-果壳木质煤质柱状粉状蜂窝活性炭厂家价格多少钱 | 运动木地板厂家_体育木地板安装_篮球木地板选购_实木运动地板价格 | 回转炉,外热式回转窑,回转窑炉-淄博圣元窑炉工程有限公司 | 宁夏档案密集柜,智能密集柜,电动手摇密集柜-盛隆柜业宁夏档案密集柜厂家 | 酒吧霸屏软件_酒吧霸屏系统,酒吧微上墙,夜场霸屏软件,酒吧点歌软件,酒吧互动游戏,酒吧大屏幕软件系统下载 | 耐高温硅酸铝板-硅酸铝棉保温施工|亿欧建设工程 | 物联网卡_物联网卡购买平台_移动物联网卡办理_移动联通电信流量卡通信模组采购平台? | 阀门智能定位器_电液动执行器_气动执行机构-赫尔法流体技术(北京)有限公司 | 恒温恒湿试验箱厂家-高低温试验箱维修价格_东莞环仪仪器_东莞环仪仪器 | 120kv/2mA直流高压发生器-60kv/2mA-30kva/50kv工频耐压试验装置-旭明电工 | TYPE-C厂家|TYPE-C接口|TYPE-C防水母座|TYPE-C贴片-深圳步步精 | 细石混凝土泵_厂家_价格-烟台九达机械有限公司 | 油漆辅料厂家_阴阳脚线_艺术漆厂家_内外墙涂料施工_乳胶漆专用防霉腻子粉_轻质粉刷石膏-魔法涂涂 | 闭端端子|弹簧螺式接线头|防水接线头|插线式接线头|端子台|电源线扣+护线套|印刷电路板型端子台|金笔电子代理商-上海拓胜电气有限公司 | 特种阀门-调节阀门-高温熔盐阀-镍合金截止阀-钛阀门-高温阀门-高性能蝶阀-蒙乃尔合金阀门-福建捷斯特阀门制造有限公司 | 氧氮氢联合测定仪-联测仪-氧氮氢元素分析仪-江苏品彦光电 | 四川成人高考_四川成考报名网| 优秀的临床医学知识库,临床知识库,医疗知识库,满足电子病历四级要求,免费试用 | 品牌广告服务平台,好排名,好流量,好生意。 | 食品质构分析仪-氧化诱导分析仪-瞬态法导热系数仪|热冰百科 | 座椅式升降机_无障碍升降平台_残疾人升降平台-南京明顺机械设备有限公司 | MTK核心板|MTK开发板|MTK模块|4G核心板|4G模块|5G核心板|5G模块|安卓核心板|安卓模块|高通核心板-深圳市新移科技有限公司 | 苏州注册公司_苏州代理记账_苏州工商注册_苏州代办公司-恒佳财税 | 有福网(yofus.com)洗照片冲印,毕业聚会纪念册相册制作个性DIY平台 | 丁基胶边来料加工,医用活塞边角料加工,异戊二烯橡胶边来料加工-河北盛唐橡胶制品有限公司 |