国产麻豆精品福利在线观看,亚洲人亚洲精品成人网站,亚洲熟妇无码AV另类VR影视,欧美A级毛欧美1级A大片免费播放

您的位置:首頁(yè) > 管理 >

微軟使用微笑訓(xùn)練AI 人們?cè)诿詫m的碰撞次數(shù)減少29%

2020-02-02 09:56:25 來(lái)源: it之家

我們生活在一個(gè)人工智能爆炸發(fā)展的年代——每隔一小段時(shí)間,研究人員們就會(huì)想出新奇的人工智能訓(xùn)練方式。這不,微軟研究院的計(jì)算機(jī)學(xué)家最近就創(chuàng)

我們生活在一個(gè)人工智能爆炸發(fā)展的年代——每隔一小段時(shí)間,研究人員們就會(huì)想出新奇的人工智能訓(xùn)練方式。

這不,微軟研究院的計(jì)算機(jī)學(xué)家最近就創(chuàng)造了一種用人類(lèi)情緒來(lái)訓(xùn)練機(jī)器自我學(xué)習(xí)的方法。

該研究使用虛擬代理人來(lái)輔助機(jī)器在虛擬環(huán)境中學(xué)習(xí)。研究中極具意義的一點(diǎn)是,它使用了人與系統(tǒng)交互時(shí)產(chǎn)生的微笑來(lái)訓(xùn)練AI。

這項(xiàng)研究的背后其實(shí)是強(qiáng)化學(xué)習(xí)

強(qiáng)化學(xué)習(xí)非常適用于教學(xué)系統(tǒng)來(lái)訓(xùn)練機(jī)器完成一系列的任務(wù)。在這項(xiàng)研究中,應(yīng)用主要著重于計(jì)算機(jī)視覺(jué)的相關(guān)任務(wù)。

強(qiáng)化學(xué)習(xí)的工作原理是通過(guò)讓虛擬代理人(agent)在模擬環(huán)境中反復(fù)執(zhí)行任務(wù),再將經(jīng)驗(yàn)提取成策略。用這種方法訓(xùn)練系統(tǒng)來(lái)玩游戲在幾年前十分流行,甚至更先進(jìn)的算法擊敗了圍棋世界冠軍李世石。

強(qiáng)化學(xué)習(xí)的關(guān)鍵在于它嚴(yán)重依賴(lài)于代理人通過(guò)在虛擬環(huán)境中探索得到的數(shù)據(jù),該數(shù)據(jù)就是該研究的核心。

微軟研究人員希望采用常規(guī)方法來(lái)構(gòu)建一個(gè)極具探索能力的代理人。為了實(shí)現(xiàn)這一點(diǎn),他們使用了另一項(xiàng)技術(shù)——模仿學(xué)習(xí),即通過(guò)使系統(tǒng)與人在模擬環(huán)境中進(jìn)行交互來(lái)完成訓(xùn)練。

研究者認(rèn)為,最好的提煉人類(lèi)探索方式的方法就是通過(guò)捕捉真實(shí)人類(lèi)與系統(tǒng)交互的瞬間?;谥皩⒄媲榫w與好奇心進(jìn)行關(guān)聯(lián)并應(yīng)用于機(jī)器學(xué)習(xí)的研究,研究人員構(gòu)建了一個(gè)用于發(fā)現(xiàn)這些情緒的系統(tǒng)。

最終,他們構(gòu)建了一個(gè)能夠記錄人們?cè)谀M迷宮環(huán)境中駕駛時(shí)產(chǎn)生的微笑表情的系統(tǒng)。經(jīng)過(guò)多次系統(tǒng)測(cè)試后,研究人員發(fā)現(xiàn)這個(gè)基于情緒的強(qiáng)化學(xué)習(xí)系統(tǒng)使代理人的探索持續(xù)時(shí)間延長(zhǎng)了51%,探索范圍擴(kuò)大了46%,在迷宮中碰撞的次數(shù)減少了29%。

基于情緒的強(qiáng)化學(xué)習(xí)

使用情緒反饋例如微笑來(lái)訓(xùn)練機(jī)器的意義在于,情緒反應(yīng)了人類(lèi)的內(nèi)在反饋,這一反饋能夠在今后拓展應(yīng)用到更多領(lǐng)域,而不拘泥于該項(xiàng)研究。另一個(gè)在使用強(qiáng)化學(xué)習(xí)時(shí)需要注意的地方是,代理人與模擬環(huán)境的交互很大程度上受系統(tǒng)設(shè)計(jì)者選擇的特定獎(jiǎng)勵(lì)機(jī)制影響。如果你想訓(xùn)練一個(gè)系統(tǒng)使其在游戲中獲勝,那么你就需要在得分時(shí)給予獎(jiǎng)勵(lì)。

但問(wèn)題是,生活中發(fā)生的事情并不總是能夠輕易用分?jǐn)?shù)量化。因此,找到明確的獎(jiǎng)勵(lì)機(jī)制是強(qiáng)化學(xué)習(xí)研究中的挑戰(zhàn)之一。

通過(guò)將微笑定義為正反饋,研究人員發(fā)現(xiàn)了一個(gè)訓(xùn)練人工智能系統(tǒng)的普適化反饋機(jī)制,并且這種情緒反饋是較容易獲得的。

基于情緒的強(qiáng)化學(xué)習(xí)本質(zhì)上是在人類(lèi)這一數(shù)億年才形成的智慧生物基礎(chǔ)之上進(jìn)行的,它使我們能夠快速輕松地量化各種體驗(yàn)感受。通過(guò)有效的調(diào)整,該信號(hào)可在訓(xùn)練機(jī)器進(jìn)行學(xué)習(xí)的過(guò)程中做為一種強(qiáng)大的、可擴(kuò)展性極強(qiáng)的反饋機(jī)制。

情緒AI在市場(chǎng)中的應(yīng)用

除了研究團(tuán)隊(duì)使用的開(kāi)源微笑探測(cè)工具外,還有許多商業(yè)公司也在做這項(xiàng)工作,例如Affectiva公司和Emotient公司(于2016年被蘋(píng)果公司收購(gòu))。情緒追蹤工具在市場(chǎng)中被稱(chēng)為“情緒AI”。微軟的這項(xiàng)研究賦予了這些工具新的應(yīng)用,即可作為基于情緒的強(qiáng)化學(xué)習(xí)的數(shù)據(jù)來(lái)源。

AI在許多領(lǐng)域都可以從人身上習(xí)得知識(shí),尤其是服務(wù)性經(jīng)濟(jì)領(lǐng)域。例如谷歌、奈飛和亞馬遜這些公司都在使用用戶數(shù)據(jù)來(lái)自動(dòng)服務(wù)于用戶。我們?cè)谑褂眠@些強(qiáng)大的技術(shù)平臺(tái)時(shí),產(chǎn)生了的大量的數(shù)據(jù),這些數(shù)據(jù)可用于訓(xùn)練機(jī)器學(xué)習(xí)系統(tǒng),從而使這些平臺(tái)變得更智能、更強(qiáng)大。

基于情緒的強(qiáng)化學(xué)習(xí)的應(yīng)用將為這些平臺(tái)開(kāi)啟新的篇章。強(qiáng)化學(xué)習(xí)本身就尤其擅長(zhǎng)學(xué)習(xí)如何優(yōu)化一系列的任務(wù)。而業(yè)務(wù)流程的本質(zhì)就是一系列的任務(wù),并且業(yè)務(wù)流程就是公司為客戶創(chuàng)造價(jià)值的核心。在業(yè)務(wù)流程中使用強(qiáng)化學(xué)習(xí)主導(dǎo)這些任務(wù)的挑戰(zhàn)在于保障可靠的反饋信息來(lái)源。

類(lèi)似微笑或其它表情的反饋信息來(lái)源眾多,這要?dú)w功于無(wú)處不在的攝像頭。正如研究人員所指出的,這項(xiàng)技術(shù)也可以擴(kuò)展使用“其他生理信號(hào)”,這意味著像亞馬遜和谷歌等收集的聲音數(shù)據(jù)也可以用于訓(xùn)練機(jī)器。就像今天,電話可能被錄音用于訓(xùn)練和通話質(zhì)量評(píng)估。這項(xiàng)技術(shù)使得被訓(xùn)練的不再是員工,而是智能軟件代理人。

情緒將我們與機(jī)器相連結(jié)

這些系統(tǒng)究竟從人與他們的交互中學(xué)習(xí)到了什么呢?如果交互是通過(guò)建立關(guān)系并使用這些關(guān)系,那么機(jī)器就會(huì)在與我們交互的過(guò)程中學(xué)習(xí)如何與我們建立聯(lián)系以及如何為我們服務(wù)。

情緒AI能夠幫助機(jī)器更好的與我們建立連結(jié)。目前,基于這些技術(shù)構(gòu)建了一種探測(cè)情緒的傳感器,該傳感器可用于市場(chǎng)營(yíng)銷(xiāo)以及改善事物性能,例如汽車(chē)。

今后,這些技術(shù)將把重點(diǎn)擴(kuò)展到與終端用戶建立密切關(guān)系??梢韵胂笪磥?lái)我們會(huì)通過(guò)與模擬角色進(jìn)行交互來(lái)使用產(chǎn)品或享受服務(wù)。今天的聊天機(jī)器人或代理人像Siri和Alexa只是早期的例子。終有一天,你將和你的運(yùn)動(dòng)鞋或你的牙刷建立連結(jié)。

微軟這項(xiàng)研究有趣創(chuàng)新的地方在于,它提出了情緒AI新的應(yīng)用,即通過(guò)使用一種類(lèi)似于大腦的情感信號(hào)來(lái)訓(xùn)練情緒AI。在心理學(xué)上,效價(jià)衡量了我們對(duì)某種經(jīng)歷的情緒反應(yīng)是吸引還是厭惡。

當(dāng)孩子觸碰到火爐時(shí),會(huì)產(chǎn)生強(qiáng)烈的負(fù)效價(jià),從而在大腦中留下有效的學(xué)習(xí)信號(hào)。同樣,基于情緒的強(qiáng)化學(xué)習(xí)也可以使用這種有效的機(jī)制,用相似的情緒效價(jià)來(lái)驅(qū)動(dòng)機(jī)器學(xué)習(xí)。

在目前的大背景下,這項(xiàng)研究最有趣的地方在于,地球上古老生物的智慧已成為人工智能發(fā)展的溫床。

情緒是強(qiáng)大的老師,而這項(xiàng)新的研究指出了向這位老師學(xué)習(xí)的方法。(大萌、錢(qián)天培)

關(guān)鍵詞: 微軟 微笑 AI

精選 導(dǎo)讀

募資55億港元萬(wàn)物云啟動(dòng)招股 預(yù)計(jì)9月29日登陸港交所主板

萬(wàn)科9月19日早間公告,萬(wàn)物云當(dāng)日啟動(dòng)招股,預(yù)計(jì)發(fā)行價(jià)介乎每股47 1港元至52 7港元,預(yù)計(jì)9月29日登陸港交所主板。按發(fā)行1 167億股計(jì)算,萬(wàn)

發(fā)布時(shí)間: 2022-09-20 10:39
管理   2022-09-20

公募基金二季度持股情況曝光 隱形重倉(cāng)股多為高端制造業(yè)

隨著半年報(bào)披露收官,公募基金二季度持股情況曝光。截至今年二季度末,公募基金全市場(chǎng)基金總數(shù)為9794只,資產(chǎn)凈值為269454 75億元,同比上

發(fā)布時(shí)間: 2022-09-02 10:45
資訊   2022-09-02

又有上市公司宣布變賣(mài)房產(chǎn) 上市公司粉飾財(cái)報(bào)動(dòng)作不斷

再有上市公司宣布變賣(mài)房產(chǎn)。四川長(zhǎng)虹25日稱(chēng),擬以1 66億元的轉(zhuǎn)讓底價(jià)掛牌出售31套房產(chǎn)。今年以來(lái),A股公司出售房產(chǎn)不斷。根據(jù)記者不完全統(tǒng)

發(fā)布時(shí)間: 2022-08-26 09:44
資訊   2022-08-26

16天12連板大港股份回復(fù)深交所關(guān)注函 股份繼續(xù)沖高

回復(fù)交易所關(guān)注函后,大港股份繼續(xù)沖高。8月11日大港股份高開(kāi),隨后震蕩走高,接近收盤(pán)時(shí)觸及漲停,報(bào)20 2元 股。值得一提的是,在7月21日

發(fā)布時(shí)間: 2022-08-12 09:56
資訊   2022-08-12

萬(wàn)家基金再添第二大股東 中泰證券擬受讓11%基金股權(quán)

7月13日,中泰證券發(fā)布公告,擬受讓齊河眾鑫投資有限公司(以下簡(jiǎn)稱(chēng)齊河眾鑫)所持有的萬(wàn)家基金11%的股權(quán),交易雙方共同確定本次交易的標(biāo)的資

發(fā)布時(shí)間: 2022-07-14 09:39
管理   2022-07-14

央行連續(xù)7日每天30億元逆回購(gòu) 對(duì)債市影響如何?

央行12日再次開(kāi)展了30億元逆回購(gòu)操作,中標(biāo)利率2 10%。這已是央行連續(xù)7日每天僅進(jìn)行30億元的逆回購(gòu)縮量投放,創(chuàng)下去年1月以來(lái)的最低操作規(guī)

發(fā)布時(shí)間: 2022-07-13 09:38
資訊   2022-07-13

美元指數(shù)創(chuàng)近20年新高 黃金期貨創(chuàng)出逾9個(gè)月新低

由于對(duì)美聯(lián)儲(chǔ)激進(jìn)加息的擔(dān)憂,美元指數(shù)11日大漲近1%創(chuàng)出近20年新高。受此影響,歐美股市、大宗商品均走弱,而黃金期貨創(chuàng)出逾9個(gè)月新低。美

發(fā)布時(shí)間: 2022-07-13 09:36
資訊   2022-07-13

美股三大股指全線下跌 納斯達(dá)克跌幅創(chuàng)下記錄以來(lái)最大跌幅

今年上半年,美股持續(xù)回落。數(shù)據(jù)顯示,道瓊斯指數(shù)上半年下跌15 3%,納斯達(dá)克綜合指數(shù)下跌29 5%,標(biāo)普500指數(shù)下跌20 6%。其中,納斯達(dá)克連續(xù)

發(fā)布時(shí)間: 2022-07-04 09:51
推薦   2022-07-04

融資客熱情回升 兩市融資余額月內(nèi)增加超344億元

近期A股走強(qiáng),滬指6月以來(lái)上漲4%,融資客熱情明顯回升。數(shù)據(jù)顯示,截至6月16日,兩市融資余額1 479萬(wàn)億元,月內(nèi)增加344 67億元,最近一個(gè)半

發(fā)布時(shí)間: 2022-06-20 09:41
資訊   2022-06-20

4個(gè)交易日凈買(mǎi)入超百億元 北向資金持續(xù)流入A股市場(chǎng)

北向資金凈流入態(tài)勢(shì)延續(xù)。繼6月15日凈買(mǎi)入133 59億元后,北向資金6月16日凈買(mǎi)入44 52億元。自5月27日至今,除6月13日以外,北向資金累計(jì)凈

發(fā)布時(shí)間: 2022-06-17 09:37
推薦   2022-06-17

熱門(mén)TAG

more
美聯(lián)儲(chǔ)今年已將基準(zhǔn)利率從接近零大幅上調(diào)至略高于3% EIA報(bào)告:美國(guó)原油庫(kù)存及戰(zhàn)略?xún)?chǔ)備減少,汽油及精煉油庫(kù)存輕微波動(dòng) 美國(guó)政府更廣泛推動(dòng)從汽油動(dòng)力汽車(chē)轉(zhuǎn)向電動(dòng)汽車(chē)的一部分 數(shù)據(jù)顯示:今年9月日本船企接單量延續(xù)8月下跌下跌趨勢(shì) 公告顯示:2022年前三季度TCL中環(huán)研發(fā)投入為27億元 占比營(yíng)業(yè)收入5.42% 新的111.75億英鎊注資列在“對(duì)金融機(jī)構(gòu)的援助—支付給英格蘭銀行”標(biāo)題下 本次政府儲(chǔ)備肉投放面向北京18家主要連鎖超市門(mén)店及相關(guān)零售終端投放 有交易員預(yù)計(jì):如果LME不采取措施 接下來(lái)可能將有數(shù)十萬(wàn)噸鋁流入LME 據(jù)報(bào)道:繼德國(guó)最大釀酒商拉德貝格啤酒公司9月宣布漲價(jià) 據(jù)報(bào)道:澳大利亞礦商Pilbara的鋰礦拍賣(mài)價(jià)再創(chuàng)新高 折算后的碳酸鋰成本 中集天達(dá)首次公開(kāi)發(fā)行A股股票 招股書(shū)顯示此次擬公開(kāi)發(fā)行股數(shù)不超過(guò)103, 多家銀行加強(qiáng)綠色金融頂層設(shè)計(jì) 致力于為經(jīng)濟(jì)社會(huì)綠色低碳轉(zhuǎn)型貢獻(xiàn)力量 萊特幣 比特幣 數(shù)字資產(chǎn) 火幣 以太經(jīng)典 比特股 EOS 比特幣現(xiàn)金 量子鏈 Hcash 泰達(dá)幣 瑞波幣 Qcash 比特幣鉆石 超級(jí)比特幣 優(yōu)幣 硬分叉 加密貨幣