英國(guó)《自然》雜志24日發(fā)表一項(xiàng)人工智能研究成果:美國(guó)團(tuán)隊(duì)報(bào)告了一類增強(qiáng)學(xué)習(xí),可回溯過(guò)去、解決復(fù)雜任務(wù),真正改善了對(duì)復(fù)雜環(huán)境的探索方式,有望應(yīng)用于機(jī)器人、語(yǔ)言理解和藥物設(shè)計(jì)領(lǐng)域。這類算法被統(tǒng)稱為“Go-Explore”,其已經(jīng)在一款經(jīng)典游戲的算法挑戰(zhàn)中得分超過(guò)了人類玩家和先進(jìn)的人工智能系統(tǒng)。該成果被認(rèn)為正朝著實(shí)現(xiàn)真正“智能學(xué)習(xí)體”邁出了重要一步。
增強(qiáng)學(xué)習(xí),可讓人工智能系統(tǒng)通過(guò)探索和理解復(fù)雜環(huán)境來(lái)進(jìn)行決策,并學(xué)習(xí)如何以最優(yōu)的方式獲得獎(jiǎng)勵(lì)。獎(jiǎng)勵(lì)可以包括機(jī)器人抵達(dá)特定位置或是在電腦游戲中達(dá)到一定的等級(jí)。然而,當(dāng)遇到很少給予反饋的復(fù)雜環(huán)境時(shí),現(xiàn)階段的加強(qiáng)學(xué)習(xí)算法就很容易碰壁,這讓人工智能專家們非常苦惱。
美國(guó)“OpenAI”是由諸多硅谷巨頭聯(lián)合建立的人工智能非營(yíng)利組織,推動(dòng)者包括美國(guó)創(chuàng)業(yè)孵化器Y Combinator總裁薩姆·阿爾特曼、美國(guó)太空技術(shù)探索公司(SpaceX)創(chuàng)始人埃隆·馬斯克等,其目標(biāo)是希望能夠預(yù)防人工智能的災(zāi)難性影響,并推動(dòng)人工智能發(fā)揮積極作用。此次,“OpenAI”的科學(xué)家艾德蘭·艾克菲特、朱斯特·赫伊津哈及團(tuán)隊(duì),提出了有效探索面臨的兩個(gè)主要障礙,并設(shè)計(jì)了一類算法來(lái)解決這些障礙。
研究人員表示,“Go-Explore”可以對(duì)環(huán)境進(jìn)行全面探索,同時(shí)構(gòu)建一個(gè)檔案庫(kù)來(lái)記住它去過(guò)的地方,確保自己不會(huì)忘記通往有望成功的期中階段或是最終勝利(獎(jiǎng)勵(lì))的路線。其在雅達(dá)利經(jīng)典游戲中的得分,超過(guò)了人類玩家和先進(jìn)的人工智能系統(tǒng),研究人員用這類算法,解決了之前未能解決的2600個(gè)雅達(dá)利游戲,驗(yàn)證了這類算法的潛力。“Go-Explore”在算法挑戰(zhàn)《蒙特祖馬的復(fù)仇》中的得分是之前的4倍,在另一個(gè)算法挑戰(zhàn)《瑪雅人的冒險(xiǎn)》中的得分也超過(guò)了人類玩家的平均水平。而相對(duì)的,此前的算法一分都拿不到。
“Go-Explore”算法還能完成一個(gè)模擬機(jī)器人任務(wù),在這項(xiàng)任務(wù)中,它必須用機(jī)械臂把東西撿起來(lái)并放到4個(gè)架子中的一個(gè)架子上,其中兩個(gè)架子被關(guān)在兩扇門的后面。
研究人員指出,記住并回到有望成功的探索區(qū)域的簡(jiǎn)單原則是一種強(qiáng)大、通用的探索方法。他們認(rèn)為最新的算法有望應(yīng)用于機(jī)器人、語(yǔ)言理解和藥物設(shè)計(jì)。(記者張夢(mèng)然)
2月23日上午消息,在今日開幕的MWC上海上,工信部副部長(zhǎng)劉烈宏發(fā)表主題演講。劉烈宏透露,目前中國(guó)已建成開通71.8萬(wàn)個(gè)5G基站,約占全球70%。SA獨(dú)立組網(wǎng)覆蓋全國(guó)所有地市。中國(guó)5G用戶已超2億,上市218款5G手機(jī),其中售價(jià)2000元以上的中高端手機(jī)占比90%。最后他提出了5G發(fā)展的三個(gè)倡議,一是構(gòu)建產(chǎn)業(yè)生態(tài),加強(qiáng)產(chǎn)業(yè)鏈上下游合... [閱讀]
工業(yè)和信息化部近日印發(fā)通知,支持創(chuàng)建北京、天津(濱海新區(qū))、杭州、廣州、成都國(guó)家人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)(下稱“先導(dǎo)區(qū)”)。這是繼上海(浦東新區(qū))、深圳、濟(jì)南-青島3個(gè)先導(dǎo)區(qū)后,工業(yè)和信息化部發(fā)布的第二批先導(dǎo)區(qū)名單。至此,全國(guó)人工智能先導(dǎo)區(qū)已增至8個(gè)。 上海新興信息通信技術(shù)應(yīng)用研究院首席專家兼副院長(zhǎng)賀仁龍接受第一財(cái)... [閱讀]
2021年2月19日,工業(yè)和信息化部印發(fā)通知,支持創(chuàng)建北京、天津(濱海新區(qū))、杭州、廣州、成都國(guó)家人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)。這是繼上海(浦東新區(qū))、深圳、濟(jì)南-青島3個(gè)先導(dǎo)區(qū)后,工業(yè)和信息化部發(fā)布的第二批先導(dǎo)區(qū)名單。至此,全國(guó)人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)已增至8個(gè)。 工業(yè)和信息化部在發(fā)文中強(qiáng)調(diào),北京國(guó)家人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)要結(jié)合北京... [閱讀]
如果獨(dú)居老人室內(nèi)摔倒,誰(shuí)會(huì)第一個(gè)發(fā)現(xiàn)?可能是家里的Wifi信號(hào)。 無(wú)線通信信號(hào)干擾一直是技術(shù)專家希望解決的問(wèn)題,然而,這種干擾也是人與物互聯(lián)的一種方式。能不能通過(guò)Wifi信號(hào)的變化捕捉并分析出危險(xiǎn)情況,向看護(hù)人發(fā)出警告呢? “85后”教授伍楷舜把信號(hào)干擾這一問(wèn)題變成了解決問(wèn)題的方法。他帶領(lǐng)研究團(tuán)隊(duì)... [閱讀]
2025-07-01
2025-06-24
2025-06-24
2025-06-23
2025-06-23
2025-07-01
2025-06-24
2025-06-24
2025-06-23
2025-06-23