?">

国产一区二区三区中文,黄网av在线,国产精品第2页,国产成人精品国内自产拍免费看

首頁  ?  科學  ?  科學探索

玩躲貓貓游戲 AI學會攻防術

2019-09-19 08:07:19

來源: 科技日報

??? 盡管機器學習在諸如圍棋和Dota?2等復雜游戲中取得了顯著進步,但在這些領域掌握的技能并不一定能推廣到真實場景中實際應用。越來越多的研究人員正在尋求建立一種機器智能,使其行為、學習和進化更像人類。

????總部位于舊金山的OpenAI公司近日發表的一篇新論文提出,在兒童的“躲貓貓”游戲中訓練模型,并在數以千萬計的競賽中使它們相互對抗,可導致模型自動發展出類似人類的行為,從而提高智力并改善后續行動的性能。

????為什么選擇躲貓貓?

????該論文的第一作者、OpenAI研究員博文·貝克認為,躲貓貓被選為一個有趣的起點,主要是因為其規則很簡單。所有游戲中的代理(Agent,也稱智能體,指能自主活動的軟件或硬件實體)都被模擬為球形對象,可執行3種類型的操作:導航、抓住并移動物體、鎖定對象,且只能由該代理的隊友解鎖。

????研究人員在模擬的、物理接地的環境中放置了1—3個“躲藏者”和1—3個“尋找者”,房間的邊界是靜態墻。環境中還包括不同尺寸的可移動箱子和可移動坡道。

????研究人員使用強化學習來訓練游戲代理,并遵循簡單的躲貓貓規則:隱藏者成功躲過尋找者的追逐,或是尋找者成功找到躲藏者。

????AI如何玩躲貓貓?

????在經過數億次的游戲后,AI代理經歷了幾個階段的策略發展過程。

????在初始階段,躲藏者(藍色)和尋找者(紅色)通過在空間中移動而不操縱任何物體,制定了非常粗糙的躲避和追逐策略。

????在經歷2500萬個回合后,游戲變得更加復雜。躲藏者學會了移動和鎖定在環境中的箱子和路障,以在自己周圍建立堡壘,這樣尋找者就永遠看不到它們了。不僅如此,他們還制定了協調戰略,例如相互傳遞物體,以加快建造堡壘的進程。

????然而,在游戲進行了7500萬回合之后,尋找者發現了一個反策略。他們學會了在躲藏者的要塞旁邊移動一個坡道,并用它來爬過墻壁。

????作為回應,躲藏者學會了將坡道移入他們的房間,因此尋找者無法用它來越過墻壁。

????隨著環境變得越來越復雜,躲藏者學會了使用細長箱子建造更強大的“堡壘”。雖然OpenAI認為這將是最終的策略,但在游戲進行到3.8億回合時,尋找者再次成功反擊,找出一種方法來跳到一個盒子上并利用動力在它上面“沖浪”,越過墻壁進入堡壘。

????在最后階段,躲藏者學會在建造堡壘之前鎖定所有箱子,以防止“箱子沖浪”。

????研究人員將這些不同策略的演變稱為“來自多智能體自動課程的緊急技能進展”。“自動課程”這一術語是今年由DeepMind創造的,適用于多個代理逐漸創造新任務以在特定環境中相互挑戰。OpenAI的研究人員認為,這個過程在自然選擇方面具有相似之處。

????這項研究為啥很重要?

????鑒于躲貓貓相對簡單的目標,通過競爭性自我游戲訓練的多個代理學會了使用工具,并采用人類相關技能來獲勝。OpenAI認為,這為未來的智能代理開發和部署提供了一個有前景的研究方向。OpenAI正在開源其代碼和環境,以鼓勵在該領域進一步研究。

????OpenAI的最終目標是構建能夠在一個通用系統中執行多項任務的人工通用智能(AGI)。雖然可能會有不同的目標,但OpenAI正在大力投資由大規模計算能力實現的強化學習研究。OpenAI最近與微軟簽署了一份價值10億美元的為期10年的計算合同。

????躲貓貓游戲研究也激發了OpenAI,因為隨著環境復雜性的增加,游戲中的代理不斷地通過新策略自我適應新的挑戰。貝克表示:“如果擴展像這樣的流程,并將其放入更復雜的環境中,那么你可能會得到足夠復雜的代理,以便為我們解決實際任務。”

????挑戰在哪里?

????游戲代理有時會表現出令人驚訝的行為。例如,躲藏者試圖完全逃離游戲區域,直到研究人員對此施加懲罰。

????其他挑戰可能歸因于模擬環境設計中的物理缺陷。例如,躲藏者了解到,如果他們在拐角處向墻壁推動斜坡,斜坡將由于某種原因穿過墻壁然后消失。這種“作弊”說明了算法的安全性如何在機器學習中發揮關鍵作用。研究人員說:“在它發生之前,你永遠不會知道。這類系統總是存在缺陷。我們所做的基本上是觀察,以便我們可以看到這種奇怪的事情發生,然后試著修復物理缺陷。”

  • 相關閱讀
  • 直道超車,量子通信跑在世界前列

      高冷的量子物理和我們的生活有什么關系?   “其實,過去的一百多年,量子力學的發展,所催生的各種技術已經徹底改變了我們的生活。”中國科學技術大學陸朝陽教授告訴科技日報記者。   時鐘回撥至三年前...

    時間:09-25
  • 田大新:5G普及后將大幅度提高車聯網滲透率

      隨著5G商用啟動,業界期待這項新技術帶給傳統行業新變革。比如對汽車行業而言,這將意味著自動駕駛、車聯網迎來加速和突破,讓整個產業充滿想象空間。   “未來智慧交通的發展趨勢勢必為智能化、網聯化,從...

    時間:09-25
  • 項目密集落地 高端制造業成為外商投資重點

      9月24日,記者從2019世界制造業大會成果新聞發布會上獲悉,大會期間制造業領域外企簽約項目達89個、投資額391億元。其中先進制造業項目40個、投資額118億元;智能終端、集成電路、生物醫藥、新型顯示等戰略性...

    時間:09-25
  • 創新是建設“數字中國”的主動力 ——訪中國工程院院士倪光南

      中國互聯網經歷了波瀾壯闊的開拓歷程,取得了舉世矚目的巨大成就,成為全球互聯網舉足輕重的關鍵力量。如何評價“數字中國”建設取得的斐然成就,下一步自主創新的發力點又在哪里?記者采訪了中國工程院院士...

    時間:09-25
  • 萬物互聯時代更需筑牢安全防線 ——二〇一九年國家網絡安全宣傳周現場采訪見聞

      日前,以“網絡安全為人民,網絡安全靠人民”為主題的2019年國家網絡安全宣傳周在全國31個省、自治區、直轄市統一開展。記者在活動的開幕式、網絡安全博覽會、網絡安全技術高峰論壇以及各分論壇上采訪發現,...

    時間:09-25
  • 共享充電寶告別一元時代?

      “共享充電寶漲價啦?”有媒體曝出,充電寶告別一元時代,“部分充電寶8元每小時”的話題昨天在新浪微博已經沖上1.2億閱讀量。   北京青年報記者在北京隨機抽選了幾個大型商場,對其中店鋪投放的共享充電寶...

    時間:09-25
  • 地球“指紋”指引人類探尋下一個家園

      太陽系外是否有生命?尋找這個問題的答案猶如尋覓一座圣杯。   目前,天文學家已發現4000多顆系外行星,研究這些行星的重要目標之一,就是找到另一個適宜人類居住的星球,為未知的將來尋找下一個家園。...

    時間:09-24
  • 部分暗物質由原始黑洞構成?科學家稱并不排除這種可能性

      科技日報北京9月23日電 (記者張夢然)包括歐核中心(CERN)科學家在內的一個國際團隊,借助超級計算機聚焦大爆炸后瞬間誕生的原始黑洞,再現了光子與氫之間的交互。他們分析后發現,宇宙網是一個由氣體和暗...

    時間:09-24
  • 科技部:新型研發機構應對標市場化薪酬

      記者從科技部網站獲悉,近日科技部印發了《關于促進新型研發機構發展的指導意見》(下稱《意見》)。為深入實施創新驅動發展戰略,推動新型研發機構健康有序發展,提升國家創新體系整體效能,該文件提出十八...

    時間:09-23
  • 距今5000年!良渚文物中發現最古老五角星圖案考古探秘

      對于現代人,尤其是中國人來說,五角星是最熟悉的多邊形了,與此同時五角星在外國也是見慣不驚的圖形,現實生活中它的存在似乎也很平常。它可以莊嚴地出現在許多國家的國旗上,也可以很威嚴地出現在軍人們的...

    時間:09-23
免責聲明:本網對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。 本網站轉載圖片、文字之類版權申明,本網站無法鑒別所上傳圖片或文字的知識版權,如果侵犯,請及時通知我們,本網站將在第一時間及時刪除。
主站蜘蛛池模板: 扬中市| 平阴县| 山阴县| 新蔡县| 穆棱市| 通城县| 获嘉县| 松潘县| 昭通市| 灵宝市| 穆棱市| 商南县| 上饶县| 聂荣县| 长宁区| 宣恩县| 竹溪县| 镇雄县| 布尔津县| 邹平县| 浙江省| 瓦房店市| 万全县| 大港区| 从江县| 博乐市| 白朗县| 长春市| 鹤峰县| 平定县| 灵川县| 双辽市| 恩施市| 青龙| 南康市| 从化市| 登封市| 蒙阴县| 临海市| 成安县| 延边|