狠狠操夜夜甜|人妻在线中文字幕亚洲无码不卡av|一区二区欧美亚洲|日躁夜躁狠狠躁2001|亚洲,超碰,欧美|18AV成人电影|午夜成人免费在线|婷婷激情网深爱五月|色欲综合成人在线|在线美女搞黄大片

中企動力 > 頭條 > 具體的

網(wǎng)站性能檢測評分

注:本網(wǎng)站頁面html檢測工具掃描網(wǎng)站中存在的基本問題,僅供參考。

具體的

智能體到底是什么?這里有一篇詳細解讀 - iDoNews 推廣視頻課程

img

葡萄

關(guān)注

圖:pixabay

原文來源:medium

作者:PrashantGupta

「機器人圈」編譯:嗯~阿童木呀、多啦A亮

根據(jù)我們希望實現(xiàn)的目標(biāo)以及衡量其成功的標(biāo)準(zhǔn),我們可以采用多種方法來創(chuàng)建人工智能。它涵蓋的范圍極其廣泛,從自動駕駛和機器人這樣非常復(fù)雜的系統(tǒng),到諸如人臉識別、機器翻譯和電子郵件分類這些我們?nèi)粘I畹某R姴糠郑伎梢詣潪槿斯ぶ悄艿念I(lǐng)域范疇之內(nèi)。

閱讀完下面這篇文章,也許你就會了解真正創(chuàng)建人工智能所需要的東西有哪些。

《你真的知道什么是人工智能嗎》

(https://hackernoon.com/so-you-think-you-know-what-is-artificial-intelligence-6928db640c42)

你所采用的路徑將取決于你的AI的目標(biāo)是什么,以及你對各種方法的復(fù)雜性和可行性的理解程度。在本文中,我們將討論那些被認(rèn)為對科學(xué)發(fā)展更為可行和普遍的方法,即對理性/智能體設(shè)計的研究。

什么是智能體?

?通過傳感器感知其周圍環(huán)境

?通過執(zhí)行器對其進行操作

它將在感知、思考和行動的周期中往返運行。以人類為例,我們是通過人類自身的五個感官(傳感器)來感知環(huán)境的,然后我們對其進行思考,繼而使用我們的身體部位(執(zhí)行器)去執(zhí)行操作。類似地,機器智能體通過我們向其提供的傳感器來感知環(huán)境(可以是相機、麥克風(fēng)、紅外探測器),然后進行一些計算(思考),繼而使用各種各樣的電機/執(zhí)行器來執(zhí)行操作。現(xiàn)在,你應(yīng)該清楚在你周圍的世界充滿了各種智能體,如你的手機、真空清潔器、智能冰箱、恒溫器、相機,甚至你自己。

什么是IntelligentAgent?

IntelligentAgent是這樣一種智能體,給定它所感知到的和它所擁有的先驗知識,以一種被期望最大化其性能指標(biāo)的方式運行。

此類智能體也被稱之為理性智能體(RationalAgent)。智能體的合理性是通過其性能指標(biāo),其擁有的先驗知識,它可以感知的環(huán)境及其可以執(zhí)行的操作來衡量的。

IntelligentAgent的上述屬性通常歸結(jié)于術(shù)語PEAS(Performance,Environment,ActuatorsandSensors),其代表了性能、環(huán)境、執(zhí)行器和傳感器。所以,以一輛自動駕駛汽車為例,它應(yīng)該具有以下PEAS:

?性能:安全性、時間、合法駕駛、舒適性。

?環(huán)境:道路、其他汽車、行人、路標(biāo)。

?執(zhí)行器:轉(zhuǎn)向、加速器、制動器、信號、喇叭。

?傳感器:相機、聲納、GPS、速度計、里程計、加速度計、發(fā)動機傳感器、鍵盤。

為了滿足現(xiàn)實世界中的使用情況,人工智能本身需要有廣泛的IntelligentAgent。這就引入了我們所擁有的智能體類型及環(huán)境的多樣性。接下來我們一起來看看。

環(huán)境類型

如果想要設(shè)計一個合理性智能體,那么就必須牢記它將要使用的環(huán)境類型,即以下幾種類型:

?完全可觀察和部分可觀察:如果是完全可觀察的,智能體的傳感器可以在每個時間點訪問環(huán)境的完整狀態(tài),否則不能。例如,國際象棋是一個完全可觀察的環(huán)境,而撲克則不是。

?確定性和隨機性:環(huán)境的下一個狀態(tài)完全由當(dāng)前狀態(tài)和由智能體接下來所執(zhí)行的操作決定的。(如果環(huán)境是確定性的,而其他智能體的行為不確定,那么環(huán)境是隨機性的)。隨機環(huán)境在本質(zhì)上是隨機的,不能完全確定。例如,8數(shù)碼難題(8-puzzle)這個在線拼圖游戲有一個確定性的環(huán)境,但無人駕駛的汽車沒有。

?靜態(tài)和動態(tài):當(dāng)智能體在進行協(xié)商(deliberate)時,靜態(tài)環(huán)境沒有任何變化。(環(huán)境是半動態(tài)的,環(huán)境本身并沒有隨著時間的流逝而變化,但智能體的性能得分則是會發(fā)生相應(yīng)變化的)。另一方面,動態(tài)環(huán)境卻改變了。西洋雙陸棋具有靜態(tài)環(huán)境,而掃地機器人roomba具有動態(tài)環(huán)境。

?離散和連續(xù):有限數(shù)量的明確定義的感知和行為,構(gòu)成了一個離散的環(huán)境。例如,跳棋就是離散環(huán)境的一個范例,而自動駕駛汽車則需要在連續(xù)環(huán)境下運行。

?單一智能體和多智能體:僅有自身操作的智能體本身就有一個單一智能體環(huán)境。但是如果還有其他智能體包含在內(nèi),那么它就是一個多智能體環(huán)境。自動駕駛汽車就具有多智能體環(huán)境。

還存在著其他類型的環(huán)境,情景和順序,已知和未知,這些定義了智能體的范圍。

智能體的類型

一般有4種類型的智能體,根據(jù)智能水平或其能夠執(zhí)行任務(wù)的復(fù)雜性不同而區(qū)分。所有類型都可以隨著時間的推移改進性能并產(chǎn)生更好的操作。這些可以概括為學(xué)習(xí)智能體(learningagents)。

單反射性智能體(Simplereflexagents)

這些選擇操作僅基于當(dāng)前狀態(tài),忽略感知歷史。

如果環(huán)境完全可觀察到,或者正確的行為是基于目前的感知,它們才能工作。

基于模型的反射性智能體(Model-basedreflexagents)

智能體跟蹤部分可觀察的環(huán)境。這些內(nèi)部狀態(tài)取決于感知歷史。環(huán)境/世界的建模是基于它如何從智能體中獨立演化,以及智能體行為如何影響世界。

基于目標(biāo)的智能體(Goal-basedagents)

這是對基于模型的智能體的改進,并且在知道當(dāng)前環(huán)境狀態(tài)不足的情況下使用。智能體將提供的目標(biāo)信息與環(huán)境模型相結(jié)合,選擇實現(xiàn)該目標(biāo)的行動。

基于效用的智能體(Utility-basedagents)

對基于目標(biāo)的智能體進行改進,在實現(xiàn)預(yù)期目標(biāo)方面有所幫助是不夠的。我們可能需要考慮成本。例如,我們可能會尋找更快、更安全、更便宜的旅程到達目的地。這由一個效用函數(shù)標(biāo)記。效用智能體將選擇使期望效用最大化的操作。

學(xué)習(xí)智能體(LearningAgents)

學(xué)習(xí)要素:負(fù)責(zé)改進

性能要素:負(fù)責(zé)選擇外部行為,這是截至目前我們通常認(rèn)為的智能體。

評論:關(guān)于確定的性能標(biāo)準(zhǔn),智能體做得如何?

問題生成器:允許智能體探索。

內(nèi)部狀態(tài)表示

隨著智能體的復(fù)雜化,內(nèi)部結(jié)構(gòu)也越來越復(fù)雜。它們存儲內(nèi)部狀態(tài)的方式也發(fā)生變化。由于其性質(zhì),簡單的反射型智能體不需要存儲狀態(tài),其他類型則需要。下面的圖像提供智能體狀態(tài)的高級別表示,按表示能力增長順序排列(從左到右)。

?原子表示法(Atomicrepresentation):在這種情況下,狀態(tài)存儲為黑箱,即沒有任何內(nèi)部結(jié)構(gòu)。例如,對于Roomba(機器人真空吸塵器),內(nèi)部狀態(tài)是已經(jīng)進行了真空的補丁,您不必了解任何其他內(nèi)容。如圖所示,這種表示適用于基于模型和目標(biāo)的智能體,并用于各種AI算法,例如搜索問題和對抗游戲。

?因素化表示法(FactoredRepresentation):在這種表示中,狀態(tài)不再是黑箱。它現(xiàn)在具有屬性值對,也稱為可以包含值的變量。例如,在找到一條路線時,你有GPS位置以及油箱中的油量值。這為問題增加了一個約束。如圖所示,這種表示適用于基于目標(biāo)的智能體,并用于各種AI算法,如約束滿足(constraintsatisfaction)和貝葉斯網(wǎng)絡(luò)(bayesiannetworks)。

?結(jié)構(gòu)化表示法(StructuredRepresentation):在這種表示中,我們在變量/因子狀態(tài)之間有關(guān)系,這在AI算法中引發(fā)邏輯。例如,在自然語言處理中,陳述是否在語句中包含對某人的引用,以及該語句中的形容詞是否形容該人。這些陳述關(guān)系將決定這個陳述是否是諷刺的(sarcastic)。這是高級別的人工智能,用于一階邏輯、基于知識的學(xué)習(xí)和自然語言理解的算法。

對于人工智能來說,這些理性智能體還有很多,這只是一個概述。正如你所知道的,理性智能體的設(shè)計研究是人工智能的重要組成部分,因為它在各種領(lǐng)域中有著廣泛的應(yīng)用。但是,這些智能體不能獨立工作,他們需要一個人工智能算法來驅(qū)動它們。這些算法大多涉及搜索。很快,我就會寫一些關(guān)于驅(qū)動理性智能體的AI算法,以及在AI中使用機器學(xué)習(xí)的文章。

AlphaGo對局李世石兩周年紀(jì):AI程序攻克圍棋的算法秘密 - iDoNews 行業(yè)視頻課程

img

王雁

關(guān)注
這篇文章的主角是AlphaGo,谷歌DeepMind團隊開發(fā)出的圍棋AI。其憑借著2016年擊敗全球頂尖棋手李世石的壯舉而廣受矚目。圍棋是一種古老的棋類游戲,每一步都存在諸多選擇,因此接下來的落子位置很參議會預(yù)測——要求對弈棋手擁有強大的直覺與抽象思維能力。正因為如此,人們長久以來一直認(rèn)為只有人類擅長下圍棋。大多數(shù)研究人員甚至認(rèn)定,還需要數(shù)十年才會出現(xiàn)真正具備這種思考能力的AI。但如今距離AlphaGo對李世石的比賽已經(jīng)過去了兩年(3月8日至3月15日),而本篇文章正是為了紀(jì)念這個偉大的日子!

不過更可怕的是,AlphaGo并沒有停止自己的前進腳步。8個月之后,它在某圍棋網(wǎng)站上以“Master”為名與全球各地的冠軍棋手進行了60盤職業(yè)對弈,且拿下全勝成績。

這當(dāng)然是人工智能領(lǐng)域的一項巨大成就,并在全球引起了一股新的討論熱潮——我們到底該對人工智能的發(fā)展速度感到興奮,還是擔(dān)心?

今天,我們將以DeepMind在《自然》雜志上發(fā)表的原始研究論文作為基礎(chǔ),逐段對其內(nèi)容進行簡單清晰的解讀,詳細介紹AlphaGo是什么以及它的工作原理。我也希望大家能夠在閱讀本文之后,不再被媒體頭條拋出的聳人聽聞的標(biāo)題所恐嚇,而真正對關(guān)于人工智能的發(fā)展感到振奮。

當(dāng)然,你不需要掌握圍棋技巧,也同樣可以理解本文的觀點。事實上,我本人只讀過網(wǎng)絡(luò)百科上的一丁點圍棋說明。相反,我其實會使用基礎(chǔ)的國際象棋示例來解釋相關(guān)算法。大家只需要了解雙人棋類游戲的基本規(guī)則即可——每位選手輪流行動,最后將產(chǎn)生一位贏家。除此之外,你不需要了解任何物理學(xué)或高數(shù)知識。

這樣盡可能降低入門門檻,是為了能讓剛剛接觸機器學(xué)習(xí)或者神經(jīng)網(wǎng)絡(luò)的朋友更容易接受。本文也刻意降低了表述復(fù)雜度,也是希望大家能把注意力盡量集中在內(nèi)容本身。

內(nèi)容摘要

眾所周知,AlphaGo項目的目標(biāo)在于建立一款A(yù)I程序,并保證其能夠與世界頂級人類選手在圍棋領(lǐng)域一較高下。

為了理解圍棋帶來的挑戰(zhàn),我們首先聊聊與之類似的另一種棋類運動——國際象棋。早在上世紀(jì)九十年代初,IBM公司出打造出深藍計算機,其在國際象棋比賽中擊敗了偉大的世界冠軍加里·卡斯帕羅夫。那么,深藍是如何做到這一點的?

事實上,深藍使用了一種非常“暴力”的作法。在游戲的每一步,深藍都會對所有可能作出的合理棋步作出考量,并沿著每種棋步探索以分析未來的局勢變化。在這樣的前瞻性分析之下,計算結(jié)果很快形成一種千變?nèi)f化的巨大決策樹。在此之后,深藍會沿著樹狀結(jié)構(gòu)返回原點,觀察哪些棋步最可能帶來積極的結(jié)果。然而,何謂“積極的結(jié)果”?事實上,眾多優(yōu)秀的國際象棋棋手為深藍精心設(shè)計出了國際象棋策略,旨在幫助其作出更好的決策——舉例來說,是決定保護國王,還是在盤面的其它位置獲得優(yōu)勢?他們針對此類目的構(gòu)建起特定的“評估算法”,從而比較不同盤面位置的優(yōu)勢或劣勢權(quán)重(IBM公司將專家們的象棋策略以硬編碼形式引入該評估函數(shù))。最終,深藍會據(jù)此選擇出經(jīng)過精心計算的棋步。在接下來的回合中,整個過程再次重復(fù)。

這意味著,深藍在每一步之前都會考量數(shù)百萬個理論位置。因此,深藍最令人印象深刻的表現(xiàn)并不在于人工智能軟件層面,而體現(xiàn)在其硬件之上——IBM公司宣稱,深藍是當(dāng)時市場上最為強大的計算機之一。其每秒能夠計算2億個盤面位置。

現(xiàn)在讓我們回到圍棋方面。圍棋顯然更為開放,因此如果在這里重復(fù)深藍的戰(zhàn)略,將根本無法獲得理想效果。由于每個棋步都擁有過多可選擇的位置,因此計算機根本無法涵蓋這么多潛在的可能性。舉例來說,在國際象棋的開局當(dāng)中,只有20種可能的下法;但在圍棋方面,先手選手將擁有361個可能的落子點——而且這種選擇范圍在整個對弈過程中一直非常廣泛。

這就是所謂“巨大搜索空間”。而且在圍棋當(dāng)中,判斷某個特定盤面位置的有利或不利權(quán)重并沒那么容易——在官子階段,雙方甚至還需要再排布一陣才能最終確定誰才是勝利者。但有沒有一種神奇的方法能夠讓計算機在圍棋領(lǐng)域有所建樹?答案是肯定的,深度學(xué)習(xí)能夠完成這項艱巨的任務(wù)!

因此在本次研究當(dāng)中,DeepMind方面利用神經(jīng)網(wǎng)絡(luò)來完成以下兩項任務(wù)。他們訓(xùn)練了一套“策略神經(jīng)網(wǎng)絡(luò)(policyneuralnetwork)”以決定哪些才是特定盤面位置當(dāng)中最為明智的選項(這類似于遵循某種直觀策略選擇移動位置)。此外,他們還訓(xùn)練了一套“估值神經(jīng)網(wǎng)絡(luò)(valueneuralnetwork)”以估算特定盤面布局對選手的有利程度(或者說,下在這個位置對贏得游戲這一目標(biāo)的實際影響)。他們首先使用人類棋譜對這些神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練(也就是最傳統(tǒng)但也非常有效的監(jiān)督式學(xué)習(xí)方法)。經(jīng)歷了這樣的訓(xùn)練,我們的人工智能已經(jīng)可以在一定程度上模仿人類的下棋方式——這時的它,就像一位菜鳥級人類選手。而后,為了進一步訓(xùn)練神經(jīng)網(wǎng)絡(luò),DeepMind方面讓AI與自己進行數(shù)百萬次對弈(也就是“強化學(xué)習(xí)”的部分)。如此一來,憑借著更為充分的練習(xí),AI的棋力得到了極大提升。

憑借這兩套網(wǎng)絡(luò),DeepMind的人工智能方案就足以擁有等同于此前最先進的圍棋程序的棋藝水平。二者的區(qū)別在于,原有程序使用了此前更為流行的預(yù)置游戲算法,即“蒙特卡洛樹搜索(MonteCarloTreeSearch,簡稱MCTS)”,我們將在稍后具體進行介紹。

不過很明顯,到這里我們還沒有談到真正的核心。DeepMind的人工智能方案絕不僅僅依賴于策略與估值網(wǎng)絡(luò)——其并非利用這兩套網(wǎng)絡(luò)來替代蒙特卡洛樹搜索;相反,其使用神經(jīng)網(wǎng)絡(luò)以進一步提升MCTS算法的成效。實際結(jié)果也確實令人滿意——MCTS的表現(xiàn)達到了超人的高度。這種經(jīng)過改進的MCTS變種正是“AlphaGo”,其成功擊敗了李世石,并成為人工智能發(fā)展歷史上最大的突破之一。

下面我們真正開始對論文內(nèi)容的理解,首先是其中使用的游戲策略——蒙特卡洛樹搜索算法。其實說到這里,大家對其已經(jīng)擁有了基本認(rèn)識,足以順利理解本篇文章的內(nèi)容。但如果你希望深入了解更多細節(jié),請參閱以下優(yōu)秀的視頻與博客文章:

1.Udacity提供的系列短片(https://www.youtube.com/watch?v=onBYsen2_eA)

2.JeffBradberry的MCTS解讀(https://jeffbradberry.com/posts/2015/09/intro-to-monte-carlo-tree-search/)

3.FullstackAcademy提供的MCTS教程(https://www.youtube.com/watch?v=Fbs4lnGLS8M)

下面讓我們回想一下本文的第一段內(nèi)容。上述提到,深藍計算機是如何在國際象棋的每一步當(dāng)中構(gòu)建起包含數(shù)以百萬計盤面位置與棋步的決策樹——計算機需要進行模擬、觀察并比較每一種可能的落點——這是一種簡單且非常直接的方法,如果一般的軟件工程師必須要設(shè)計出一種棋類程序,那么他們很可能會選擇類似的解決方案。

但讓我們想想,人類是怎樣下棋的?假設(shè)目前您身處比賽中的特定階段。根據(jù)游戲規(guī)則,你可以作出十幾種不同的選擇——在此處移動棋子或者在那里移動皇后等等。然而,你真的會在腦袋里列出所有能走的棋步,并從這份長長的清單中作出選擇嗎?不不,你會“直觀地”將可行范圍縮小至少數(shù)幾種關(guān)鍵性棋步(這里假定您提出了3種明智的棋步),而后思考如果選擇其中某一種,那么棋盤上的局勢將發(fā)生怎樣的轉(zhuǎn)變。對于其中每一種棋步,你可能需要15到20秒的時間進行考量——但請注意,在這15秒內(nèi),我們并不是在非常精確地推衍接下來的交鋒與變化。事實上,人類往往會在未經(jīng)太多思考的情況下“拋出”一些由直覺引導(dǎo)的選擇結(jié)果(當(dāng)然,優(yōu)秀的選手會比普通選手想得更遠更深)。之所以這樣做,是因為你的時間有限,而且無法準(zhǔn)確預(yù)測你的對手會勾勒出怎樣的后續(xù)應(yīng)對策略。因此,你只能讓直覺引導(dǎo)自己。我將這一部分思考過程稱為“鋪展”,請大家在后文中注意這一點。

在完成了對幾種明智棋步的“鋪展”之后,你最終決定放棄這種令人頭痛的思考,直接下出你認(rèn)為最科學(xué)的一步。

在此之后,對手也會作出對應(yīng)的回應(yīng)。這一步可能早在你的預(yù)料當(dāng)中,這意味著你對于下一步要做的事情更具信心——換言之,不必耗費太多時間進行后續(xù)“鋪展”。或者,也可能你的對手下出了一手妙招,導(dǎo)致你被迫回防并不得不更謹(jǐn)慎地思考下一步選擇。

游戲就這樣持續(xù)進行,而隨著局勢的推進,你將能夠更輕松地預(yù)測每步棋的結(jié)果,鋪展耗時也將相應(yīng)縮短。

之所以說了這么多,是希望以較為淺顯的方式為大家講述MCTS算法的作用——它通過反復(fù)構(gòu)建棋步與位置“搜索樹”以模擬上述思考過程。但其創(chuàng)新之處在于,MCTS算法不會在每個位置(與深藍有所不同)都進行潛在棋步推衍;相反,其會更智能地選擇一小組合理棋步并加以探索。在探索過程中,它會“鋪展”這些棋步引發(fā)的局勢變化,并根據(jù)計算出的結(jié)果對其加以比較。

(好了,只要理解了以上內(nèi)容,本文的閱讀就算基本達標(biāo)。)

現(xiàn)在,讓我們回到論文本身。圍棋是一種“完美信息游戲”。也就是說,從理論層面講,無論您身處這類游戲的哪個階段(即使剛剛走出一、兩步),大家都有可能準(zhǔn)確猜出最終誰輸誰贏(假定兩位選手都會以‘完美’的方式下完整盤)。我不知道是誰提出了這項基本理論,但作為本次研究項目的前提性假設(shè),其確實非常重要。

換句話來說,在游戲狀態(tài)下,我們將可通過一條函數(shù)v*(s)來預(yù)測最終結(jié)果——例如你贏得這盤對弈的概率,區(qū)間為0到1。DeepMind的研究人員將其稱為“最優(yōu)估值函數(shù)”。由于某些盤面位置比其它盤面位置更有可能帶來獲勝結(jié)果,因此前者可能比其它位置擁有“更高估值”。讓我再強調(diào)一次,估值=贏得比賽的0到1間概率值。

但先別急——假設(shè)一位名叫Foma的女孩坐在您的身邊,在每下一步棋時,她都會告訴您這次決定會導(dǎo)致您勝利還是失敗。“你贏了……你辦理了……不,還是辦理了……”我認(rèn)為這樣的提示對您的棋步選擇并沒有多大幫助,而且非常煩人。相反,真正能夠幫得上忙的其實應(yīng)該是勾勒出所有可能的棋步樹,以及這些棋步將會引發(fā)的狀態(tài)——而后,F(xiàn)oma會告訴你在整個樹狀結(jié)構(gòu)中,哪些狀態(tài)會將你推向勝利,而哪些會招致失敗。突然之間,F(xiàn)oma就成了您的完美伙伴——而非討厭的插嘴者。在這里,F(xiàn)oma將作為您的最優(yōu)估值函數(shù)v*(s)。此前,人們一直認(rèn)為像圍棋這樣的游戲,不可能擁有Foma這樣的準(zhǔn)確估值函數(shù)——因為其中存在著太多不確定性。

然而,即使您真的擁有了Foma,她對所有可能盤面位置的估算在現(xiàn)實對弈當(dāng)中恐怕也無法奏效。因為在國際象棋或圍棋這樣的游戲當(dāng)中,正如之前所提到,即使是想要預(yù)測七到八步之后的整體局勢,過多的可能性選擇也會令Foma需要耗費大量時間才能得出分析結(jié)果。

也就是說,單憑Foma還遠遠不夠。大家還需要進一步縮小明智棋步的具體范圍,并據(jù)此推衍接下來的局勢走向。那么我們的程序該如何做到這一點?Lusha在這里閃亮登場。Lusha是一位擁有相當(dāng)技巧的國際象棋選手加熱心人,她曾花費數(shù)十年時間觀看國際象棋大師賽。她可以觀看你的盤面位置,快速思考您所能做出的全部合理選擇,并告訴你專業(yè)選手作出各種判斷的可能性。因此,如果您在某一特定時間點上擁有50種可能的棋步選項,Lusha會告訴你職業(yè)棋手選擇每種選項的具體概率。當(dāng)然,其中一些明智的棋步會擁有更高的概率,而其它無意義的棋步則概率極低。她就是你的策略函數(shù),p(as)。對于給定狀態(tài)s,她能夠為您提供專業(yè)選手可能作出的全部選擇的對應(yīng)概率。

接下來,你可以在Lusha的幫助下尋找更為合理的棋步選項,而Foma則會告訴我們這些棋步對對弈結(jié)果的實際影響。在這種情況下,大家可以選擇由Foma與Lusha協(xié)商給出落子建議,或者也可以先由Lusha提供建議,再由Foma對結(jié)果作出評估。接下來,挑選其中一些選項進行后續(xù)影響分析,再由Foma與Lusha繼續(xù)進行預(yù)測指導(dǎo)——通過這種方式,我們將能夠更為高效地掌握盤面局勢走向。而這,正是所謂“減少搜索空間”的實際意義所在。利用估值函數(shù)(Foma)預(yù)測結(jié)果,利用策略函數(shù)(Lusha)提供棋藝層面的概率取舍以縮小值得進一步探索的落子范圍。這套體系就是所謂“蒙特卡洛鋪展(MonteCarlorollouts)”。接下來,當(dāng)重新回到當(dāng)前棋步時,你將能夠得到各種選項所對應(yīng)的平均估值結(jié)論,并據(jù)此找到最適合的落子位置。不過到這里,其在圍棋水平方面仍然表現(xiàn)不佳——因為這兩種函數(shù)的實際指導(dǎo)能力還比較孱弱。

不過沒關(guān)系。

首先進行具體解釋。在MCTS當(dāng)中,起步階段的Foma與Lusha的功能還不夠精熟。但對弈數(shù)量越多,二者在預(yù)測可靠結(jié)果與落子位置方面就越強大。論文指出,“縮小高可能性棋步的具體范圍”其實是種較為復(fù)雜的表達,“Lusha實際上是通過提供專業(yè)棋手的落子概率幫助縮小需要考量的選項。以往的工作主要利用這種技術(shù)在策略函數(shù)較為簡單的情況下,提供強大且成熟的AI選手解決方案。

是的,卷積神經(jīng)網(wǎng)絡(luò)非常適合圖像處理類任務(wù)。而且由于神經(jīng)網(wǎng)絡(luò)需要特定輸入內(nèi)容并給出對應(yīng)的輸出結(jié)果,所以其在本質(zhì)上其實也相當(dāng)于一條函數(shù)。這意味著大家可以利用神經(jīng)網(wǎng)絡(luò)來充當(dāng)一種高度復(fù)雜的函數(shù)。從這個思路出發(fā),大家可以將其傳遞一份盤面位置圖像,?...

2015,云計算的三大預(yù)測 互聯(lián)網(wǎng)視頻課程

img

樂天

關(guān)注
關(guān)于2015,我們已經(jīng)可以眺望到很多新興的技術(shù),其中最熱門的無疑是大數(shù)據(jù)與物聯(lián)網(wǎng),而這兩種技術(shù)的發(fā)展都離不開云計算這種基礎(chǔ)技術(shù)的進步。在2015年,云計算將會有哪些發(fā)展呢?不妨讓我們根據(jù)目前的現(xiàn)狀做個簡單預(yù)測。


一、軟件定義技術(shù)

在可以預(yù)見的未來,軟件定義技術(shù)將。這中間包含了軟件定義存儲、軟件定義網(wǎng)絡(luò)等多個層面的技術(shù)領(lǐng)域。例如軟件存儲,其實就是將存儲虛擬化,為物理存儲設(shè)施構(gòu)建一個存儲池,由軟件層為應(yīng)用提供需求的存儲與管理備份等功能。而軟件定義網(wǎng)絡(luò)則是軟件定義數(shù)據(jù)中心的一部分,將整個數(shù)據(jù)中心虛擬化,通過軟件層整合整個數(shù)據(jù)中心的資源為用戶提供計算與存儲等多種功能。而管理員們也不必再像過去那樣單獨配置網(wǎng)絡(luò)設(shè)備,只需要通過一個軟件控制器就可以輕松的管理網(wǎng)絡(luò)上的所有設(shè)備。

二、更好的安全性

隨著云計算的普及,云越來越大,被攻擊的點也越來越多。當(dāng)用戶的商業(yè)信息和重要數(shù)據(jù)存放于云上面時,是否能夠為用戶保障安全?還有云計算的可靠性究竟有多大?這都是值得我們關(guān)注的話題。

在這個層面上有兩方面的發(fā)展值得我們在2015年去關(guān)注,一是云計算安全技術(shù)方面的發(fā)展,這包括了數(shù)據(jù)保護、身份管理、安全漏洞管理、物理與個人安全、應(yīng)用程序安全、事件的響應(yīng)與隱私措施等多個方面的技術(shù)進步。另一方面則是云計算法律法規(guī)方面的進步,用戶需要服務(wù)級別的協(xié)議作為保障,具體規(guī)定出詳細的責(zé)任條款與需要承擔(dān)的后果。這其中也包括了當(dāng)服務(wù)到期時數(shù)據(jù)的處理方式、回歸到公司的數(shù)據(jù)類型以及在指定時間之內(nèi)云服務(wù)提供商應(yīng)該把他們網(wǎng)絡(luò)上的數(shù)據(jù)進行刪除等等。

云計算的發(fā)展是大勢所趨,但是,云計算的安全技術(shù)進步與相關(guān)法律法規(guī)的完善,是2015年云計算發(fā)展階段最值得關(guān)注的問題。

三、虛擬化

通過虛擬機監(jiān)視器,系統(tǒng)運行在一個虛擬的平臺上可以更加容易同其他數(shù)據(jù)中心集成組件??梢哉f,虛擬化將會成為云的入口點。我預(yù)計在2015,虛擬化將進一步向著多元化的方向發(fā)展,這包括了:(1)平臺虛擬化,這是針對操作系統(tǒng)平臺級別的虛擬化,通過使用控制程序隱藏實際平臺的物理特性,為用戶提供一個統(tǒng)一的模擬計算環(huán)境;(2)資源虛擬化,這是針對系統(tǒng)資源,如內(nèi)存、外存、網(wǎng)絡(luò)資源等的虛擬化;(3)應(yīng)用程序虛擬化,這包括了仿真、模擬以及解釋技術(shù)等方面。

在2015,,用戶將無法分辨哪些是虛,哪些是實。虛擬化將網(wǎng)絡(luò)中的所有資源互聯(lián)在一起,形成一個大規(guī)模的數(shù)據(jù)中心,但用戶卻不必關(guān)心這些,只需要關(guān)注在提供給自己的服務(wù)即可??梢哉f,虛擬化是云計算在未來必然的發(fā)展方向。

注:本文首發(fā)iDoNews專欄,轉(zhuǎn)載請注明來源和出處。

img

在線咨詢

建站在線咨詢

img

微信咨詢

掃一掃添加
動力姐姐微信

img
img

TOP