狠狠操夜夜甜|人妻在线中文字幕亚洲无码不卡av|一区二区欧美亚洲|日躁夜躁狠狠躁2001|亚洲,超碰,欧美|18AV成人电影|午夜成人免费在线|婷婷激情网深爱五月|色欲综合成人在线|在线美女搞黄大片

<abbr id="goayy"><option id="goayy"></option></abbr>

登錄注冊

做網(wǎng)站
做推廣
做電商

服務(wù)支持
應(yīng)用與服務(wù)
關(guān)于中企

中企商學(xué)院

查看更多

中企動力 > 頭條 > 反應(yīng)學(xué)

網(wǎng)站性能檢測評分

注：本網(wǎng)站頁面html檢測工具掃描網(wǎng)站中存在的基本問題，僅供參考。

反應(yīng)學(xué)

清華大學(xué)馮珺：當(dāng)強(qiáng)化學(xué)習(xí)遇見自然語言處理有哪些奇妙的化學(xué)反應(yīng)？| 分享總結(jié) - iDoNews 營銷視頻課程

衛(wèi)廣山

原標(biāo)題：清華大學(xué)馮珺：當(dāng)強(qiáng)化學(xué)習(xí)遇見自然語言處理有哪些奇妙的化學(xué)反應(yīng)？|分享總結(jié)

雷鋒網(wǎng)AI科技評論按：隨著強(qiáng)化學(xué)習(xí)在機(jī)器人和游戲AI等領(lǐng)域的成功，該方法也引起了越來越多的關(guān)注。在近期雷鋒網(wǎng)GAIR大講堂上，來自清華大學(xué)計算機(jī)系的博士生馮珺，為大家介紹了如何利用強(qiáng)化學(xué)習(xí)技術(shù)，更好地解決自然語言處理中的兩個經(jīng)典任務(wù)：關(guān)系抽取和文本分類。本文根據(jù)視頻直播分享整理而成，內(nèi)容若有疏漏，以原視頻嘉賓所講為準(zhǔn)。

在關(guān)系抽取任務(wù)中，嘗試?yán)脧?qiáng)化學(xué)習(xí)，解決遠(yuǎn)程監(jiān)督方法自動生成的訓(xùn)練數(shù)據(jù)中的噪音問題。在文本分類任務(wù)中，利用強(qiáng)化學(xué)習(xí)得到更好的句子的結(jié)構(gòu)化表示，并利用該表示得到了更好的文本分類效果。本次分享的兩個工作均發(fā)表于AAAI2018。

馮珺，清華大學(xué)計算機(jī)系博士五年級，師從朱小燕和黃民烈教授，主要研究方向為知識圖譜，強(qiáng)化學(xué)習(xí)。目前已在AAAI，COLING，WSDM等國際會議上發(fā)表多篇文章。

分享內(nèi)容：

大家好，我是來自清華大學(xué)的馮珺，分享的主題是當(dāng)強(qiáng)化學(xué)習(xí)遇見自然語言處理，分享內(nèi)容主要是以下三方面：

強(qiáng)化學(xué)習(xí)基本概念簡要介紹基于強(qiáng)化學(xué)習(xí)的關(guān)系抽取方法，解決遠(yuǎn)程監(jiān)督方法自動生成的訓(xùn)練數(shù)據(jù)中的噪音問題基于強(qiáng)化學(xué)習(xí)的句子結(jié)構(gòu)化表示學(xué)習(xí)方法

強(qiáng)化學(xué)習(xí)的基本概念

狀態(tài)，是agent從環(huán)境中得到的動作；agent，是基于它得到的當(dāng)前狀態(tài)后做出相應(yīng)的動作。reward，是環(huán)境給agent的一個反饋，收到這個reward就知道做的這個動作是好還是不好。agent的目標(biāo)就是選動作，將全部reward最大化。

agent會和環(huán)境做很多的交互，環(huán)境每次做的動作可能會有一個長期的影響，而不僅僅是影響當(dāng)前的reward。reward也有可能延遲。在這里簡單介紹一下policy的概念。policy是決定一個agent的動作的一個函數(shù)。

如果讀者對上述概念還不清楚可以觀看視頻中的迷宮例子：http://www.mooc.ai/open/course/318

我們組做的兩個工作是關(guān)系抽取和文本分類。

首先是第一個工作：利用增強(qiáng)學(xué)習(xí)從噪聲數(shù)據(jù)中進(jìn)行關(guān)系抽?。≧einforcementLearningforRelationClassificationfromNoisyData）

任務(wù)背景

關(guān)系分類任務(wù)需要做的是，判斷實體之間是什么關(guān)系，句子中包含的實體對兒是已知的。關(guān)系分類任務(wù)是強(qiáng)監(jiān)督學(xué)習(xí)，需要人工對每一句話都做標(biāo)注，因此之前的數(shù)據(jù)集比較小。

之前也有人提出DistantSupervision方法，希望能利用已有資源對句子自動打上標(biāo)簽，使得得到更大的數(shù)據(jù)集。但這種方法是基于已有知識圖譜中的實體關(guān)系來對一句話的實體關(guān)系進(jìn)行預(yù)測，它的標(biāo)注未必正確。

這篇文章就是用強(qiáng)化學(xué)習(xí)來解決這個問題。之前也有一些方法是基于multi-instancelearning的方法來做的。

這樣做的局現(xiàn)性是不能很好處理句級預(yù)測。

基于以上不足，我們設(shè)定了新模型。包括兩個部分:InstanceSelector和RelationCalssifier。

這個模型有兩個挑戰(zhàn)，第一是不知道每句話的標(biāo)注是否正確‘；第二個挑戰(zhàn)是怎么將兩個部分合到一塊，讓它們互相影響。

InstanceSelector和RelationCalssifier的結(jié)構(gòu)圖

在InstanceSelector中的“狀態(tài)”就表示為，當(dāng)前的句子是哪一句，之前選了哪些句子，以及當(dāng)前句子包含的實體對兒。

RelationClassifier是直接用了一個CNN的結(jié)構(gòu)得到句子的表示。

模型訓(xùn)練步驟

實驗部分關(guān)于數(shù)據(jù)集和baseline來源

總結(jié)

我們提到一個新的模型，在有噪聲的情況下也能句子級別的關(guān)系分類，而不僅僅是bags級別的關(guān)系預(yù)測。

第二個任務(wù)

任務(wù)背景

如果做一個句子分類，首先要給句子做一個表示，經(jīng)過sentencerepresentation得到句子表示，把“表示”輸入分類器中，最終就會得到這個句子屬于哪一類。

傳統(tǒng)的sentencerepresentation有以下幾個經(jīng)典模型：

bag-of-wordsCNNRNN加入注意力機(jī)制的方法

以上幾種方法有一個共同的不足之處，完全沒有考慮句子的結(jié)構(gòu)信息。所有就有第五種tree-structuredLSTM。

不過這種方法也有一定的不足，雖然用到了結(jié)構(gòu)信息，但是用到的是需要預(yù)處理才能得到的語法樹結(jié)構(gòu)。并且在不同的任務(wù)中可能都是同樣的結(jié)構(gòu)，因為語法都是一樣的。

所以我們希望能夠?qū)W到和任務(wù)相關(guān)的結(jié)構(gòu)，并且基于學(xué)到的結(jié)構(gòu)給句子做表示，從而希望能得到更好的分類結(jié)構(gòu)。但面臨的挑戰(zhàn)是我們并不知道什么樣的結(jié)構(gòu)對于這個任務(wù)是好的，我們并沒有一個結(jié)構(gòu)標(biāo)注能夠指導(dǎo)我們?nèi)W(xué)這個結(jié)構(gòu)。但我們可以根據(jù)新的結(jié)構(gòu)做出的分類結(jié)果好不好從而判斷這個結(jié)構(gòu)好不好。

這個任務(wù)同樣可以建模為強(qiáng)化學(xué)習(xí)問題，用強(qiáng)化學(xué)習(xí)的思想來解。同樣的，在這個任務(wù)中的reward也是有延遲的，因為需要把整個結(jié)構(gòu)都學(xué)到后，才能得到句子的表示，才能用句子的表示做分類，中間的過程是不知道這個結(jié)構(gòu)是好的還是不好的。

實驗部分的數(shù)據(jù)集來源

實驗的分類結(jié)果；最后兩行是我們的方法。

總結(jié)

在這個工作中，我們學(xué)習(xí)了跟任務(wù)相關(guān)的句子結(jié)構(gòu)，基于句子機(jī)構(gòu)得到了不同的句子表示，并且得到個更好的文本分類方法。我們提出兩種不同的表示方法，ID-LSTM和HS-LSTM。這兩個表示也得到了很好的分類結(jié)果，得到了非常有意思的和任務(wù)相關(guān)的表示。

雷鋒網(wǎng)提供視頻直播回放，如果對文中有不清楚的地方，可點擊觀看視頻：http://www.mooc.ai/open/course/318。

400-660-5555 在線客服

最新推薦

在家賺錢小項目

合理避個人所得稅稅

在線網(wǎng)站制作

合理避開企業(yè)所得稅

合理避免企業(yè)所得稅

怎么開發(fā)游戲軟件

合理避免所得稅

怎么可以在家掙錢

合理避企業(yè)所得稅

會計培訓(xùn)學(xué)校

7 x 24

全國售后支持
100 倍

故障時長賠付
26 年

26年行業(yè)服務(wù)經(jīng)驗
70 家

全國售后支持
1600+ 名

超千人的設(shè)計、研發(fā)團(tuán)隊
150 萬

服務(wù)企業(yè)客戶150萬家

Copyright ? 1999-2025 中企動力科技股份有限公司（300.cn）版權(quán)所有京公網(wǎng)安備11030102010293號京ICP證010249-2

在線咨詢

建站在線咨詢

獲取方案

獲取建站報價/方案

我們聯(lián)系您

微信咨詢

掃一掃添加
動力姐姐微信

TOP

<code id="8ie0c"><strong id="8ie0c"></strong></code><code id="8ie0c"><strong id="8ie0c"></strong></code><kbd id="8ie0c"><option id="8ie0c"></option></kbd>