欧美伊人色综合久久精品,永久免费的污网站在线观看,图片区国产激情一区二区三区,亚洲欧美自拍另类欧美亚洲中文字

          您的位置:首頁>互聯(lián)網(wǎng)>

          Clickbait的秘密曝光了 人類和AI聯(lián)手改善點擊誘餌檢測

          賓夕法尼亞州立大學(xué)和亞利桑那州立大學(xué)的研究人員說,人類和機(jī)器共同協(xié)作,以幫助訓(xùn)練一種優(yōu)于其他點擊誘餌檢測器的人工智能模型。他們說,此外,新的基于AI的解決方案還能夠分辨出由機(jī)器(或機(jī)器人)生成的clickbait標(biāo)題與由人編寫的clickbait標(biāo)題之間的區(qū)別。

          在一項研究中,研究人員要求人們編寫自己的點擊誘餌-這是一個有趣但具有誤導(dǎo)性的新聞標(biāo)題,旨在吸引讀者點擊其他在線故事的鏈接。研究人員還對機(jī)器進(jìn)行了編程以生成人工點擊誘餌。然后,將人和機(jī)器的標(biāo)題作為數(shù)據(jù)來訓(xùn)練點擊誘餌檢測算法。

          研究人員表示,由此產(chǎn)生的算法預(yù)測點擊誘餌標(biāo)題的能力比其他系統(tǒng)好14.5%,研究人員今天(8月28日)在2019年IEEE / ACM國際社交網(wǎng)絡(luò)分析先進(jìn)會議(ASONAM)上發(fā)布了他們的發(fā)現(xiàn)。加拿大溫哥華。

          該項目的首席研究員,信息科學(xué)與技術(shù)學(xué)院副教授Dongwon Lee表示,除了將其用于點擊誘餌檢測之外,該團(tuán)隊的方法還可能有助于總體上提高機(jī)器學(xué)習(xí)性能。Lee還是賓夕法尼亞州立大學(xué)計算機(jī)科學(xué)研究所(ICS)的附屬機(jī)構(gòu),該研究所為賓夕法尼亞州立大學(xué)的研究人員提供了超級計算資源的訪問權(quán)限。

          “我們成功地證明了機(jī)器生成的點擊誘餌訓(xùn)練數(shù)據(jù)可以反饋到訓(xùn)練管道中,以訓(xùn)練各種各樣的機(jī)器學(xué)習(xí)模型來提高性能,這一結(jié)果非常有趣。” Lee說。“這是解決需要大量高質(zhì)量培訓(xùn)數(shù)據(jù)的監(jiān)督型機(jī)器學(xué)習(xí)的基本瓶頸的一步。”

          賓夕法尼亞州立大學(xué)信息科學(xué)與技術(shù)學(xué)院的一名博士生Thai Le表示,點擊誘餌檢測技術(shù)的發(fā)展面臨的挑戰(zhàn)之一是缺乏標(biāo)記數(shù)據(jù)。就像人們需要老師和學(xué)習(xí)指南來幫助他們學(xué)習(xí)一樣,人工智能模型也需要帶有標(biāo)簽的數(shù)據(jù)來幫助他們學(xué)習(xí)建立正確的聯(lián)系和關(guān)聯(lián)。

          Le說:“當(dāng)我們開始這個項目時,我們意識到的一件事是,我們沒有很多積極的數(shù)據(jù)點。”“為了識別點擊誘餌,我們需要讓人員標(biāo)記訓(xùn)練數(shù)據(jù)。有必要增加正面數(shù)據(jù)點的數(shù)量,以便以后我們可以訓(xùn)練更好的模型。”

          盡管在互聯(lián)網(wǎng)上找到點擊誘餌很容易,但點擊誘餌的多種變化又增加了另一層難度,據(jù)Donald P媒體效應(yīng)教授兼媒體效應(yīng)研究實驗室聯(lián)合主任James P. Jimirro的S. Shyam Sundar稱。 Bellisario通信學(xué)院,以及ICS子公司。

          “有一些點擊誘餌是列表或列表;有一些點擊誘餌被表述為問題;有一些以誰,什么地方,何時開始;還有我們在研究中發(fā)現(xiàn)的各種其他種類的點擊誘餌。年。”桑達(dá)爾說。“因此,要找到足夠數(shù)量的所有這些類型的Clickbait樣本是一個挑戰(zhàn)。盡管我們都在抱怨周圍的Clickbait數(shù)量,但是當(dāng)您四處獲取并標(biāo)記它們時,這些數(shù)據(jù)集并不多。”

          根據(jù)研究人員的說法,該研究揭示了人和機(jī)器在創(chuàng)建標(biāo)題方面的差異。與機(jī)器產(chǎn)生的點擊誘餌相比,人們產(chǎn)生的標(biāo)題傾向于在其標(biāo)題中包含更多確定性詞(例如“ that”和“ that”)。

          培訓(xùn)似乎也促使點擊誘餌的創(chuàng)建有所不同。例如,受過訓(xùn)練的作家(例如記者)比其他參與者傾向于使用更長的單詞和更多的代詞。記者也可能會使用數(shù)字作為頭條新聞。

          據(jù)Sundar稱,研究人員計劃利用這些發(fā)現(xiàn)來指導(dǎo)他們對更強(qiáng)大的假新聞檢測系統(tǒng)的研究。

          Sundar說:“對我們來說,點擊誘餌只是構(gòu)成虛假新聞的眾多因素之一,但是這項研究是確保我們建立良好的點擊誘餌檢測系統(tǒng)的有用準(zhǔn)備步驟。”

          為了尋找人類點擊誘餌作者進(jìn)行研究,研究人員從在線人群資源網(wǎng)站Amazon Turk招募了新聞專業(yè)的學(xué)生和工人。他們從現(xiàn)場招募了125名學(xué)生和85名工人。參與者首先閱讀了clickbait的定義,然后被要求閱讀了簡短的文章(約500個單詞)。然后要求參與者為每篇文章寫一個點擊誘餌標(biāo)題。

          機(jī)器生成的點擊誘餌標(biāo)題是使用稱為變分自動編碼器(VAE)生成模型的機(jī)器學(xué)習(xí)模型開發(fā)的,該模型依賴于在數(shù)據(jù)中查找模式的可能性。

          研究人員針對在線點擊誘餌檢測競賽Clickbait Challenge 2017的頂級系統(tǒng)測試了他們的算法。

          賓夕法尼亞州大眾傳播學(xué)的博士候選人Maria Molina也為這項研究做出了貢獻(xiàn)。亞利桑那州立大學(xué)的計算機(jī)科學(xué)與工程教授劉歡和計算機(jī)科學(xué)與工程博士學(xué)位候選人凱舒。

          國家科學(xué)基金會,橡樹嶺聯(lián)合大學(xué)和海軍研究辦公室支持這項工作。

          免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!