快三玩法

    1. <label id="xazjd"><legend id="xazjd"></legend></label>

      <acronym id="xazjd"><legend id="xazjd"><blockquote id="xazjd"></blockquote></legend></acronym>

      <var id="xazjd"></var>

    2. <acronym id="xazjd"></acronym>
    3. <code id="xazjd"></code>
    4. <dd id="xazjd"></dd>

      1. <acronym id="xazjd"></acronym>

          融合信任聚類的協同過濾算法計算機研究與應用

          來源: www.lov2go.com 發布時間:2020-03-15 論文字數:30995字
          論文編號: sb2020030920310329834 論文語言:中文 論文類型:碩士畢業論文
          本文是一篇計算機論文,本文主要研究推薦技術中應用廣泛的協同過濾算法,通過閱讀國內外的相關文獻,了解其相關技術,分析當前的不足與面臨的挑戰。
          本文是一篇計算機論文,本文主要研究推薦技術中應用廣泛的協同過濾算法,通過閱讀國內外的相關文獻,了解其相關技術,分析當前的不足與面臨的挑戰。根據傳統的基于用戶的協同過濾算法和主要步驟,從原始輸入的數據結構以及提高近鄰查找準確度的角度進行優化,改進模型表現出良好的推薦精度。本文為了解決以上問題,從原始輸入的數據,搜索鄰居集合的計算量,尋找更優的鄰居集合等方面對基礎算法進行改進。首先對稀疏矩陣預填充,接著使用 SVD 降維并得到用戶特征矩陣,然后在縮小的空間中引入聚類和信任關系查找近鄰,提高推薦質量。最后通過仿真實驗驗證其有效性。

          第一章 緒論

          1.1選題背景與意義
          互聯網的日益普及導致了大量數據的爆炸性增長,為了解決信息過載的問題,能夠幫助用戶獲取所需信息的推薦系統應運而生。協同過濾是推薦系統中使用的相對成功且廣泛使用的技術[1]。對于不同的用戶,協同過濾通過歷史行為來找出與其有過類似行為的相似用戶,來預測對未有過行為記錄的項目的感興趣程度。但是,可用于計算和比較用戶之間相似度的有效評級數據通常十分稀疏,導致很難找到足夠數量的類似用戶來提供有效的建議?,F階段,通過降維對數據預處理,并且將信任關系融入相似用戶查找中,被認為對提高推薦質量有一定的好處。
          1.1.1選題背景
          近年來,隨著互聯網,物聯網,云計算和其他新興 IT 技術的廣泛使用,使得各類數據以前所未有的速度在增長,世界已經完全進入了信息時代。網上出現各類銷售產品(書籍,電影,新聞,廣告),特別是在線信息的數量是驚人的,用戶要對這些產品比較和選擇,然而事物數量的龐大使用戶很難找到自己想要的東西,這些信息過載常常使用戶不堪重負,做出不令人滿意的決定。過多的信息雖然帶來了過多的選擇,但有一些并沒有產生好的效益,開始降低用戶的使用黏性??梢园l現,雖然過多的選擇一方面帶來了好處,但過多的選擇并不總是好的,用戶希望的是能夠輕松地得到自己想要的商品信息,做出滿意的決定。
          國內外眾多科學家和研究人員提出了一些解決信息超載問題的方案,其中,分類目錄和搜索引擎[2]是比較有效的解決方案。分類目錄的方法通過將一些網站分門別類,把同類別的信息集合起來,使網站具備導航功能,用戶可以根據自己的需求的按類別點擊,即可獲取信息。該技術主要以 Yahoo 和一些新聞類門戶網站為代表。雖然現在仍可以在一些主流網站上看到目錄導航的影子,但是隨著信息的不斷增長,信息的類別不斷的擴大,每個分類下的數量也在逐級增加,需要一種更有效的解決方法。于是,一種依賴于用戶主動提供關鍵詞搜索的信息檢索技術誕生了,主要的搜索引擎有國外的谷歌,必應以及國內的百度等。搜索引擎需要用戶付出額外努力,只有當用戶主動提供準確描述其需求的關鍵詞時,才能提供有用信息。
          .............................

          1.2 國內外研究現狀
          1.2.1 推薦系統研究現狀
          關于協同過濾的研究論文[3-4]首次出現于 20 世紀 90 年代中期,自此推薦系統開始成為一個獨立而又備受關注的研究領域。它可以被定義為試圖通過用戶或是項目的相關信息預測用戶對項目的興趣來嘗試向個人或企業推薦最合適的項目(產品或服務)的程序[5]。開發推薦系統是為了從海量數據中檢索出最相關的信息,從而提供個性化服務并解決信息過載問題。能夠通過分析目標用戶的行為或其他相似用戶的行為,來預測用戶的偏好和興趣以生成個性化推薦是推薦系統的重要特征[6]。
          推薦系統的的早期研究源于信息檢索和信息過濾研究[7],并且研究人員開始明確依賴評級信息的推薦問題[8]。常用的推薦技術包括協同過濾[9],基于內容[10]和基于知識[11]的推薦。每種推薦方法都有局限性;如協同過濾技術具有稀疏性,可擴展性和冷啟動問題[8-9]。盡管基于內容的推薦方法可以對推薦結果作出專業化的解釋,但依然存在很多問題亟待解決,現階段一些先進的方法已經被提出,例如基于社交網絡的推薦系統[12],模糊推薦系統[13-14],基于情境感知的推薦系統[15]和組合推薦系統[16]。
          推薦系統的應用研究包括電影,音樂,電視節目,書籍,文件,網站,涉及電子商務,電子學習,電子圖書館,政府電子服務等領域。無論我們是否注意到它,推薦系統在生活中都無處不在。在過去幾十年里引起了廣泛關注,眾多相關獎項的設置也吸引了眾多來自機器學習和數據挖掘研究領域的專家。
          1.2.2 協同過濾研究現狀
          協同過濾是推薦算法中最為重要的,其基于顯式或隱式信息相關性指示來識別用戶之間或者項目之間的共性[17]。顯式信息包括一些用戶評級,標簽等,隱式信息如一些點擊瀏覽行為,下載等。協同過濾技術是最廣泛實施和最成熟的技術[18]。經典的基于用戶的協同過濾算法首先基于它們的重疊交互或共同項目的類似評級來識別類似用戶,然后根據這些類似用戶的偏好作出推薦。而經典的基于項目的推薦算法計算項目之間的相似性,然后根據這些相似項目來確定要推薦的項目集?;趦热莸耐扑]算法忽略其他用戶的貢獻只是將項目描述和用戶描述相匹配起來,通過特征提取的方法獲得用戶或項目的內容特征表示以作出預測[10]。組合推薦系統將這些推薦技術結合起來使用,以更少的缺點獲得更優質的推薦效果[18]。
          ...........................

          第二章 協同過濾及相關技術介紹

          2.1 基于用戶的協同過濾推薦算法
          隨著互聯網和電子商務系統的發展,我們面臨大量的信息需要處理。因此需要個性化推薦服務來向我們提供一些有用數據,而這些數據采用一些有效的信息過濾技術來獲取。協同過濾(CF)已經被廣泛使用,主要分為兩種,一個是基于用戶的協同過濾推薦,另一個則是基于物品的協同過濾推薦[37]。其基于相似用戶(稱為鄰居)的評價信息向用戶推薦項目,在理論和實現方面都是簡單且實用的[38-39]。論文以基于用戶的協同過濾推薦算法為原型進行改進。
          傳統基于用戶的協同過濾推薦算法的原理是基于用戶對觀察項目的評分,來預測目標用戶對未給出評級的目標項目的評級。算法具體步驟如圖 2.1 所示:
          圖 2.1 基于用戶的協同過濾算法步驟圖
          ...............................

          2.2 矩陣分解模型及其在協同過濾中的應用
          電子商務行業近階段以指數速度增長,不斷變化的需求和各種產品使得系統業務越來越復雜,在這種情況下,用戶很難從大量信息中找到對自己有用的最佳信息,為了幫助買家提供便利,電子商務公司開發了各種不同的推薦系統,打開了雙贏的局面。早期的協同過濾算法利用關聯推斷,時間復雜度和可伸縮性都表現的不太理想。而使用矩陣分解的方法更具可擴展性和效率,改善了需處理數據集大小的問題和評級矩陣稀疏性問題。
          矩陣分解技術最近獲得了越來越多研究者的關注,主要是作為潛在變量分解和降維的無監督學習方法[41],它已經成功應用于光譜數據分析和文本挖掘。評級矩陣被建模成用戶因子矩陣和項目因子矩陣的乘積。Sarwar 等人應用矩陣分解模型 SVD 來降低評級矩陣的維數[42]。 他們使用 MovieLens 數據集,選擇 943 個用戶組成943?1682矩陣,稀疏率為 95.4%(平均每個用戶的有效評分占電影總數的 5%)。他們首先使用平均值填充缺失值,然后將 SVD 應用在基于項目的協同過濾算法中,顯著提高了在線推薦的速度和質量。Goldberg 等人提出了一種在線環境中使用主成分分析(PCA)的方法[25],該算法被稱為 Eigentaste,使用通用查詢在一組公共項上引出實值,確保所有用戶對一組共同的 k 項進行評級。因此,得到的子矩陣將是密集的并直接計算對稱相關矩陣,然后使用主成分分析(PCA)進行線性投影,PCA 是 Pearson在 1901 年首次描述的一種密切相關的因子分析技術。與 SVD 一樣,PCA 降低了維數,通過沿較少數量的正交維度最佳地投射高度相關的數據來獲得矩陣,有助于降低用戶離線集群的維數并快速計算得出建議。Royi Ronen 等人提出了一種新的概率矩陣分解模型[43],并可將推薦服務集成到任何網站中。  矩陣分解方法被認為是減少數據稀疏性的精確方法。下文主要介紹幾種常見的矩陣分解模型。
          ...........................

          第三章  基于預填充的 SVD 降維 ................................... 17
          3.1基于預填充的 SVD 降維基本思想 ................................ 17
          3.2基于項目評分預測的預填充 .................................... 18
          第四章  融入信任因子的二階段聚類推薦算法.................................. 24
          4.1基于信任模糊聚類的基本思想 .............................................. 24
          4.2基于模糊聚類的一階段近鄰查找 ...................................... 25
          第五章  實驗結果分析與應用 ..................................... 34
          5.1實驗數據及設計 .................................. 34
          5.2  推薦結果評測指標 ................................. 34

          第五章   實驗結果分析與應用

          5.1 實驗數據及設計
          本文采用 GroupLens 提供的 MovieLens 數據集評測各種算法。這些數據集是電影推薦系統中用戶行為的產物,由收集的電影評級數據子集組成,有多種不同的版本,廣泛用于教育和研究中,每年被下載數十萬次,反應了它們在流行的編程書籍,傳統和在線課程以及軟件中的應用。
          選用其中最小的數據集來進行評測,其中包含 943 個用戶對 1682 部電影的 100000 個評分,每個用戶評分至少 20 個項目。MovieLens 數據中的評級由用戶明確輸入,整數范圍為 1到 5。包括了用戶的人口統計數據(年齡,性別,職業,郵政編碼),電影的屬性被分為動作、冒險、戰爭等 19 個不同的類,評分數據密度只有 6.30%,稀疏度很高。
          實驗中,將 4:1 的比例分割訓練集和測試集數據,隨機生成 5 組數據,每組中 80%的數據用作訓練數據,而另外 20%用作測試。這樣可以保證訓練數據與測試數據都是隨機的且都來自同一數據集。重復交叉驗證 5 次,得到五個結果,取平均值作為最后的實驗結果。
          實驗設計: 第一步,在實驗中確定融入信任因子的二階段聚類推薦算法中的兩個未知參數:
          (1)  第三章中奇異值分解保留的維度 k 值;
          (2)  第四章中聚類的用戶簇個數。
          第二步,通過實驗說明在算法中加入聚類的過程對可擴展性有影響,最后將改進的算法分別與基于用戶的、基于聚類的、基于 SVD 的協同過濾算法進行對比,驗證其是否提高了推薦準確度。
          ...........................

          第六章   總結與展望

          6.1 論文總結
          隨著互聯網的快速發展,網絡信息以爆炸式地增長,導致用戶無法在龐大的數據信息中篩選有價值的信息,信息過載問題亟待解決。在此背景下,個性化推薦系統應運而生。具體而言,推薦系統是基于用戶的歷史行為數據或物品數據,通過有效的算法,為用戶推薦符合他需求的物品。協同過濾算法是廣泛使用的推薦算法之一,它使用用戶對項目的評級來衡量用戶的興趣偏好,并根據分數進行推薦。從算法的流程中可以觀察到,數據的稀疏程度很高,即使用戶非?;钴S,對項目的評級數量也非常少,由于協同過濾算法主要基于在共同評定的項目集上計算相似度,大量稀疏性會導致精度降低,而且每次有新用戶進來都要兩兩計算相似度,計算的代價很昂貴,隨著用戶項目數量的增長,計算代價也會呈現非線性地增長。
          本文為了解決以上問題,從原始輸入的數據,搜索鄰居集合的計算量,尋找更優的鄰居集合等方面對基礎算法進行改進。首先對稀疏矩陣預填充,接著使用 SVD 降維并得到用戶特征矩陣,然后在縮小的空間中引入聚類和信任關系查找近鄰,提高推薦質量。最后通過仿真實驗驗證其有效性。主要工作可概括為以下幾個方面:
          (1)論文通過閱讀大量的文獻,歸納總結推薦系統的研究現狀,分析了一些傳統推薦算法的優缺點,著重介紹了協同過濾,以及針對其不足,研究者們提出的各種思路的解決方法。
          (2)介紹了傳統的基于用戶的協同過濾算法及本文改進模型所涉及的相關技術基礎,包括矩陣分解和聚類分析及其在協同過濾算法中的應用。關于矩陣分解,介紹了其基本思想以及兩種經典的分解算法;關于聚類分析,主要對其基本方法,分類和最具代表性的基于劃分的聚類算法進行了描述,并簡單介紹了基于聚類的協同過濾推薦算法。
          (3)研究矩陣分解模型中應用廣泛的奇異值分解算法,利用 SVD 算法將原始高維矩陣降到低維空間,并且自動抽取矩陣重要特征,可以降低系統計算維度。并使用改進的 SVD 降維之前,用基于項目評分預測的評分矩陣預填充方法,解決了用平均值填充缺省值的不足,
          使在用戶評分數據極度稀疏的情況下,提高推薦質量。
          (4)研究聚類算法中的模糊聚類,首先運用模糊聚類算法在縮小的空間中進行目標用戶的一階段近鄰查找,將用戶進行軟分類,允許一個對象按照不同的概率屬于不同的簇,每一簇中為具有相似偏好的用戶。然后將信任因子融入相似度空間中,進行二階段信任用戶查找,計算信任度,選取一定數目信任度比較高的用戶建立信任鄰居群集合。二重聚類提高了鄰居查找的準確度,減輕了數據稀疏帶來的不利影響,使得預測評分更加準確。
          參考文獻(略)


          原文地址:http://www.lov2go.com/jsjlw/29834.html,如有轉載請標明出處,謝謝。

          您可能在尋找計算機論文方面的范文,您可以移步到計算機論文頻道(http://www.lov2go.com/jsjlw/)查找


          和布克赛尔| 湄潭| 巧家| 金川| 印江| 那日图| 鄄城| 昭苏| 莒县| 平鲁| 翁源| 富川| 开县| 库尔勒| 梧州| 金山| 威海| 九寨沟| 全椒| 涟源| 宁城| 塔城| 图们| 双阳| 肇东| 叶县| 海东| 毕节| 牙克石| 本溪县| 桦川| 广平| 楚雄| 阆中| 息烽| 通化县| 抚宁| 仙游| 丹巴| 米泉| 吴县| 宜兴| 东阿| 沁县| 黄泛区| 綦江| 镇宁| 交城| 通州| 靖远| 化隆| 斗门| 叙永| 大武口| 宜昌| 嘉义| 呼和浩特市郊区| 大竹| 汾西| 涿鹿| 隆德| 梁平| 贵阳| 太原| 上川岛| 十堰| 内乡| 安德河| 雅布赖| 新竹市| 大足| 锦州| 陵县| 门源| 鄂尔多斯| 博罗| 镶黄旗| 塔什库尔干| 茫崖| 象山| 多伦| 南皮| 许昌| 万宁| 海洋岛| 故城| 通化县| 泗洪| 清徐| 新邵| 饶平| 哈密| 临澧| 砚山| 道县| 五道梁| 祥云| 和县| 丰台| 孤家子| 博湖| 大田| 蒲城| 双阳| 通道| 恭城| 泰和| 炉霍| 衡山| 洪江| 兴文| 东岗| 北川| 合川| 宜兰| 陵川| 乡城| 龙南| 盐山| 大余| 乌鞘岭| 尖扎| 淮南| 代县| 澧县| 新绛| 东阿| 永丰| 汪清| 眉县| 崇礼| 仁寿| 乌斯太| 金川| 平果| 平安| 杭锦后旗| 普兰店| 濉溪| 巴音布鲁克| 潼关| 河曲| 赫章| 固阳| 兰屿| 香港| 承德县| 绥中| 南充| 红原| 定海| 万州龙宝| 湘阴| 洛宁| 沂南| 墨竹贡卡| 石河子| 石家庄| 灵台| 岳阳| 嘉荫| 沾化| 盐边| 合肥| 大连| 瑞丽| 安平| 荣经| 青龙山| 广宗| 务川| 阿勒泰| 余庆| 通渭| 天池| 岳西| 昌图| 澄海| 大名| 道真| 康山| 砚山| 剑河| 潮州| 长泰| 龙海| 汉中| 兴平| 开江| 遂昌| 中甸| 黄梅| 隆回| 塔中| 长兴| 延安| 鱼台| 长宁| 常宁| 繁峙| 克什克腾旗| 平鲁| 凤城| 希拉穆仁| 眉县| 山阳| 广平| 武定| 徐州农试站| 两当| 常宁| 莆田| 德化| 镇雄| 仁化| 会昌| 琼山| 美姑| 祁县| 镇赉| 二连浩特| 双辽| 抚宁| 湖口| 遂昌| 洪家| 修武| 汾阳| 信宜| 都江堰| 无锡| 盱眙| 民勤| 高要| 平塘| 垣曲| 那坡| 饶河| 焉耆| 章丘| 潮阳| 漠河| 江阴| 图们| 丰顺| 乌拉盖| 宜都| 石门| 滨州| 南江| 永登| 遂平| 沂南| 乐平| 临泉| 邵阳| 东阿| 诸城| 遂平| 禹州| 彭州| 五原| 盘山| 阜康| 来宾| 桦川| 莲花| 柳河| 五大连池| 铅山| 高县| 陈家镇| 南郑| 泗阳| 龙泉| 松桃| 波阳| 祁门| 岑巩| 迁西| 石屏| 华山| 北塔山| 鄢陵| 临高| 修武| 白沙| 天祝| 左权| 包头| 惠农| 阳城| 邹平| 寻乌| 获嘉| 青州| 和顺| 垫江| 涉县| 诸暨| 阳泉| 博乐| 新巴尔虎左旗| 江都| 邵武| 深泽| 武邑| 博爱| 临县| 鸡东| 阿尔山| 鄂伦春旗| 江孜| 靖州| 鄞县| 淮阴| 阿拉尔| 潢川| 铜鼓| )| 理县| 曲阜| 鲁甸| 镇原| 南阳| 会同| 图们| 郫县| 云县| 嘉荫| 前郭| 迁西| 古蔺| 同安| 桦南| 临邑| 云阳| 苏州| 高密| 通辽| 鄂托克前旗| 三河| 章党| 隆安| 清水河| 德宏| 长子| 高台| 皮口| 宽城| 长岛| 三穗| 竹溪| 拉孜| 沾益| 歙县| 辰溪| 平南| 沛县| 定南| 小灶火| 羊山| 秭归| 建水| 巴盟农试站| 桥口| 延边| 固安| 天河| 正安| 双峰| 香河| 泰来| 大武| 兴县| 陇川| 武山| 科尔沁左翼后旗| 郧县| 承德| 库伦旗| 汨罗| 伊金霍洛旗| 湟源| 宜都| 色达| 西华| 五峰| 嘉兴| 新和| 左贡| 承德县| 保定| 关岭| 同心| 肥乡| 峨眉山| 鸡公山| 天祝| 成安