快三玩法

    1. <label id="xazjd"><legend id="xazjd"></legend></label>

      <acronym id="xazjd"><legend id="xazjd"><blockquote id="xazjd"></blockquote></legend></acronym>

      <var id="xazjd"></var>

    2. <acronym id="xazjd"></acronym>
    3. <code id="xazjd"></code>
    4. <dd id="xazjd"></dd>

      1. <acronym id="xazjd"></acronym>

          基于標準差圓半徑的自適應網格劃分模型計算機分析

          來源: www.lov2go.com 發布時間:2020-03-12 論文字數:28699字
          論文編號: sb2020030222533329721 論文語言:中文 論文類型:碩士畢業論文
          本文是一篇計算機論文,本文對現有的基于差分隱私的空間數據集發布中的隱私保護研究做出分析,發現現研究沒有充分的考慮到數據集的分布特征,進而沒有合理的對網格進行隱私預算的分配
          本文是一篇計算機論文,本文對現有的基于差分隱私的空間數據集發布中的隱私保護研究做出分析,發現現研究沒有充分的考慮到數據集的分布特征,進而沒有合理的對網格進行隱私預算的分配,從而在添加噪聲階段產生較大的噪聲誤差。同時沒有兼顧到用戶的查詢粒度,從而導致在網格劃分的第二層易產生較大的查詢誤差,從而增大了相對誤差和降低數據集的查詢精度和可用性。因此,本文針對上述問題提出了基于標準差圓半徑的自適應網格劃分模型,并通過實驗對其進行論證。

          第一章 緒論

          1.1研究背景及意義
          隨著互聯網技術和大數據技術的快速發展以及移動終端的普及化,人們與移動終端的交互越來越頻繁。人們的地理位置信息與這些終端時刻進行交互,這些設備可以向服務器報告用戶的位置信息,這種位置信息(通常稱為空間數據)?;谖恢梅帐俏磥砘ヂ摼W行業的重要組成部分,并給我們的生活帶來了很多的便捷。例如:通過地理位置信息的共享我們可以隨機通過互聯網進行叫車、點餐、預定等服務;政府部門通過這些位置信息進行交通樞紐調度預警,可以有效的避免交通阻塞。同時這些數據的價值遠遠超出了我們的想象,對于許多的企業而言,這些數據就是無價的財富,他們可以根據用戶的歷史的地理空間數據來進行數據分析和數據挖掘得到用戶的行為方式,通過推薦系統來推薦用戶感興趣的話題或者商品來達到自己的商業目的。因此為了能夠獲取用戶的行為模式,這些企業首先要做的就是收集大量的用戶歷史地理空間信息,然后通過數據分析和挖掘出有價值的信息。然而,用戶的地理位置信息通常伴隨著大量的個人隱私信息,地理空間數據集受到非法分子的攻擊、數據分析和挖掘可能導致個人的行為方式、出行方式、生活習慣等隱私信息的暴露。而對于空間數據集的隱私保護一直以來都是一個具有挑戰性的問題和研究熱點。
          針對數據集的隱私保護出現了多種的隱私保護模型。例如:以 K-匿名算法為代表的早期隱私保護方法所定義的保護模型,忽略了攻擊者對數據集背景知識的掌握,往往會遭受一致性攻擊和背景知識攻擊,使得用戶數據的隱私信息沒有得到有效的保護[1]。差分隱私[2,3,4,5,6]是一種新型的保護模型,它假設攻擊者擁有所有的背景知識,通過添加噪聲擾動的方式來對信息進行隱私保護。差分隱私保護模型定義了一個極其嚴格的攻擊模型,并對隱私泄露風險給出了嚴謹的數學證明和定量化表示。對于空間數據集的隱私保護一般采用差分隱私保護模型,相比傳統的隱私保護模型,差分隱私最顯著的優點是能夠抵御背景知識攻擊且具有較好的隱私保護效果。當用戶將自己的地理空間數據集共享在網絡中,差分隱私通過擾動的隱私保護策略對用戶的空間數據集中添加相應的噪聲來達到隱私保護的效果,使得攻擊者無法挖掘和分析出目標數據集的隱私信息。
          ...........................

          1.2國內外研究現狀
          差分隱私是由 Dwork 等人在 2006 年提出的,相比傳統的隱私保護方法不易受到一致性攻擊和背景知識攻擊,因此它遭受到的隱私暴露風險極小。所以差分隱私保護技術相比傳統的隱私保護技術具有較好的保護效果,并且差分隱私理論上的可證明性和應用上的通用性,使得差分隱私得到了業界的廣泛認可,并成為這些年隱私保護技術的研究熱點。于是關于差分隱私的研究產生了大量的研究成果[8,9,10,11,12],特別是廣泛的運用到數據發布的隱私保護算法中。
          基于差分隱私的數據發布研究在差分隱私的研究中的具有核心的地位,根據差分隱私保護數據發布的實現環境分為交互式和非交互式兩種不同數據發布[13]。交互式數據發布方法主要有發布機制和基于直方圖。發布機制是直接對數據集進行操作對查詢進行響應?;谥狈綀D是先將數據集建立直方圖分布,從而根據數據直方圖分布來響應查詢。非交互式數據發布方法主要有劃分、列聯表發布、基于分組發布和凈化數據集發布等。
          LP 是基于直方圖發布的早期方法。該方法結合拉普拉斯機制將數據分為等寬的直方圖,該方法優點支持響應長范圍查詢,但是由于噪聲的累加會導致發布誤差大,直方圖可用性低[13]。相比 LP,Boost1 通過一致性約束條件和后置處理來降低誤差,該方法支持高精度的范圍查詢,但是僅適用于數據獨立情況下的一維直方圖,且不支持長范圍查詢[14]。Boost2 通過結合最小二乘法對 m-ary 樹中的噪音計數進行約束推理提高查詢精度,但是該方法同樣僅限于一維的數據集發布[14]。NoiseFirst 利用 V-優化直方圖技術對 LP 產生的直方圖進行重構后置處理來降低誤差,該方法支持長范圍查詢并且查詢精度較高,但是該方法沒有考慮重構帶來的誤差,沒有均衡重構誤差和噪聲誤差,并且該方法存在的另一個缺陷在于它僅適用于一維直方圖[15]。P-HPartition 結合聚類技術和二等分策略自適應的對數據集自上而下進行分割,從而平衡重構誤差和噪聲誤差,但是忽略了離群點對直方圖發布的影響,且該方法也是只適用于一維的數據集發布[16]。FPA 是基于傅里葉變換來進行直方圖發布,能夠有效的提高查詢精度,但是該方法擴展性差,且噪聲誤差大和重組誤差大[16]。針對上述的問題 EFPA 通過發布的誤差設計出一種打分函數,從而達到了均衡重構誤差和噪聲誤差。以上二個方法也是僅適用于一維數據的發布。Cormode 等人針對特定數據類型,通過基于差分隱私的采樣-過濾的數據發布技術簡化步驟、降低敏感度,解決了由于數據稀疏添加過大的噪聲而導致查詢結果偏差很大的問題,但該算法的局限性在于返回結果的可用性較低[17]。
          .............................

          第二章 相關背景知識介紹

          2.1隱私泄露和隱私保護
          在用戶進行瀏覽網站和網上消費時,用戶無意的將自己的相關信息保留在互聯網中。那么當攻擊者獲取到這些信息時,通過數據分析和挖掘就會得到數據中有用的信息,這些信息可能會導致用戶的隱私信息泄露。
          2.1.1 隱私泄露
          隱私的概念最早可以追溯到社會學[25,26],隱私是指個人、組織機構等實體不愿意被外部知曉的信息[27]。例如,個人的家庭住址、健康情況等。用戶在使用不同的移動設備和網絡應用時自身的信息會共享在網絡上,同時數據收集者公開發布的用戶者的數據,這些都有可能存在著被非法分子攻擊的風險。而攻擊者通過自身已知的用戶信息對獲取到的數據進行定位到與用戶相關的數據,從而導致用戶的隱私泄露。攻擊者還可以對獲取到的數據進行數據分析得到與該用戶的群體關聯信息和特征信息,然后通過自身的用戶背景知識對這些關聯信息和特征信息進行數據挖掘出用戶的隱私信息。
          2.1.2 隱私保護
          隨著互聯網和大數據技術的快速發展,隱私泄露的途徑也變的多種多樣,攻擊者的手段也是越來越多。因而,隱私泄露的問題也是越來越嚴重,所以對數據的隱私保護發布技術研究成為現在的學術熱點。用戶的數據記錄由敏感屬性和非敏感屬性組成,一般用戶個體可以通過非敏感屬性與敏感屬性建立聯系,無法直接與敏感屬性的某一屬性值建立聯系。因此,攻擊者需要通過獲取部分或者全部非敏感屬性的屬性值來與敏感屬性的屬性值建立起聯系。所以隱私保護的技術需要切斷用戶與這些敏感屬性之間的聯系來達到隱私保護。目前的隱私保護方法通常都是通過切斷用戶和非敏感屬性之間的聯系或者是切斷非敏感屬性和敏感屬性之間的聯系來達到隱私保護的效果。數據挖掘的隱私保護通常都是切斷非敏感屬性值與敏感屬性值之間的聯系,在隱私保護的過程中對其可能泄露的敏感屬性進行規則隱藏,然后將非敏感屬性直接發布。數據發布的隱私保護通常是通過隱私保護方法處理得到匿名數據再將其發布。因此對于以上的二種方法目前的隱私保護發布算法都有用到。研究者一般利用以上的一種或者兩種方法組合對原始數據進行處理,切斷目標用戶和其敏感屬性值之間的聯系。
          .............................

          2.2 差分隱私及數據發布概述
          差分隱私是由 Dwork 等人在 2006 年提出,該模型主要的核心思想是對原始數據集劃分后的數據集或者對其查詢的結果添加噪聲來達到隱私保護的效果。這種通過添加噪聲對數據集進行擾動作用就是一種數據發布技術,對于數據集的隱私發布一般都是要借助數據發布技術來實現對數據的隱私保護。
          2.2.1 差分隱私定義與相關概念
          隨著信息時代的到來,數據隱私得到人們的廣泛關注以及成為學術界的熱點問題,雖然也出現了諸多的隱私保護框架的保護方法,例如,
          k-匿名[28]、l-diversity[29]、t-closeness[30]等。但是這些方法都需要特殊的攻擊假設和背景知識。而差分隱私模型定義了一個極強的攻擊模型,假設攻擊者擁有除了目標記錄外的所有信息,通過分析和挖掘也無法得到目標記錄的任何隱私信息,并且對某一個數據集中插入和刪除一條記錄確保不影響查詢的結果。
          如圖 2.1 所示,描述了隨機算法 A 利用對輸出結果隨機化提供隱私保護,通過對參數來確保在刪除數據集中一條記錄輸出同一結果的概率不會發生顯著的變化。因此對于隱私預算的合理分配也是非常的關鍵,也是本文研究的重點之一。
          圖 2.1 隨機算法在鄰近數據集上的輸出概率圖
          .................................
           
          第三章  基于標準差圓半徑的隱私預算分配模型(PBA) .................................. 21
          3.1數據集分布特征的計算方法的分析與實現.......................................... 21
          3.1.1  數據集分布特征的計算方法分析............................. 21
          3.1.2  數據集分布特征的計算 ......................... 23
          第四章  基于標準差圓半徑的自適應網格劃分模型(SDCAG) ............................. 29
          4.1SDCAG 模型設計 ................................... 29
          4.1.1  設計目標 ........................................ 29
          4.1.2 SDCAG 流程設計 .................................. 29
          第五章  實驗與結果分析 .................................... 35
          5.1實驗環境與數據集 ...................................... 36
          5.2實驗方法 ................................ 36

          第五章   實驗與結果分析

          5.1實驗環境與數據集
          本文所有的實驗都是在 Windows10 的 64 位操作系統下進行的,CPU 型號為 1.6GHz 四核的第八代 Intel Core i7。實驗的程序使用 java 語言進行編寫,編譯平臺使用的是 IDEA,運行環境是 jdk1.8。
          我們的實驗對象是建立在三個真實的數據集上,將傳統的隱私保護算法和本文提出的算法應用到這些數據集上,然后比較它們范圍查詢的查詢精度,從而反映它們的隱私保護效果,得到相關的結論。
          首先,將這三個來自真實的數據集映射到二維空間坐標系上,每個點表示一個數據點,如圖 5.1 所示是三個數據集映射到二維平面坐標的可視化圖。
          圖 5.1 數據集可視化結果圖
          ............................
           
          第六章 總結與展望

          6.1總結
          隨著大數據技術的快速發展,數據集的共享需求也是不斷的增加,這讓數據集的隱私保護得到了重視。因而針對基于差分隱私的數據集發布的隱私保護模型和算法的研究已成為學術領域廣泛關注的熱點。因此,本文對現有的基于差分隱私的空間數據集發布中的隱私保護研究做出分析,發現現研究沒有充分的考慮到數據集的分布特征,進而沒有合理的對網格進行隱私預算的分配,從而在添加噪聲階段產生較大的噪聲誤差。同時沒有兼顧到用戶的查詢粒度,從而導致在網格劃分的第二層易產生較大的查詢誤差,從而增大了相對誤差和降低數據集的查詢精度和可用性。因此,本文針對上述問題提出了基于標準差圓半徑的自適應網格劃分模型,并通過實驗對其進行論證,本文的主要的研究成果和工作總結如下:
          (1)  對數據集分布特征的研究和分析,針對現有的隱私保護研究中,沒有給出一種能夠對數據集分布特征定量計算的方法。本文通過借助標準差圓半徑來刻畫數據集的離散程度,從而對數據集的分布特征進行描述。并將其引入到本文提出的算法模型中,在對數據集進行網格劃分的同時計算出劃分后的網格的標準差圓半徑,從而表示該網格中數據集的離散程度,以此來描述數據集的分布特征。最終,給出了一種定量計算數據集分布特征的方法,實現了對數據集的分布特征進行定量的描述。
          (2)  對數據集的隱私預算分配進行研究和分析,針對現有差分隱私保護研究中,沒有給出一種能定量的對數據集的隱私保護需求進行計算的方法。本文在對數據集的分布特征描述的基礎上,在對數據集劃分后,計算出每個數據網格的標準差圓半徑在當層數據層中的占比來表示數據集的隱私保護需求,即隱私保護需求力度。通過引入隱私保護需求力度的概念,以此來定量的描述數據集的隱私保護需求,然后根據隱私保護需求按需的對其進行分配隱私預算
          (3)  對數據集進行降噪的研究和分析,針對現有的基于差分隱私的數據集發布的研究中,沒有充分的考慮到數據集的分布特征,從而沒有對隱私預算進行合理的分配,從而導致在添加噪聲階段產生較大的噪聲誤差,進而使得數據集的可用性大大降低。同時沒有兼顧到用戶的查詢粒度,導致在網格劃分的第二層網格易產生較大的查詢誤差。本文在定量的對數據集的隱私保護需求描述基礎上,通過隱私保護需求力度來對數據集的隱私預算進行按需分配,從而在添加噪聲階段,根據不同的隱私預算添加相應的噪聲,有效降低了噪聲誤差。針對用戶的查詢粒度,在第二層網格的劃分,通過過濾和分桶的處理,能夠有效的降低產生額外的噪聲誤差,最后通過后置處理能夠提高查詢精度。這些操作大大的降低了噪聲誤差,提高了數據集的可用性,從而實也提高了數據集的可用性。
          參考文獻(略)


          原文地址:http://www.lov2go.com/jsjlw/29721.html,如有轉載請標明出處,謝謝。

          您可能在尋找計算機論文方面的范文,您可以移步到計算機論文頻道(http://www.lov2go.com/jsjlw/)查找


          桐庐| 桥口| 五莲| 蒙自| 永济| 睢宁| 邱北| 七台河| 胡尔勒| 应县| 昔阳| 乌兰浩特| 天长| 平罗| 麦盖提| 台北县| 卫辉| 深泽| 龙里| 莫索湾| 石渠| 湟源| 桐梓| 乐东| 靖边| 贵德| 渑池| 泗洪| 安庆| 泰顺| 眉山| 东川| 万州龙宝| 高邑| 儋州| 台江| 兴仁堡| 揭阳| 青铜峡| 威远| 正兰旗| 临潭| 安乡| 梨树| 石拐| 广宗| 陵川| 周村| 额济纳旗| 保德| 五常| 仁怀| 嘉禾| 卢龙| 盐边| 木垒| 泸县| 晋城| 蒙城| 九寨沟| 凌海| 成武| 虞城| 武夷山| 恩施| 来凤| 遂平| 云梦| 隆子| 苏尼特右旗| 台北市| 沙雅| 阿拉善左旗| 临沧| 乐清| 防城| 汨罗| 萝北| 昌都| 涟源| 镇赉| 台中| 翁牛特旗| 秦安| 柳州| 宣威| 大理| 宿州| 集安| 石棉| 弋阳| 马鞍山| 西沙| 咸宁| 磐石| 正宁| 婺源| 河口| 林口| 铁卜加寺| 翁源| 永平| 河池| 依兰| 通河| 凉山| 榕江| 江浦| 伊和郭勒| 香格里拉| 阿坝| 库米什| 昆山| 罗城| 沧州| 林州| 阳春| 依安| 延吉| 东兰| 涿州| 克东| 通什| 罗甸| 神农架| 东吉屿| 海伦| 淇县| 罗定| 大同| 永城| 晴隆| 蔚县| 高唐| 固始| 长葛| 平罗| 上犹| 资溪| 泾川| 邹平| 吉兰太| 利辛| 类乌齐| 永新| 北戴河| 米林| 盈江| 泗水| 息烽| 酉阳| 太原南郊| 弋阳| 龙胜| 旅顺| 通辽| 眉县| 浩尔吐| 泸西| 钟山| 庐山| 汝阳| 泊头| 嘉禾| 布尔津| 吕泗| 河池| 寿宁| 乌拉特中旗| 靖边| 瓜州| 德清| 石城| 普定| 辰溪| 苍南| 临潭| 莱州| 阿拉善左旗| 寻乌| 郑州| 永福| 武陟| 东营| 扎鲁特旗| 中环| 宁化| 满都拉| 禹城| 云浮| 寿阳| 房县| 仁怀| 开平| 固原| 淮南| 清镇| 绵阳| 犍为| 九江| 大丰| 临邑| 黔江| 炎陵| 江孜| 马公| 石家庄| 朔州| 兴国| 七台河| 浦北| 武穴| 三亚| 建昌| 河卡| 灌南| 通城| 磐安| 舟山| 皋兰| 东阿| 大宁| 桦川| 福州郊区| 南县| 武都| 石拐| 泗县| 宝过图| 鄂托克前旗| 莫力达瓦旗| 大洼| 哈密| 无为| 晴隆| 清兰| 伊克乌素| 安丘| 类乌齐| 铜仁| 无为| 庆城| 乌拉盖| 乳山| 建平| 徐州| 防城港| 乐东| 南乐| 通江| 丰润| 沙雅| 西平| 新龙| 阳山| 普格| 南澳| 和林格尔| 红柳河| 仙居| 如皋| 岢岚| 德惠| 威远| 天池| 景洪电站| 淳安| 靖西| 十堰| 会东| 浦东| 吴起| 吴忠| 永定| 攀枝花| 烟台| 莫索湾| 宝兴| 平昌| 棠荫| 公安| 五台山| 阿克陶| 盐城| 临县| 松桃| 青州| 宁都| 曲周| 巴东| 仁寿| 庆安| 北塔山| 马公| 郎溪| 德格| 珙县| 宣汉| 天河| 金寨| 鹿邑| 库尔勒| 永昌| 兴平| 福贡| 敦煌| 北镇| 松滋| 海力素| 织金| 安新| 霍城| 汉川| 会泽| 青浦| 汤河口| 循化| 贡嘎| 武城| 离石| 同江| 耒阳| 六盘山| 睢阳区| 正宁| 青冈| 鹿邑| 东丽| 商水| 乳源| 苏尼特左旗| 乌海| 舟曲| 乌当| 钦州| 朱日和| 江宁| 温州| 沛县| 柯坪| 昌乐| 伊春| 临湘| 京山| 阿拉善右旗| 原平| 雅江| 平鲁| 澜沧| 喀什| 攸县| 华坪| 屯留| 银川| 安吉| 靖安| 隆昌| 南澎岛| 偏关| 兴县| 靖宇| 腾冲| 宿松| 温泉| 蔚县| 会同| 洛川| 揭西| 于田| 怀化| 陈巴尔虎旗| 西沙| 灵宝| 凭祥| 杭锦旗| 清水| 仙桃| 靖江| 湖州| 舞阳| 兴海| 杭锦后旗| 三河| 斋堂| 文成| 天镇| 南岳| 廊坊| 清远| 易县| 玛曲| 饶平| 营口| 眉县| 咸宁| 铅山| 无为| 方城| 类乌齐| 天山大西沟