|
關注:1
2013-05-23 12:21
求翻譯:Hadoop是當前流行的分布式計算框架。本文研究基于hadoop的k-means聚類算法和TFIDF算法,分別實現及優化這兩種算法并在單機狀況及集群狀況下進行試驗。本文實現并行化的K-means算法和TFIDF算法并針對傳統K-means算法的存在的一個問題進行優化,即初始聚類劃分對算法執行時間有很大影響,本文將傳統算法的隨機選擇初始聚類劃分的方法進行改進,進行兩種改進,分別為均分向量空間產生聚類中心方法及Canopy方法進行對初始聚類中心的選擇,本文通過對圖片數據中提取的SIFT特征值作為K-means聚類算法和TFIDF算法的輸入,在大規模的數據集進行試驗,實驗結果表明優化后的算法在速度相對傳統算法有很大的提升并在實際領域中有著是什么意思?![]() ![]() Hadoop是當前流行的分布式計算框架。本文研究基于hadoop的k-means聚類算法和TFIDF算法,分別實現及優化這兩種算法并在單機狀況及集群狀況下進行試驗。本文實現并行化的K-means算法和TFIDF算法并針對傳統K-means算法的存在的一個問題進行優化,即初始聚類劃分對算法執行時間有很大影響,本文將傳統算法的隨機選擇初始聚類劃分的方法進行改進,進行兩種改進,分別為均分向量空間產生聚類中心方法及Canopy方法進行對初始聚類中心的選擇,本文通過對圖片數據中提取的SIFT特征值作為K-means聚類算法和TFIDF算法的輸入,在大規模的數據集進行試驗,實驗結果表明優化后的算法在速度相對傳統算法有很大的提升并在實際領域中有著
問題補充: |
|
2013-05-23 12:21:38
正在翻譯,請等待...
|
|
2013-05-23 12:23:18
正在翻譯,請等待...
|
|
2013-05-23 12:24:58
Hadoop is the current popular distributed computing frame.This article studies based on the hadoop k-means cluster algorithm and the TFIDF algorithm, separately realizes and optimizes under these two algorithms and carries on the experiment in the single plane condition and the colony condition.This
|
|
2013-05-23 12:26:38
正在翻譯,請等待...
|
|
2013-05-23 12:28:18
正在翻譯,請等待...
|
湖北省互聯網違法和不良信息舉報平臺 | 網上有害信息舉報專區 | 電信詐騙舉報專區 | 涉歷史虛無主義有害信息舉報專區 | 涉企侵權舉報專區