顯示具有 data mining 標籤的文章。 顯示所有文章
顯示具有 data mining 標籤的文章。 顯示所有文章

2013年11月4日 星期一

近期R資料探勘與R資料視覺化課程

參考下列近期 R資料探勘與R資料視覺化課程(依上課日期排列):

1. 資策會教育訓練研究所
課程:Big Data資料分析二部曲-R軟體與資料探勘
上課日期:102年11月23日~24日

2. 資策會教育訓練研究所
課程:Big Data資料分析三部曲-R軟體與資料視覺化
上課日期:102年11月30日~12月1日

3. 研碩資訊
課程:輕鬆學會 R 軟體 --- 資料視覺化
上課日期:102年12月2日~3日

2013年9月10日 星期二

2013 R Taiwan 研討會與徵求演講! (12月6日星期五)

Dear All,

中華R軟體學會將在102年12月6日 (星期五) 辦理"2013 R Taiwan 研討會", 參考以下說明, 期待您的參與.

2013 R Taiwan 研討會與徵求演講! (12月6日 星期五)

大會宗旨:本研討會旨在提供學術界與產業界一個交流平台,針對 R軟體各領域的應用,進行觀摩討論,期使R軟體深植於學術研究與產業活動中。

舉辦日期:102年12月6日 (星期五)

舉辦地點:德明財經科技大學(綜合大樓A506會議廳)

主辦單位:中華R軟體學會‧德明財經科技大學(管理學院物流管理系暨連鎖加盟學位學程)

協辦單位:台灣資料科學與商業應用協會‧台北商業技術學院資訊與決策科學研究所‧
                    東吳大學海量資料分析研究中心‧育達科技大學資訊管理系所‧Taiwan R User Group

徵求主題:
請提供一頁A4摘要,寄送至下列電子郵件(event2013@twdatascience.org),內容與R軟體在下列主題之應用相關,但不僅限於下列應用:

1.資料探勘
2.機器學習
3.多變量統計
4.穩健統計方法
5.資料視覺化
6.實驗設計
7.最佳化應用
8.生物資訊學
9.計量經濟學與財務
10.環境與生態統計
11.醫藥統計學
12.心理計量學
13.空間統計學
14.社會與政治科學統計
15.高效能運算

大會網址:http://www.twdatascience.org/event2013

★歡迎對 R 軟體有興趣之各界人士踴躍參加★

2013年8月10日 星期六

Data mining with Rattle – ROC curve (SVM and NN)

# 範例說明 R圖形化使用者介面 rattle 套件 執行 ROC curve 比較


步驟 1
安裝並執行 rattle 套件-資料探勘使用者介面
install.packages(“rattle”)
library(rattle)
rattle()

步驟 2
匯入kernlab套件的資料集spam, 一般採用 spam {kernlab} 表示, 步驟如下:

Data \ Source: 選取 Library \ Data Name: 選取 spam:kernlab:Spam E-mail Database \ 執行.

匯入 spam 資料結果, 此為垃圾郵件資料集, 其中第58個變數是目標變數且為類別型資料, R中屬於因子(factor)資料物件, 在最下列訊息區顯示全部有 4601筆觀測值, 58個輸入變數, 可使用分類模型.

步驟 3
Rattle Support Vector Machines 方法, 採用 kernlab 套件的ksvm方法, R console 視窗中輸入以下指令可查詢其使用說明.
library(kernlab)
?ksvm

Model \ Type 選取 SVM \ Kernel 採用預設值 Radial Basis (rbfdot) \ 執行.

步驟 4
使用 Neural Network 方法, Rattle 採用 nnet 套件的nnet 方法, 該方法採用Feed-forward neural networks 且為一個隱藏層 (hidden layer), 預設節點數是十個.
Model \ Type 選取 Neural Net \ 執行.

步驟 5
模式比較主要採用 ROC curve 方法.

Rattle 會針對之前已完成的模型進行效益評估.

Evaluate \ Type: 選取 ROC \ Model: SVM , Neural Net 打勾 \ 按 執行.

步驟 6
考慮實際結果有二種情形(Yes, No), ROC curve視窗中x軸表示 False Positive (FP) rate (實際為N, 但預模型分類為Y, 此時FP愈小愈好), y軸表示 TP rate (實際為Y, 且預模型分類為Y, 此時FP愈大愈好), 因此, ROC曲線愈偏向左上角愈好,即曲線以下面積較大者較佳. 由圖形可知 ksvm 較偏向於左上角位置, 因此採用 svm 較佳。

下載說明: r-rattle-ROCcurve.pdf
# end

2013年1月4日 星期五

e1071 package - 支持向量機(Support Vector Machines, SVM)

支持向量機(Support Vector Machines, SVM)基本概念介紹 。
檔案:svm_introduction.pdf
頁數:19
大小:小於1MB

R 的 SVM 使用說明, 範例包括:214筆資料,輸入變數維度為9個 。
檔案:svm-example-R.pdf
頁數:4
大小:小於1MB
說明:
資料集 Glass 已收錄於 mlbench 套件(Machine Learning Benchmark Problems),因此修改R為:
> library(e1071)
> library(mlbench)
> data(Glass)
更新日期:2009/4/17

arules package -北風資料庫操作篇

文章說明將資料轉換至 transactions 格式說明。
檔案:AssociationRules_northwind.pdf
頁數:4
大小:小於1MB

北風資料庫範例檔:
步驟1:建立 c:\temp 目錄 。
步驟2:檔案(northwind_trans.csv)複製至 c:\temp 目錄。
銷售明細: 包括 2153 筆記錄,其中產品名稱 為 item001~item077(銷售77種產品)。
檔案:northwind_trans.csv
大小:小於1MB

北風資料庫範例檔案 - R 程式檔
檔案:AssociationRules_northwind.R

arules package - 提供資料探勘中關聯規則apriori algorithm

檔案:AssociationRules.pdf
頁數:8
大小:小於1MB

關聯規則範例檔案 - R 程式檔 ,記得先下載 arules 套件。
檔案:AssociationRules.R