2020年2月29日 星期六

Python 程式設計-李明昌 <免費電子書> book

Python 程式設計-李明昌 免費電子書 - PDF 分享, 220頁


檔名: Python_Programming_Lee.pdf

包括以下10個章節:

第 1 章 Python 語言簡介
第 2 章 Anaconda 簡介與安裝
第 3 章 Python 語法與流程控制
第 4 章 資料型別與資料處理
第 5 章 檔案匯入與匯出
第 6 章 視覺化應用
第 7 章 迴歸分析
第 8 章 決策樹
第 9 章 關聯規則應用
第 10 章 推薦系統

下載: https://github.com/rwepa/DataDemo/blob/master/Python_Programming_Lee.pdf

2024.11.19 Updated

PDF P.19

Python 程式設計-李明昌 - ipynb


檔名: Python_Programming_Lee_ipynb.zip

包括 Python 程式設計-李明昌電子書的原始 ipynb 檔案, 圖檔, 部分資料集

下載: https://github.com/rwepa/DataDemo/blob/master/Python_Programming_Lee_ipynb.zip

# python
# anaconda
# jupyter notebook
# machine learning
# matplotlib
# scikit-learn
# recommender system

2020年2月23日 星期日

R語言機器學習應用班 Machine Learning in R

R語言機器學習應用班

http://www.asia-analytics.com.tw/tw/edu/e-hot-1090407.jsp

四大主軸:

1. R/RStudio操作與資料匯入

2. 資料處理與視覺化應用

3. 機器學習基礎操作

4. 機器學習進階應用


# R
# visualization
# machine learning
# 關鍵八步(匯入、摘要、樞紐、篩選、排序、NA值、轉換、合併)
graphics
# ggplot2
# arules
# party
# randomForest
# caret
@ 無需程式設計基礎
# end

2020年2月13日 星期四

2020新型冠狀病毒視覺化

Visualizing the COVID-19

# COVID-19
# 新型冠狀病毒
# 視覺化
# visualization
# get 函數
# leaflet 套件


本篇文章說明新型冠狀病毒全球分佈視覺化分析

參考資料: https://systems.jhu.edu/research/public-health/ncov/

資料集: https://github.com/CSSEGISandData/COVID-19


  • 使用 leaflet套件, 使用者可以與視覺化地圖建立互動式操作.
  • get {base} 函數可將字串轉換為欄位名稱
  • aggregate {stats} 可計算每個國家群組之小計



2019年11月22日 星期五

R入門資料分析與視覺化應用, R商業預測與應用-線上課程

<<< 預購日起跑 >>>
面對大數據時代的來臨,如何善用免費R語進行資料分析與資料視覺化技術,建置企業智慧服務應用,從大數據之中找出潛在樣式或偵測出異常特性,以做為企業組織策略發展、尋求突破與企業創新服務,將是企業衝量經營績效與提升競爭力的重要基礎。本線上課程讓您學會分析商業資料企業營運預測模型,建置R商業運算思維能力。

1. R入門資料分析與視覺化應用

https://mastertalks.thinkific.com/courses/R-teacher



2. R商業預測與應用

https://mastertalks.thinkific.com/courses/R-2-teacher


#MasterTalks-R線上課程
#資料分析關鍵八步
#資料視覺化應用
#商業預測應用

2019年11月4日 星期一

2019人工智慧與商業應用研討會

2019人工智慧與商業應用研討會


# AI
# big data
# conference
# tutorial


人工智慧(Artificial Intelligence,AI)不但是現今國際的趨勢,更隨著演算法的精進以及電腦設備的完備,成為現今人人不可不認識的議題。在各國積極投入於發展人工智慧技術與應用時,臺灣也不例外,行政院在2018年提出了「臺灣AI行動計畫」,希望透過臺灣既有優勢朝尖端智慧國家邁進。而AI從巨量資料、機器學習甚至深度學習等層面被廣泛的認識,不同領域關注的角度亦有所不同。
在商業環境中,企業更將著手透過人工智慧改善流程,且透過新穎思維提供更高品質的服務與產品,進而改變既有的經營文化。因此本屆「2019年人工智慧與商業應用研討會」,將邀請各方學者專家,將創新思維融入人工智慧技術,並結合於商業管理、學習與教育、智慧製造、實務案例分享等專業議題,探討更多未來發展,期待對與會者有所啟發。

研討會日期:
2019年11月15日(五) 上午9點

研討會地點:
國立臺北商業大學 承曦樓十樓國際會議廳
台北市中正區濟南路一段321號

主辦單位:國立臺北商業大學管理學院
合辦單位:東吳大學巨量資料管理學院

網站: http://ms.ntub.edu.tw/~AI_conference/index.html
# end


2019年11月2日 星期六

R如何轉換為有效的欄位名稱 - make.names {base}

使用 Excel 等軟體進行資料分析時, 欄位名稱可以儲存為空白符號, 但是使用R軟體時, 不方便使用包括空白符號之欄位名稱, 此時可以先使用 make.names 函數將資料轉換為有效的合法名稱, 此函數是屬於基本30個套件之一, 即是 base 套件, 轉換後會將空白等字元以點符號「. 」表示.



# readr套件
# read_csv
# names
# make.names

練習範例:

步驟1: 下載936萬筆每小時臭氧資料 hourly_44201_2018.csv

1.連結: https://github.com/rwepa/DataDemo/blob/master/README.md
2.選取 hourly_44201_2018.csv 說明
3.下載 hourly_44201_2018.zip, 再解壓縮檔案為 hourly_44201_2018.csv (2.05GB)

步驟2: 匯入資料, 分別使用read.table 與 read_csv{readr}, 結果顯示使用readr套件較快速

# 方法1: 使用傳統read.table匯入資料
system.time(mydf <- read.table("hourly_44201_2018.csv", header=TRUE, sep=",")) # 113.45秒

# 方法2: 使用readr套件匯入資料
library(readr)
system.time(ozone <- read_csv("hourly_44201_2018.csv")) # 9366419*24, 47.67秒

# 步驟3: 選取部分欄位
names(ozone)
ozone$Sample Measurement # 因為欄位名稱中間有空白, 因此會有ERROR
ozone$`Sample Measurement` # 顯示正確, 使用「`」符號

#  步驟4: 使用 make.names  函數, 欄位名稱已經改為合法名稱
names(ozone) <- make.names(names(ozone))
names(ozone)

# end

2019年10月16日 星期三

課程調查問卷1-R 語言在企業數據分的應用

歡迎對學習R及R應用的R友來填寫問券, 保證不花您超過五分鐘, 就可以幫助我們將課程設計得更完美 ^_^ 

填問券還可以參加課程抽獎喔! 謝謝大家

問卷網址: https://www.surveycake.com/s/Go0Gr

資料來源: MasterTalks線上課程
# end