RWEPA | VirtualBox + Ubuntu + R + RStudio 簡介
🌸YouTube (包括中文字幕):https://youtu.be/DxZUj9quKEI
RWEPA | VirtualBox + Ubuntu + R + RStudio 簡介
🌸YouTube (包括中文字幕):https://youtu.be/DxZUj9quKEI
第6集-小明算命師(下 ) - 第1季完結篇
提供簡單易懂 R shiny 套件教學, 建立互動式網頁服務與企業級儀表板.
本集包括以下特色:
提供簡單易懂 R shiny 套件教學, 建立互動式網頁服務與企業級儀表板.
提供簡單易懂 R shiny 套件教學, 建立互動式網頁服務與企業級儀表板.
提供簡單易懂 R shiny 套件教學, 建立互動式網頁服務與企業級儀表板.
【謝謝各位大大按 讚、訂閱、開啟小鈴鐺】
OpenAI [https://openai.com/] 相繼推出 GPT-3 語言模型與 DALL-E2 AI 產生器, 使用者只要輸入文字, 即可以產生的超現實主義圖片, 參考圖1所示, 本篇文章示範 R 與 openai 套件的應用.
圖1 太空人騎馬照
標準差之計算在 Python, R 結果都相同嗎?
感謝 Pei-Chun 提供 Python 問題.
統計學的標準差(Standard Deviation, SD)可以區分為母體標準差與樣本標準差, 符號之說明如下:
σ: 母體標準差, N: 母體個數, μ: 母體平均值
s: 樣本標準差, n: 樣本個數, x_bar: 樣本平均值
母體標準差與樣本標準差之計算公式:
考慮資料集為 {1,2,3,4,5}, μ = (1+2+3+4+5)/5=3, 使用公式法計算結果:
母體標準差 σ =(((1-3)^2+...+(5-3)^2)/5)^0.5=1.414214 (分母為5)
樣本標準差 σ =(((1-3)^2+...+(5-3)^2)/4)^0.5=1.581139 (分母為4)
使用 numpy.std 函數可以計算標準差, 分母預設值為樣本數 n, 其中參數 ddof(Means Delta Degrees of Freedom) 的預設值為 ddof=0, 如果設定 ddof=1, 則分母為 n-1, 詳細參考線上說明 [LINK].
Python-pandas 模組-不含NA值
使用 pandas.describe 函數以計算標準差, 其預設值為 n-1.
使用 df.describe().iloc[2,0] 取出 std 值, 另外也可以使用 df.describe().loc['std'] 取出 std值.
上述討論都沒有NA值的情形, 如果資料包括NA值時, 其計算結果為 nan, 使用 numpy.nanstd 函數可以忽略 NA值並計算標準差.
R-不含NA值
使用 sd {stats} 函數可計算標準差. stats 為R內建30個標準套件之一, 啟動R時, 已經載入該套件. 計算結果分母採用 n-1.
R-有NA值
如果資料有NA值, 則 sd 計算結果為 NA.
使用 na.rm = TRUE 參數可忽略NA值並計算標準差.
結論
使用 Python 與 R 語言須確認計算標準差之意義, 如果資料有NA值, 須特別小心處理.
# end
近日安裝 Windows 與 R之後會有以下 normalizePath 語法錯誤:
查詢發現電腦確實有以下之目錄 C:\Users\asus\OneDrive\文件, 因此最有可能原因是此路徑包括中文字型"文件", 因此R解析結果為錯誤??
使用 path.expand 函數亦是錯誤
> path.expand("~/")
[1] "C:/Users/asus/OneDrive/??/"
使用 normalizePath 函數也有錯誤
> normalizePath(path.expand("~/"))
[1] "C:\\Users\\asus\\OneDrive\\??\\"
Warning message:
In normalizePath(path.expand(path), winslash, mustWork) :
path[1]="C:/Users/asus/OneDrive/??/": 檔案名稱、目錄名稱或磁碟區標籤語法錯誤。
變數名稱: HOME
變數值: C:\Users\asus
> path.expand("~/")
[1] "C:/Users/asus/"
> normalizePath(path.expand("~/"))
[1] "C:\\Users\\asus"
# end
iPAS - 巨量資料分析師認證 - 免費線上參考課程
講師:李明昌
考試網址:https://www.ipas.org.tw/bda/
網址:https://collegeplus.itri.org.tw/course/1161
單元一:資料類型與物件
單元二:資料庫概念(含NoSQL)
單元三:資料匯入與匯出
網址:https://collegeplus.itri.org.tw/course/1162
單元一:程式設計類型
單元二:自訂函數與控制敘述
單元三:程式除錯與效能提升方法
網址:https://collegeplus.itri.org.tw/course/1165
單元一:資料組織與清理(1)
單元二:資料組織與清理(2)
單元三:資料摘要與彙總(1)
單元四:資料摘要與彙總(2)
單元五:屬性轉換與萃取(1)
單元六 : 屬性轉換與萃取(2)
單元七 : 巨量資料處理概念(1)
單元八 : 巨量資料處理概念(2)
網址:https://collegeplus.itri.org.tw/course/1166
單元一:統計分析基礎(1)
單元二:統計分析基礎(2)
單元三:統計分析基礎(3)
單元四:探索式資料分析與非監督式學習(1)
單元五:探索式資料分析與非監督式學習(2)
單元六:線性模型與監督式學習(1)
單元七 : 線性模型與監督式學習(2)
# end
R-4.2.0, RStudio-2022.02.2+485 - Windows更新事項
近日公佈二門課程,歡迎各位R友參考。
時間:7小時28分鐘,附中文字幕
網址:https://mastertalks.tw/products/r?ref=MCLEE
時間:8小時53分鐘,附中文字幕
網址:https://mastertalks.tw/products/r-2?ref=MCLEE
二門合購優惠價77折:4,728元 (價格以網站公告為主)
#R
#tutorial
#visualization
#bigdata
#machine learning
#prediction
#programming
主題
R與實驗設計應用
大綱
執行成果
程式碼,講義下載
Github: https://github.com/rwepa/DataDemo/blob/master/R_Design_Of_Experiments.R
PDF: https://github.com/rwepa/DataDemo/blob/master/R_Design_Of_Experiments.pdf
參考資料
# end
更新
2021.4.1
更新至最新版本至R-4.0.5, Windows and Mac 使用時皆不會有中文亂碼.
問題
近日 Windows 系統更新至最新版本 R-4.0.4, 使用時會有中文亂碼問題???
方法
下載最新更新檔即可解決此問題.
檔名: R-4.0.4patched-win.exe
參考: https://cran.r-project.org/bin/windows/base/rpatched.html
下載: https://cran.r-project.org/bin/windows/base/R-4.0.4patched-win.exe
關鍵字
#R
#debug