機器學習(Machine Learning)
修訂日期:104/09/17
班級:研究所二年級 學分:3學分
任課教師:吳智鴻 任課科系:數位內容科技學系
TEL:04-22183024 E-mail: chwu@ntcu.edu.tw
一、本課程之學習目的與教學目標
本課程著重在使學生瞭解電子商務與網路行銷的最新發展、發展歷史、相關技術與軟體介紹,並學會如何使用與應用電子商務與網路行銷的相關工具、相關論文、相關理論與目前最新的商業模式發展趨勢。本課程著重在使學生瞭解電子商務與網路行銷的最新發展、發展歷史、相關技術與軟體介紹,並學會如何使用與應用電子商務與網路行銷的相關工具、相關論文、相關理論與目前最新的商業模式發展趨勢。
二、本課程之主要講授重點與範圍:
機器學習這門學科所關注的問題是:電腦程式如何隨著經驗累積自動提高性能。近年來,這個學科的基礎理論和演算法有了重大的進展也成功地應用於很多領域。本課程主要的目標是介紹機器學習中核心的演算法和理論。本課程將介紹機器學習與資料探勘的概念、應用與技術。在資料探勘技術方面,主要介紹如何分析資料之間的關聯性與事件發生的順序性,並深入各種關聯規則探勘演算法的技術與比較,與各種序列型樣探勘演算法的技術與比較。本課程著重在研究1. 最佳化演算與2.關聯規則與3.分類的應用與探勘方法,學生需找尋並報告與此領域相關的學術研究論文,使學生能熟悉並深入機器領域的研究方向,讓學生能確實擁有從大量資料中掘取重要資訊以從事決策分析的能力。
課程目標
學生將於本課程學得下列知識:
- 機器學習與資料探勘的意義與應用
- 各種最佳化提高性能技術
- 各種關聯規則探勘技術
- 機器學習與資料探勘在學習、分類、預測、行銷、財務、管理上的應用
課程大綱
- 機器學習與資料探勘的概念、意義與實際案例應用(例如數字、文字辨識)
- 最佳化的演算法(例如基因演算法、PSO演算法、分散式計算)
- 關聯規則探勘演算法(例如Affinity set、rough set)
- 分類的應用與探勘方法(例如類神經網路、決策樹)
三、本課程之教學方法:
每週三小時原理解說,並請同學找相關資料報告。
上課講解、個案討論、期中報告、期末報告
本課程主要是訓練學生具備機器學習之重要演算法、理論及相關應用。並指導使用機器學習相關軟體,輔以實際案例來分析。課程內容涵蓋概念學習、決策樹學習、案例式學習…等。藉由課堂講解與期末作業的方式,讓學生能確實擁有較進階解決問題與決策分析的能力,同時可為往後相關課程奠定智慧型學習理論的基礎。
四、本課程之評量方式與時間:
- 課程作業、上台報告 30%
- 期中專案報告 30%
- 期末專案報告 40%
七、本課程之教學進度:(請詳填於課程進度表)
【教材下載】
週次 |
日期 | 課程內容 | 補充說明 | 論文 | |
1 |
09/17 | 課程介紹 (課程介紹PPT) 過去成果介紹 機器學習相關研究題目介紹
|
|
發明專利 |
|
2 |
09/24 | R Software Applications of Machine Learning (I)
|
FB爬蟲程式 |
||
3 |
10/01 |
Applications of Machine Learning (I) Text Mining專題 |
Vector Space Modeling (VSM)
|
|
|
4 | 10/08 | Applications of Machine Learning (II) | E-Learning |
||
5 | 10/15 | Applications of Machine Learning | Diseases Detection |
A Novel Multi-Objective Affinity Set Classification Heart Disease Classification Using Support Vector Based Classifiers Dataset 練習 |
|
6 | 10/22 | Prediction & Estimation Neural Network |
Support Vector Machine
|
|
|
7 | 10/29 | Feature Selection Techniques |
Factor Analysis Principle Component Analysis (PCA) |
||
8 | 11/05 | Spring Vacation Association Rule 規則分析演算法 |
Affinity Set Rough Set |
||
9 | 11/12 | 期中報告 |
分析報告說明 | ||
10 | 11/19 | WEKA用法 Association Rule 關連規則演算法 |
關連規則演算法 購物籃分析Apriori |
購物籃分析講義 | |
11 | 11/26 | Sequential Analysis |
次序分析演算法 |
Visual attention for solving multiple-choice science problem: An eye-tracking analysis (2012) (C&E) |
|
12 | 12/03 | 線上分析軟體 |
補充
|
||
13 | 12/10 | Decision Tree |
C&RT C5.0 |
||
14 | 12/17 | R Rattle()安裝 Prediction & Estimation Neural Network |
Bayesian Networks |
Paper 1 -貝氏網路在數學領域「數與量」主題測驗之應用- 以國小五年級「等值分數」單元為例 |
|
15 | 12/24 | Clustering Techniques MDS |
K-means MDS |
||
16 | 12/31 | Clustering Techniques | Kohonen Network |
Introduction Kohonen Self-Organizing Maps An Introduction to Kohonen Self Organizing Maps Demo Videos |
|
17 | 01/07 | TEXT-Mining專題 | Document Classification 專利資料庫
文件比對系統 斷詞 Term Frequence and Weighting
TF-IDF計算程式
|
部落格探勘--以網路電話產品為例 (Feature Selection) 以SVM建立專利分類系統 Patent Classification System using a new Hybrid Genetic Algorithm Support Vector Machine 標籤分析
Text mining TFIDF Packages in R |
|
18 | 01/14 | 期末報告 |
|
相關軟體
工具軟體
資料集
五、使用教材或參考書目:
[A] 黄文, 王正林,「利用R語言打通大數據的經脈」,佳魁資訊。
。
[B] 李仁鐘,「應用R語言於資料分析:從機器學習、資料探勘到巨量資料」,松崗。
[X] 簡禎富 / 許嘉裕,「資料挖礦與大數據分析 Data Mining & Big Data Analytics」,前程文化。
[C] 機器學習相關論文。
廖述賢、溫志皓,「資料探勘理論與應用:以IBM SPSS Modeler為範例」,博碩出版社。 |
|
彭文正,「資料採礦顧客關係管理暨電子行銷之應用」,維科出版社。 | |
|
尹相志譯,資料採礦網際網路應用與顧客價值管理,維科出版社。 |
參考書
- Michael J. A. Berry, Gordon S. Linoff, 資料採礦理論與實務:顧客關係管理的技巧與科學,維科出版社。
- 張云濤、龔玲,資料探勘原理與技術,五南出版社。
- IBM SPSS Modeler 14.0使用手冊。
--- 其他教材及參考書籍、資料將由教師於課堂上發放或指定。
六、有關學習建議事項:
學生需在老師指定之主題下,主動尋找相關資料與軟體,與提出可能應用方向,以及改進之方法。
「遵守智慧財產權觀念」及「不得非法影印」。
課外參考書籍
劉秀敏著,「電子商務生態系統研究」,社會科學文獻出版社。