機器學習(Machine Learning)

修訂日期:104/09/17
班級:研究所二年級 學分:3學分
任課教師:吳智鴻 任課科系:數位內容科技學系
TEL:04-22183024 E-mail: chwu@ntcu.edu.tw

 

一、本課程之學習目的與教學目標

本課程著重在使學生瞭解電子商務與網路行銷的最新發展、發展歷史、相關技術與軟體介紹,並學會如何使用與應用電子商務與網路行銷的相關工具、相關論文、相關理論與目前最新的商業模式發展趨勢。本課程著重在使學生瞭解電子商務與網路行銷的最新發展、發展歷史、相關技術與軟體介紹,並學會如何使用與應用電子商務與網路行銷的相關工具、相關論文、相關理論與目前最新的商業模式發展趨勢。

 

二、本課程之主要講授重點與範圍:

機器學習這門學科所關注的問題是:電腦程式如何隨著經驗累積自動提高性能。近年來,這個學科的基礎理論和演算法有了重大的進展也成功地應用於很多領域。本課程主要的目標是介紹機器學習中核心的演算法和理論。本課程將介紹機器學習與資料探勘的概念、應用與技術。在資料探勘技術方面,主要介紹如何分析資料之間的關聯性與事件發生的順序性,並深入各種關聯規則探勘演算法的技術與比較,與各種序列型樣探勘演算法的技術與比較。本課程著重在研究1. 最佳化演算與2.關聯規則與3.分類的應用與探勘方法,學生需找尋並報告與此領域相關的學術研究論文,使學生能熟悉並深入機器領域的研究方向,讓學生能確實擁有從大量資料中掘取重要資訊以從事決策分析的能力。
課程目標


學生將於本課程學得下列知識:

  1. 機器學習與資料探勘的意義與應用
  2. 各種最佳化提高性能技術
  3. 各種關聯規則探勘技術
  4. 機器學習與資料探勘在學習、分類、預測、行銷、財務、管理上的應用

課程大綱

  1. 機器學習與資料探勘的概念、意義與實際案例應用(例如數字、文字辨識)
  2. 最佳化的演算法(例如基因演算法、PSO演算法、分散式計算)
  3. 關聯規則探勘演算法(例如Affinity set、rough set)
  4. 分類的應用與探勘方法(例如類神經網路、決策樹)

三、本課程之教學方法:

每週三小時原理解說,並請同學找相關資料報告。
上課講解、個案討論、期中報告、期末報告

本課程主要是訓練學生具備機器學習之重要演算法、理論及相關應用。並指導使用機器學習相關軟體,輔以實際案例來分析。課程內容涵蓋概念學習、決策樹學習、案例式學習…等。藉由課堂講解與期末作業的方式,讓學生能確實擁有較進階解決問題與決策分析的能力,同時可為往後相關課程奠定智慧型學習理論的基礎。

 

四、本課程之評量方式與時間:

    1. 課程作業、上台報告   30%
    2. 期中專案報告         30%
    3. 期末專案報告         40%

七、本課程之教學進度:(請詳填於課程進度表)

【教材下載】

週次
 日期 課程內容  補充說明 論文

1

09/17

課程介紹 (課程介紹PPT

課程介紹PPT (NEW)

過去成果介紹

機器學習相關研究題目介紹

 

 

 

美國人如何失去了製造的機會

PSO最佳化SVM參數

資料探勘概論

發明專利

文件自動分類方法、電腦可讀取之儲存媒體及其電腦

 

2

09/24

R Software

Applications of Machine Learning (I)

 

機器學習介紹

資料處理的方法

 

R與外部程式的整合

FB爬蟲程式

 

3

10/01

學習單2_資料讀取

Applications of Machine Learning (I)

Text Mining專題

Vector Space Modeling (VSM)

 

 

A Review of Data Mining for Quality Improvement

 
4 10/08 Applications of Machine Learning (II)

E-Learning

Application of Data Mining Techniques in CRM

 
5 10/15 Applications of Machine Learning Diseases Detection

應用資料探勘技術於多重死因資料之疾病關連分析

A Novel Multi-Objective Affinity Set Classification

Heart Disease Classification Using Support Vector Based Classifiers

Dataset 練習

 
6 10/22

Prediction & Estimation

Neural Network

Support Vector Machine

 

 

 
7 10/29

Feature Selection Techniques

Factor Analysis

Principle Component Analysis (PCA)

Random Forest

   
8 11/05

Spring Vacation

Association Rule

規則分析演算法

Affinity Set

Rough Set

   
9 11/12

期中報告

  分析報告說明  
10 11/19

WEKA用法

Association Rule

關連規則演算法

 

關連規則演算法

購物籃分析Apriori

購物籃分析講義  
11 11/26

Sequential Analysis

次序分析演算法

Visual attention for solving multiple-choice science problem: An eye-tracking
analysis
(2012) (C&E)
 
12 12/03

線上分析軟體

補充

 

   
13 12/10

Decision Tree

C&RT

C5.0

決策樹講義

C5.0與C&RT的使用時機

C&RT的使用方法

 
14 12/17

R Rattle()安裝

Prediction & Estimation

Neural Network

Bayesian Networks

Paper 1 -貝氏網路在數學領域「數與量」主題測驗之應用- 以國小五年級「等值分數」單元為例

Paper 2 貝氏網路之電腦化適性測驗

Paper 3 貝氏網路之學生分數概念診斷系統

Paper 4: 以貝氏網路為基礎發展個人化網路服務平台-以旅遊資
訊服務為例

貝氏網路講義

 
15 12/24

Clustering Techniques

MDS

K-means

MDS

集群分析講義

MDS in R

MDS講義

 
16 12/31 Clustering Techniques Kohonen Network

Introduction

Introduction Kohonen Self-Organizing Maps

An Introduction to Kohonen Self Organizing Maps

Kohonen Network Demo

Demo Videos

 
17 01/07 TEXT-Mining專題

Document Classification

專利資料庫

文件比對系統

斷詞

Term Frequence and Weighting

TF-IDF計算程式

 

部落格探勘--以網路電話產品為例 (Feature Selection)

以SVM建立專利分類系統

Patent Classification System using a new Hybrid Genetic Algorithm Support Vector Machine

網路服務品質探勘與管制

標籤分析

  1. 標籤分析
  2. Applying social tagging to manage cognitive load in a web self-learning environment

資料探勘建立知識地圖

以概念為維度的向量空間模型之文件分群論文

模糊支援向量機於文件分類

 

 

Text mining

TFIDF

Packages in R

 
18 01/14 期末報告  

 

 

 

 

 

相關軟體

工具軟體

資料集

IBM SPSS Modeler資料採礦課程

 

五、使用教材或參考書目:

[A] 黄文, 王正林,「利用R語言打通大數據的經脈」,佳魁資訊。

[B] 李仁鐘,「應用R語言於資料分析:從機器學習、資料探勘到巨量資料」,松崗。

[X] 簡禎富 / 許嘉裕,「資料挖礦與大數據分析  Data Mining & Big Data Analytics」,前程文化。

[C] 機器學習相關論文。

 

資料探勘理論與應用:以IBM SPSS Modeler為範例(附CD)

廖述賢、溫志皓,「資料探勘理論與應用:以IBM SPSS Modeler為範例」,博碩出版社。

彭文正,「資料採礦顧客關係管理暨電子行銷之應用」,維科出版社。

 

尹相志譯,資料採礦網際網路應用與顧客價值管理,維科出版社。

參考書

  1. Michael J. A. Berry, Gordon S. Linoff, 資料採礦理論與實務:顧客關係管理的技巧與科學,維科出版社。
  2. 張云濤、龔玲,資料探勘原理與技術,五南出版社。
  3. IBM SPSS Modeler 14.0使用手冊。

 

---    其他教材及參考書籍、資料將由教師於課堂上發放或指定。

 

六、有關學習建議事項:

學生需在老師指定之主題下,主動尋找相關資料與軟體,與提出可能應用方向,以及改進之方法。
「遵守智慧財產權觀念」及「不得非法影印」。

課外參考書籍

劉秀敏著,「電子商務生態系統研究」,社會科學文獻出版社。