1102 機器學習

這篇文章是學習時整理的一些筆記,讓自己複習時方便

機器學習的方式最主要分為四類:監督、非監督、半監督、強化式

監督式學習

在機器開始學習之前,所有資料都要先被「標註」,標註正確答案後供機器在學習時判斷使用,就像是在讓機器學習分辨長頸鹿和大象時,會給機器100張長頸鹿和大象的照片,機器就可以依照標註的照片去學習長頸鹿和大象的特徵,並進行預測。
這種方式對機器來說最簡單,不過對人類來說因為「標註」這件事需要耗費大量時間及心力,因此對人類來說最辛苦。

  • 需有標記的資料
  • 可用於classification、regression
  • 適合用於定價策略、預估價格或市場動態
regression 文章筆記整理 classification 文章筆記整理 Object detection 筆記文章整理

非監督式學習

所有資料都沒有被「標註」,讓機器自己來尋找特徵,自己進行分類,對人類來說雖然簡單,但對於電腦來說最辛苦,且誤差較大,就像學習分辨長頸鹿和大象時,會給機器100張照片裡哪些特徵是長頸鹿、某些特徵是大象,進行分辨與預測,讓機器自行判斷,但機器判斷的不一定正確。

  • 需要無標記的資料
  • 可用於 clustering、k-means、混合模型
  • 適合用於判斷信用交易、保險金融等活動是否異常(詐欺)
clustering 文章筆記整理 GAN 文章筆記整理

半監督式學習

對少部分資料進行「標註」,機器只要透過有標註的資料找出特徵並學習,這種方式可以讓預測時比較準確,可有效提升模型正確率,是目前最常用的一種方式,因為有部分資料是有被標註的,因此預測結果通常會較非監督式學習來的準確。

  • 先用監督式學習訓練有標記得的資料,再對無標記資料分類後加上標記好的無標記的資料進行訓練
  • 適用於自然語言處理

強化式學習

機器透過每一次的互動來學習,其中我們不標註任何資料,但我們會告訴機器哪些是正確的哪些是錯誤的,機器會特過這些反饋去修正,不斷的 trial and error 最終得到正確的結果。

通常分成三個部分:

  1. agent: the learner or decision maker (train an agent which can adapt to the environment)
  2. everything the agent interacts with
  3. actions: what the agent can do
  • 常用於遊戲、導航等

閱讀清單

  1. 你知道機器學習(Machine Learning),有幾種學習方式嗎?