技術內容
文章分類是一種自然語言處理的技術,其目的是依據文字內容將文章標示為不同的類別,而實務上則經常採用機器學習的方法實作。
學習演算法可以經由分析訓練資料而產生分類模型,並使用該模型判別輸入文章的類別。
我們研發分類中文文章的技術,包括中文前處理、產生特徵、選取特徵、及使用支援向量機產生分類模型等。
這些技術可以應用在處理大量的中文文章,並可針對特定的目的將文章分類,例如過濾垃圾郵件、分析文章是否適合國小學童閱讀、判斷產品評論的正反意見、及找出類似主題的文章等。
技術圖示
教師聯絡資訊
陳耀輝 副教授
05-2717737 / ychen@mail.ncyu.edu.tw