大學部專題-賽德克語構詞結構之自動解析

Avatar of 王瑋.
Avatar of 王瑋.

大學部專題-賽德克語構詞結構之自動解析

Taipei, Taiwan
賽德克語的詞會加上前、中、後綴字串,以表不同詞性、時態或意義,此專題目的是希望能掌握正確的詞綴資訊,首先以歸納法對詞做初步的分解,發現相較於中、後綴的少許變化,前綴有多樣的組合方式,因此聚焦於前綴字串改以機器學習或N-gram機率模型進行預測。主要負責N-gram機率模型,以(Unigram / Lidstone smoothing)及(Bigram / Back-off)搭配 Leave-one-out cross-validation進行訓練。
Avatar of the user.
Please login to comment.

Published: Mar 1st 2022
43
4
0

Tools

python
Python

Share