ridm@nrct.go.th   ระบบคลังข้อมูลงานวิจัยไทย   รายการโปรดที่คุณเลือกไว้

Thoughts on word and sentence segmentation in Thai

หน่วยงาน จุฬาลงกรณ์มหาวิทยาลัย

รายละเอียด

ชื่อเรื่อง : Thoughts on word and sentence segmentation in Thai
นักวิจัย : Wirote Aroonmanakun
คำค้น : Thai language -- Sentences , Thai language -- Phonology , Word (Linguistics)
หน่วยงาน : จุฬาลงกรณ์มหาวิทยาลัย
ผู้ร่วมงาน : Chulalongkorn University. Faculty of Arts
ปีพิมพ์ : 2550
อ้างอิง : 9789746230629 , http://cuir.car.chula.ac.th/handle/123456789/8823
ที่มา : -
ความเชี่ยวชาญ : -
ความสัมพันธ์ : -
ขอบเขตของเนื้อหา : -
บทคัดย่อ/คำอธิบาย :

This paper discusses problems of word and sentence segmentation in Thai. Disagreements on word segmentation are caused mostly from compound words. To set a standard resource and tool of word segmentation, we suggest that only simple words and true compound words should be segmented in the process of word segmentation. Other compounds can be grouped later by the same means as multiword identification in other languages. Sentence segmentation is also difficult because the boundary of sentence in Thai is fuzzy. We suggest that a discourse should be seen as a combination of clauses rather than sentences. Some discourse clues then can be used to segment these discourse units. The result from sentence segmentation module could be a sequence of segments composed of clauses, which then can be constructed into the discourse structure.

บรรณานุกรม :
Wirote Aroonmanakun . (2550). Thoughts on word and sentence segmentation in Thai.
    กรุงเทพมหานคร : จุฬาลงกรณ์มหาวิทยาลัย.
Wirote Aroonmanakun . 2550. "Thoughts on word and sentence segmentation in Thai".
    กรุงเทพมหานคร : จุฬาลงกรณ์มหาวิทยาลัย.
Wirote Aroonmanakun . "Thoughts on word and sentence segmentation in Thai."
    กรุงเทพมหานคร : จุฬาลงกรณ์มหาวิทยาลัย, 2550. Print.
Wirote Aroonmanakun . Thoughts on word and sentence segmentation in Thai. กรุงเทพมหานคร : จุฬาลงกรณ์มหาวิทยาลัย; 2550.