ridm@nrct.go.th   ระบบคลังข้อมูลงานวิจัยไทย   รายการโปรดที่คุณเลือกไว้

Improving Thai Academic Web page classification using inverse class frequency and web link information

หน่วยงาน สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์

รายละเอียด

ชื่อเรื่อง : Improving Thai Academic Web page classification using inverse class frequency and web link information
นักวิจัย : Verayuth Lertnattee , Thanaruk Theeramunkong
คำค้น : Text processing , Thai Academic Web page , web link information , Technical articles , Technical terms , Term weighting , Text categorization , Web page classification
หน่วยงาน : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์
ผู้ร่วมงาน : -
ปีพิมพ์ : 2551
อ้างอิง : Proceedings - International Conference on Advanced Information Networking and Applications, AINA 2008. Art. No. 4483072, pp. 1144-1149 , 0769530966 , 9780769530963 , 1550445X , http://dspace.library.tu.ac.th/handle/3517/4987
ที่มา : -
ความเชี่ยวชาญ : -
ความสัมพันธ์ : -
ขอบเขตของเนื้อหา : -
บทคัดย่อ/คำอธิบาย :

Automatic text classification for Web collection is a non-trivial task. Since Thai academic Web pages usually present technical articles. They may have many technical terms both in Thai and English. This paper presents two approaches towards the problem of a large number of unique terms in a Web page: 1) term weighting schemes and 2) schemes using Web link information. We propose an approach using inverse class frequency instead of inverse document frequency in centroid-based text categorization. Web link information provides information for users to follow to another part or page. It adds useful unique terms for classification. The experimental results show that inverse class frequency is useful on a set of Thai academic Web documents, which is categorized by sources (sites) of information. It should be applied on both prototype and query vectors. Moreover, Web link information expresses its usefulness when inverse class frequency is also applied. © 2008 IEEE.

บรรณานุกรม :
Verayuth Lertnattee , Thanaruk Theeramunkong . (2551). Improving Thai Academic Web page classification using inverse class frequency and web link information.
    กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ .
Verayuth Lertnattee , Thanaruk Theeramunkong . 2551. "Improving Thai Academic Web page classification using inverse class frequency and web link information".
    กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ .
Verayuth Lertnattee , Thanaruk Theeramunkong . "Improving Thai Academic Web page classification using inverse class frequency and web link information."
    กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ , 2551. Print.
Verayuth Lertnattee , Thanaruk Theeramunkong . Improving Thai Academic Web page classification using inverse class frequency and web link information. กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ ; 2551.