ridm@nrct.go.th   ระบบคลังข้อมูลงานวิจัยไทย   รายการโปรดที่คุณเลือกไว้

การกรองคำหยาบในข้อความภาษาไทยโดยไฟไนท์สเตทแมชชีน

หน่วยงาน ฐานข้อมูลวิทยานิพนธ์ไทย

รายละเอียด

ชื่อเรื่อง : การกรองคำหยาบในข้อความภาษาไทยโดยไฟไนท์สเตทแมชชีน
นักวิจัย : วุฒิชัย วิเชียรไชย
คำค้น : -
หน่วยงาน : ฐานข้อมูลวิทยานิพนธ์ไทย
ผู้ร่วมงาน : -
ปีพิมพ์ : 2549
อ้างอิง : http://www.thaithesis.org/detail.php?id=1222549000026
ที่มา : -
ความเชี่ยวชาญ : -
ความสัมพันธ์ : -
ขอบเขตของเนื้อหา : -
บทคัดย่อ/คำอธิบาย :

งานวิจัยนี้ เป็นงานวิจัยที่เกี่ยวกับการพัฒนาโปรแกรมกรองคำหยาบในข้อความภาษาไทยโดยแบ่งขั้นตอนการทำงานของโปรแกรมออกเป็นสองขั้นตอนใหญ่ๆ คือ ขั้นตอนแรกเป็นการตัดคำ ขั้นตอนที่สองเป็นการค้นหาและแทนที่คำหยาบด้วยเครื่องหมายดอกจัน ซึ่งนิยามคำหยาบที่ใช้นำมาจากพจนานุกรมฉบับราชบัณฑิตยสถานพ.ศ. 2542 การตัดคำในข้อความภาษาไทย ในงานวิจัยนี้ใช้วิธีตัดคำด้วยพจนานุกรม แบบเทียบข้อความ (String Matching)และเทียบคำที่ยาวที่สุด (Longest Matching) และใช้ตัวแบบทางคณิตศาสตร์ไฟไนท์สเตทแมชชีนด้วยข้อมูลออก(Finite State Machines with Outputs) ในการพัฒนาโปรแกรมค้นหาและแทนที่คำหยาบในข้อความภาษาไทยด้วยเครื่องหมายดอกจัน งานวิจัยนี้ได้ทดสอบประสิทธิภาพ โดยเอกสารจากหนังสือพิมพ์ไทยรัฐ มติชน ข่าวสด และคมชัดลึก จำนวนหนึ่งร้อยคอลัมน์ และข้อความจากเว็บบอร์ดจำนวนเจ็ดร้อยเจ็ดข้อคิดเห็นในแหล่งข้อมูลอินเทอร์เนต พบว่าประสิทธิภาพการแทนที่คำหยาบจริงด้วยเครื่องหมายดอกจันมีความถูกต้อง 99.14% อย่างไรก็ตามยังมีคำหยาบที่ไม่สามารถแทนที่ด้วยเครื่องหมายดอกจัน เนื่องจากการตัดคำในข้อความภาษาไทยยังไม่ถูกต้อง 100% จึงได้เสนอแนวทางปรับปรุงโดยการเพิ่มคำศัพท์ที่ไม่ปรากฏในพจนานุกรมและเพิ่มข้อความพิเศษที่ไม่ปรากฎในพจนานุกรมข้อความพิเศษ เพื่อเพิ่มประสิทธิภาพในการตัดคำและกรองคำหยาบให้สูงยิ่งขึ้น

บรรณานุกรม :
วุฒิชัย วิเชียรไชย . (2549). การกรองคำหยาบในข้อความภาษาไทยโดยไฟไนท์สเตทแมชชีน.
    กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย.
วุฒิชัย วิเชียรไชย . 2549. "การกรองคำหยาบในข้อความภาษาไทยโดยไฟไนท์สเตทแมชชีน".
    กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย.
วุฒิชัย วิเชียรไชย . "การกรองคำหยาบในข้อความภาษาไทยโดยไฟไนท์สเตทแมชชีน."
    กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย, 2549. Print.
วุฒิชัย วิเชียรไชย . การกรองคำหยาบในข้อความภาษาไทยโดยไฟไนท์สเตทแมชชีน. กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย; 2549.