ridm@nrct.go.th   ระบบคลังข้อมูลงานวิจัยไทย   รายการโปรดที่คุณเลือกไว้

ระบบแปลงภาพเอกสารเป็นข้อความที่เรียนรู้เอกสารได้

หน่วยงาน สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ

รายละเอียด

ชื่อเรื่อง : ระบบแปลงภาพเอกสารเป็นข้อความที่เรียนรู้เอกสารได้
นักวิจัย : วศิน สินธุภิญโญ , เปรมนาถ ดูเบ , ศรินทร์ วัชรบุศราคำ , สรรพฤทธิ์ มฤคทัต , Wasin Sinthupinyo , Premnath Dubey , Sarin Watcharabutsarakham , Sanparith Marukatat
คำค้น : Artificial Intelligence and signal and image processing , Digital techniques , Image processing , Information, computing and communication sciences , Neural networks (Computer science) , Neural networks, genetic algorithms and fuzzy logic , Optical character recognition devices , การประมวลผลภาพ , การรู้จำอักขระ (คอมพิวเตอร์) , นิวรัลเน็ตเวิร์ค (คอมพิวเตอร์) , ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ , สาขาเทคโนโลยีสารสนเทศและนิเทศศาสตร์ , เทคนิคดิจิทัล
หน่วยงาน : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ
ผู้ร่วมงาน : -
ปีพิมพ์ : 2552
อ้างอิง : http://www.nstda.or.th/thairesearch/node/4903
ที่มา : -
ความเชี่ยวชาญ : -
ความสัมพันธ์ : -
ขอบเขตของเนื้อหา : -
บทคัดย่อ/คำอธิบาย :

จากความก้าวหน้าด้านเทคโนโลยีสารสนเทศ (Information Technology ? IT) ทำให้การนำข้อมูลต่างๆที่มีอยู่เข้าสู่ระบบดิจิทัลเพื่อให้ใช้ในระบบสารสนเทศได้เป็นที่นิยมเป็นอย่างมาก จนกระทั่งศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ ได้ให้ความสำคัญกับเรื่องดังกล่าว จนถึงเป็นโครงการเรือธง (flagship project) ของศูนย์ฯ ในนาม ?Digitized Thailand? ในขณะที่ข้อมูลต่างๆที่มีอยู่มากมายนั้น มีจำนวนมากที่ยังอยู่ในรูปเอกสารที่ยังไม่ได้นำเข้าสู่ระบบคอมพิวเตอร์ ทั้งในรูปแบบรายงาน หนังสือ วารสาร จดหมาย แผ่นพับ ฯลฯ เทคโนโลยีรู้จำตัวอักษร (Optical Character Recognition : OCR) จึงเป็นเทคโนโลยีที่ได้รับความนิยมอย่างมาก ซึ่งทางศูนย์ฯเองก็ได้ดำเนินการวิจัยและพัฒนาเทคโนโลยีการรู้จำตัวอักษรภาษา ไทย (Thai OCR) ด้วยเช่นกัน ซึ่งผลการวิจัยและพัฒนาของศูนย์ฯ ทำให้ได้ซอฟต์แวร์รู้จำตัวอักษรภาษาไทยที่ขายในทั่วไปในท้องตลาดในนาม ?ซอฟต์แวร์อ่านไทย เวอร์ชัน 2.5? โดยที่มีความถูกต้องประมาณ 95 % บนเอกสารสะอาด อย่างไรก็ดีซอฟต์แวร์ดังกล่าวเป็นซอฟต์แวร์ที่พัฒนาขึ้นด้วยเทคโนโลยีโครงข่ายประสาทเทียม (Artificial Neural Network) โดยนำฟอนต์ต่างๆมาฝึกฝนให้กับโครงข่ายประสาทเทียมไว้ก่อน แล้วนำมาพัฒนาเป็นซอฟต์แวร์ที่รู้จำตัวอักษร แต่ซอฟต์แวร์ดังกล่าวไม่สามารถเรียนรู้ฟอนต์ใหม่ๆได้ด้วยตัวเอง ดังนั้นเมื่อนำซอฟต์แวร์ดังกล่าวไปใช้งานจริงในเอกสารที่มีฟอนต์แตกต่างจาก ที่ฝึกสอนไว้อาจจะผลการรู้จำไม่ดีนัก จึงเกิดแนวคิดที่จะวิจัยและพัฒนาเทคโนโลยีการรู้จำตัวอักษรภาษาไทยใหม่ที่มี ความสามารถที่เรียนรู้ฟอนต์หรือรูปแบบเอกสารใหม่ๆได้ ซึ่งจะทำให้อัตราการรู้จำของเอกสารสูงขึ้น นอกจากนี้เพื่อให้มีการนำเทคโนโลยีที่พัฒาขึ้นไปใช้งานจริง ดังนั้นจึงมีแผนที่จะนำระบบรู้จำตัวอักษรที่พัฒนาขึ้นไปใช้กับระบบห้องสมุด ที่มหาวิทยาลัยเทคโนโลยีราชมงคลล้านนา ซึ่งมีระบบจัดเก็บเอกสารของโครงการพัฒนาศักยภาพหมู่บ้านและชุมชน (SML) ตามแนวปรัชญาเศรษฐกิจพอเพียง ที่เป็นเอกสารรายงานผลการดำเนินงานในโครงการของแต่ละหมู่บ้าน ซึ่งมีความหลากหลายในรูปแบบเอกสาร และฟอนต์มาก เพื่อให้เป็นกรณีศึกษาของระบบที่พัฒนาและเป็นข้อมูลในการปรับปรุงและพัฒนา ระบบต่อไปในอนาคต โดยขั้นตอนการดำเนินงานจะแยกออกเป็น 3 ส่วน คือ การพัฒนาเทคโนโลยีรู้จำตัวอักษรภาษาไทย โดยใช้เทคนิคโครงข่ายประสาทเทียม และไม่สามารถเรียนรู้ฟอนต์ได้ การพัฒนาเทคโนโลยีรู้จำตัวอักษรภาษาไทยแบบใหม่ ที่เรียนรู้ฟอนต์ได้ การนำเทคโนโลยีรู้จำประยุกต์ที่พัฒนาขึ้นไปใช้ประโยชน์ ในส่วนของห้องสมุดของมหาวิทยาลัยราชมงคลล้านนาในระยะแรกจะส่งมอบต้นแบบปฏิบัติการแปลงภาพเอกสารเป็นข้อความ ที่ใช้เทคโนโลยีรู้จำตัวอักษรที่ไม่สามารถเรียนรู้ฟอนต์ได้ และในระยะที่สองจะส่งมอบต้นแบบภาคสนามที่ใช้เทคโนโลยีรู้ตัวอักษรที่เรียนรู้ฟอนต์ได้

บรรณานุกรม :
วศิน สินธุภิญโญ , เปรมนาถ ดูเบ , ศรินทร์ วัชรบุศราคำ , สรรพฤทธิ์ มฤคทัต , Wasin Sinthupinyo , Premnath Dubey , Sarin Watcharabutsarakham , Sanparith Marukatat . (2552). ระบบแปลงภาพเอกสารเป็นข้อความที่เรียนรู้เอกสารได้.
    ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ.
วศิน สินธุภิญโญ , เปรมนาถ ดูเบ , ศรินทร์ วัชรบุศราคำ , สรรพฤทธิ์ มฤคทัต , Wasin Sinthupinyo , Premnath Dubey , Sarin Watcharabutsarakham , Sanparith Marukatat . 2552. "ระบบแปลงภาพเอกสารเป็นข้อความที่เรียนรู้เอกสารได้".
    ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ.
วศิน สินธุภิญโญ , เปรมนาถ ดูเบ , ศรินทร์ วัชรบุศราคำ , สรรพฤทธิ์ มฤคทัต , Wasin Sinthupinyo , Premnath Dubey , Sarin Watcharabutsarakham , Sanparith Marukatat . "ระบบแปลงภาพเอกสารเป็นข้อความที่เรียนรู้เอกสารได้."
    ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ, 2552. Print.
วศิน สินธุภิญโญ , เปรมนาถ ดูเบ , ศรินทร์ วัชรบุศราคำ , สรรพฤทธิ์ มฤคทัต , Wasin Sinthupinyo , Premnath Dubey , Sarin Watcharabutsarakham , Sanparith Marukatat . ระบบแปลงภาพเอกสารเป็นข้อความที่เรียนรู้เอกสารได้. ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ; 2552.