Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

ระบบการรู้จำภาษาพม่า

No description

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of ระบบการรู้จำภาษาพม่า

ระบบการรู้จำภาษาพม่า
Burmese Language Optical Character Recognition System

บทนำ
Hardware and Software
1. โปรแกรมสร้างบนพื้นฐานเทคโนโลยีระบบเครื่องที่รองรับภาษาพม่าได้

2. ใช้โปรแกรม MATLAB (R2011a) Version: 7.12.0.384 เป็นเครื่องมือในการพัฒนา

3. สร้างส่วนบันทึกข้อความภาษาพม่า โดยใช้โปรแกรม Microsoft Word ที่รองรับภาษาพม่าได้เป็นเครื่องมือ

ระบบเบื้องต้น
บทสรุป
ขั้นตอนการทำ OCR จะประกอบด้วย 3 ขั้นตอนหลักคือ

1. ขบวนการประมวลผลขั้นต้น (Pre-Processing)

2. การรู้จำตัวอักษร (Recognition) ใช้อัลกอริทึมดังต่อไปนี้
วิธีทางการเข้าคู่รูปแบบ (Template Matching)
วิธีการวิเคราะห์ทางโครงสร้าง (Structural Analysis)
วิธีโครงข่ายประสาทเทียมแบบแพร่กลับ(Back-propagation neural network)

3. ขบวนการประมวลผลขั้นปลาย (Post-Processing)
ภาษาพม่า
ที่มาและความสำคัญ
* ประเทศพม่าเริ่มเปิดประเทศได้ไม่นาน และก้าวเข้าสู่อาเซียนพร้อมกับประเทศไทย

* ภาษาพม่าเริ่มเป็นที่นิยม แต่ยังมีผู้เชี่ยวชาญในภาษาพม่าไม่มาก

* มีเพียง Window 8เท่านั้นที่รองรับภาษาพม่ามากับเครื่องโดยตรง

* ยังมีตัวโปรแกรม OCRภาษาพม่าที่ใช้ในปัจจุบันน้อยมาก

* การแก้ไขเอกสารภาษาพม่าต้องใช้เวลานาน ระบบOCRภาษาพม่าจึงนำมาช่วยลดปัญหาด้านเวลา แรงงานและความผิดพลาดในการใช้มนุษย์พิมพ์ข้อความจากรูปภาพภาษาพม่าเป็นไฟล์ข้อความ
วัตถุประสงค์
1. เพื่อศึกษาและวิเคราะห์ลักษณะตัวอักษรของภาษาพม่า สามารถแยกแยะตัวอักษรได้ชัดเจนและมีความสมบูรณ์ต่อความถูกต้องของโปรแกรมประยุกต์สำหรับการรู้จำตัว
อักษร

2.เพื่อศึกษาและพัฒนาวิธีการจดจำภาษาพม่าซึ่งยังไม่เป็นที่แพร่หลายมากนัก
ขอบเขตของโครงงาน
ประโยชน์
1. สะดวกในการปรับแต่งแก้ไขเอกสาร

2. ประหยัดพื้นที่ในการจัดเก็บข้อมูล

3. ประหยัดเวลาและลดความผิดพลาดของข้อมูล

4. สามารถนำไปพัฒนาต่อไปได้
ทบทวนวรรณกรรม
Optical Character Recognition
(OCR)
ขั้นตอนการทำ OCR มีอยู่ด้วยกัน 3 ขั้นตอนหลักคือ

1. การประมวลผลขั้นต้น (Pre-Processing)
2. การรู้จำตัวอักษร (Recognition)
3. การประมวลขั้นปลาย (Post-Processing)
การประมวลผลขั้นต้น
(Pre-Processing)
แก้ปัญหาเอกสารเอียง
แก้ปัญหาเงาดำที่ขอบภาพ
แก้ปัญหาสัญญานรบกวน (noise)
แก้ปัญหาความไม่สมบูรณ์ของตัวอักษร
การรู้จำตัวอักษร
(Recognition)
วิธีการเข้าคู่รูปแบบ
(template matching)
การประมวลผลขั้นปลาย
(Post-processing)
ทำการตรวจสอบความถูกต้องของข้อมูลตัวอักษรภาษาพม่า

ตรวจโดยการนับด้วยตัวผู้ทำโครงการ
ตรวจโดยใช้เครื่องมือพจนานุกรม
ตรวจโดยใช้เครื่องมือออนไลน์
จัดทำโดย
นางสาวสาวลีย์ดา ปัทมะอุบล 5309610177
นางสาวชฎาพร ตั้งประกอบกิจ 5309610250

อาจารย์ที่ปรึกษา
อาจารย์ ดร.รัชต พีชวณิชย์
เสียงวรรณยุกต์
เสียงวรรณยุกต์

แบ่งเสียงวรรณยุกต์ออกเป็น 4 เสียง ได้แก่

1. la (หล่า) คือ “ไม่มีรูปวรรณยุกต์” จะออกเสียงเหมือนมีเสียงวรรณยุกต์เอกในภาษาไทย

2. la. (ล๊ะ) คือ “มีจุดอยู่หลังคำ” ออกเสียงเหมือนมีวรรณยุกต์ตรีในภาษาไทย

3. la: (ลา) คือ “มีเครื่องหมาย colon อยู่หลังคำ” ออกเสียงเหมือนเสียงสามัญในภาษาไทย

4. lou' (โล่ะ) คือ “มีเครื่องหมาย apostrophe อยู่หลังคำ” ออกเสียงวรรณยุกต์เอก แต่ออกเสียงเหมือนคำที่เป็นคำตาย
พยัญชนะ
สระ
ประเด็นที่ท้าทาย
ขั้นตอนการทำงาน
Activity Diagram
ตารางการทดลอง
สวัสดี
Min ga la ba
ข้อจำกัดและกรอบพัฒนาระบบ OCR ภาษาพม่า
1. รูปภาพต้องเป็นตัวอักษรสีดำบนพื้นขาวเท่านั้น

2. รูปภาพไม่ควรเอียงเกิน 15 องศา

3. ตัวอักษรในรูปภาพต้องเป็นแบบพิมพ์เท่านั้น

4. ไฟล์รูปภาพต้องเป็นไฟล์ .jpg เท่านั้น
ขอบเขตการพัฒนาระบบ OCR ภาษาพม่า
1. ผลลัพธ์ที่ได้หลังจากทำกระบวนการ OCR คือไฟล์ .doc ภาษาพม่า

2. ระบบ OCR ภาษาพม่าจะไม่รองรับภาษาและสัญลักษณ์อื่นๆ

3. ผลลัพธ์ของตัวอักษรในไฟล์ .doc จะมีขนาดเท่ากันหมดและเป็นตัวอักษรสีดำแบบตัวพิมพ์เท่านั้น

ตารางที่ 1
ตารางที่ 2
ตารางที่ 3
ความคล้ายกันของตัวอักษรภาษาพม่า
ความโค้ง เว้า ของตัวอักษรภาษาพม่า
ภาษาพม่ามีกฎการใส่สระที่หลากหลายขึ้นอยู่กับพยัญชนะ ทำให้มีลักษณะของตัวอักษรที่หลากหลาย
วิธีการทางสถิติ
(Statistical approach)
วิธีการวิเคราะห์โครงสร้าง
(structural analysis)
โครงข่ายประสาทเทียมแบบแพร่กลับ
(back-propagation artificial neural network)
ตัวเลข
การประมวลผลขั้นต้น
(Pre-processing)
- การกรองข้อมูลแทรกซ้อน (Noise Filtering)

- การตัดแบ่งพื้นที่ใช้งาน (Cropping)

- การปรับขนาด (Resize)
Unicode
Unicode รหัสคอมพิวเตอร์ใช้แทนตัวอักขระ สามารถใช้แทน ตัวอักษร ตัวเลข สัญลักษณ์ต่างๆ สามารถแทนตัวอักษรได้มากกว่า ASCII หลายเท่าตัว
- ไม่มีโปรแกรม OCR ใดที่มีความถูกต้อง 100%

- ตรวจดูความถูกต้องของการสะกดคำ และไวยากรณ์ภาษา

- นำฐานข้อมูลคำศัพท์ในพจนานุกรมมาช่วยในการตรวจสอบคำผิด
การประมวลผลขั้นปลาย
(Post-processing)
การรู้จำตัวอักษร
(Recognition)
- ปรับขนาดตัวอักษรให้มีขนาด 5x7 พิกเซล

- แบ่งตัวอักษรออกเป็น 4 ส่วน โดยเทียบที่ละส่วนตั้งแต่ส่วนที่ 1 ไปจนถึงส่วนที่ 4 ตามลำดับ

- เริ่มจากส่วนที่ 1 ตรงกับตัวอักษรใดในฐานข้อมูลแล้วนับจำนวนที่ได้เก็บเป็นชุดตัวเลือกที่ 1

- หลังจากนั้นพิจารณาส่วนที่ 2 ว่าตรงกับตัวอักษรใดบ้างในกลุ่มชุดตัวเลือกที่ 1 ที่ได้ผ่านการประมวลผลรอบแรก

- ตรวจค่าตัวอักษรตัวใดโดยใช้วิธี X-OR

- จากนั้นจะคืนค่า Unicode ของตัวอักษรตัวนั้นกลับมา
วิธีการวิเคราะห์ทางโครงสร้าง (Structural Analysis)
รู้จำวิธีทางการเข้าคู่รูปแบบ (Template Matching)
- ปรับขนาดตัวอักษรให้มีขนาด 5x7 พิกเซล

- นำภาพที่ตัดได้ไปเทียบกับตัวอักษรในระบบ โดยใช้วิธี X-OR คือ ถ้ามีจุดที่ซ้อนทับกันพอดีจะมีค่าเป็น 0 และถ้ามีจุดต่างกันจะมีค่าเป็น 1

- หากภาพมีขนาดที่เท่ากับ Template แม่แบบพอดี จะได้ภาพออกมาเป็นสีดำทั้งภาพ (มีค่าเป็น 0 ทั้งภาพ) แสดงว่าตัวอักษรตรงกัน

- หากภาพที่ได้ไม่เป็นสีดำทั้งภาพ คือมีขนาดไม่พอดีกับ Template แม่แบบ จะวัดจากค่า Threshold ที่กำหนดให้มีค่าคาดเคลื่อนของค่า 1 ได้ไม่เกิน15%
โครงข่ายประสาทเทียมแบบแพร่กลับ (back-propagation artificial neural network)
- ปรับรูปภาพให้มีขนาด 5x7 แล้วแย่งออกเป็นชิ้นทั้งหมด 35 ชิ้น นำเข้าสู่ขั้น input

- ระบบใน Nodeแรกทำกระบวนการรู้จำตัวอักษรแต่ละส่วน

- ส่งข้อมูลที่ผ่านการศึกษาขั้นแรกแล้วเข้าสู่ระดับขั้นซ้อน

- ขั้นซ้อนส่งคืนค่ากลับมาว่ารับรู้ผลเป็นอะไร
Full transcript