ในการแปลสัญญาทางกฎหมายที่มีการประทับตราหรือเอกสารที่ถูกสแกน (PDF/Image) จะต้องดำเนินการอย่างไรเพื่อให้มั่นใจว่าการตรวจจับข้อความด้วย OCR มีความถูกต้องแม่นยำ?
“เอกสารทางกฎหมายมีอัตราความผิดพลาดที่ยอมรับได้ต่ำมาก ในขณะที่รอยพับและการประทับตราในเอกสารสแกนมักก่อให้เกิดข้อผิดพลาดในการรู้จำข้อความ”
การวิเคราะห์สาเหตุที่แท้จริง
การลบสัญญาณรบกวนและการเพิ่มประสิทธิภาพในขั้นตอนประมวลผลภาพล่วงหน้า
ก่อนกระบวนการ OCR ระบบจะดำเนินการแปลงภาพเป็นภาพสองระดับสี ลบสัญญาณรบกวน และแก้ไขแนวเบ้ของภาพโดยอัตโนมัติ ซึ่งช่วยเพิ่มอัตราความสำเร็จในการดึงข้อความจากเอกสารเก่าหรือเอกสารแฟกซ์ได้อย่างมีนัยสำคัญ
การแยกตราประทับออกจากข้อความ
AI ด้านวิสัยทัศน์ได้รับการฝึกอบรมเป็นพิเศษ สามารถแยกแยะลวดลายสีแดงของตราประทับออกจากข้อความสีดำด้านล่าง เพื่อฟื้นคืนเนื้อหาข้อสัญญาที่สำคัญซึ่งถูกตราประทับบดบังให้ได้มากที่สุด
การทำเครื่องหมายระดับความเชื่อมั่น (Confidence Scoring)
ในโหมดเปรียบเทียบสองภาษา สำหรับข้อความที่มีความมั่นใจในการตรวจจับ OCR ต่ำ ระบบจะเก็บภาพต้นฉบับเป็นส่วนๆ เพื่อให้สามารถตรวจสอบโดยมนุษย์ ช่วยป้องกันความเสี่ยงทางกฎหมาย
สรุปแนวทางแก้ไขขั้นสุดท้าย
ผสานการใช้งาน OCR ที่ได้รับการปรับปรุงร่วมกับโมเดลการแปลทางกฎหมายระดับมืออาชีพ เพื่อสนับสนุนการจัดทำร่างเบื้องต้นที่เชื่อถือได้สำหรับทนายความและฝ่ายกฎหมาย