คอมพิวเตอร์วิทัศน์

คอมพิวเตอร์วิทัศน์ (อังกฤษ: computer vision) เป็นศาสตร์ที่ใช้ในการเข้าใจว่าคอมพิวเตอร์สามารถเข้าใจภาพหรือวิดีโอในรูปแบบเดียวกับที่ระบบการมองเห็นของมนุษย์[1] คอมพิวเตอร์วิทัศน์รวมขั้นตอนการ ได้มา การประมวลผล การวิเคราะห์ และเข้าใจที่สามารถนำข้อมูลออกมาใช้ในการพยากรณ์หรือการตัดสินใจได้[2]

คอมพิวเตอร์วิทัศน์ว่าด้วยเรื่องเกี่ยวกับการดึงสารสนเทศจากรูปภาพหรือวีดิทัศน์ เครื่องมือที่ใช้ในคอมพิวเตอร์วิทัศน์ได้แก่ คณิตศาสตร์โดยเฉพาะ เรขาคณิต พีชคณิตเชิงเส้น สถิติ และ การวิจัยดำเนินงาน (การหาค่าเหมาะที่สุด) และการวิเคราะห์เชิงฟังก์ชัน โดยเครื่องมือเหล่านี้ใช้ในการสร้างขั้นตอนวิธีหรือ ขั้นตอนวิธี ในการแยกส่วนภาพ และ การจัดกลุ่มภาพเพือให้คอมพิวเตอร์สามารถ "เข้าใจ" ทัศนียภาพ หรือคุณลักษณะต่าง ๆ ในภาพ

เป้าหมาย

แก้

เป้าหมายโดยทั่วไปของคอมพิวเตอร์วิทัศน์ได้แก่

  • การตรวจจับ ตัดแบ่งขอบเขต ระบุตำแหน่ง และ รู้จำ วัตถุที่ต้องการในภาพ เช่น หน้าคน
  • การประเมินผล สำหรับ การตัดเบ่งขอบเขตวัตถุในภาพ หรือ การวางทาบเทียบ เป็นต้น
  • การวางทาบเทียบของ มุมมองต่าง ๆ ของทัศนียภาพ หรือ วัตถุหนึ่ง ๆ
  • การติดตาม วัตถุหนึ่ง ๆ ในภาพต่อเนื่อง
  • การเชื่อมโยงมุมมองต่าง ๆ ของทัศนียภาพหนึ่ง ๆ เพื่อสร้างแบบจำลองสามมิติ ของทัศนียภาพนั้น แบบจำลองดังกล่าวอาจนำมาใช้เพื่อนำทางหุ่นยนต์ ในทัศนียภาพจริง
  • การกะประมาณ ท่าทางต่าง ๆ ของมนุษย์ และ ส่วนต่าง ๆ ของร่างกาย เช่น แขน ขา นิ้วมือ ฯลฯ ในสามมิติ
  • การค้นหา รูปภาพด้วยเนื้อหาของภาพ ในฐานข้อมูลภาพขนาดใหญ่

เพื่อที่จะบรรลุซึ่งเป้าหมายเหล่านี้ ระบบคอมพิวเตอร์วิทัศน์ จะต้องใช้กระบวนการต่างๆ เช่น การรู้จำแบบ การเรียนรู้เชิงสถิติ เรขาคณิตเชิงภาพฉาย การประมวลผลภาพ ทฤษฎีกราฟ และอื่น ๆ

คอมพิวเตอร์วิทัศน์การรับรู้ นั้น เกี่ยวข้องอย่างใกล้ชิดกับ จิตวิทยาการรับรู้ และ การคำนวณทางชีวภาพ

การประยุกต์ใช้คอมพิวเตอร์วิทัศน์อันหนึ่งที่น่าสนใจ ได้แก่ การสร้างปรากฏการลวงตาต่าง ๆ ในภาพยนตร์ ปัจจุบัน เราจะพบการประยุกต์ใช้ คอมพิวเตอร์วิทัศน์ในสาขาต่าง ๆ เช่น การแพทย์ การทหาร ระบบตรวจตราและรักษาความปลอดภัย การตรวจสอบและควบคุมคุณภาพ ระบบหุ่นยนต์ รถยนต์ และอื่น ๆ

ในปัจจุบัน เครื่องจักรวิทัศน์ และ การจัดการรูปภาพทางการแพทย์ ที่ใช้วิธีการต่าง ๆ ทางคอมพิวเตอร์วิทัศน์ ได้รับการพัฒนา และ จัดจำหน่าย ในตลาดโลก คิดรวมเป็นมูลค่า หลายหมื่นล้านบาทต่อปี

สาขาที่เกี่ยวข้อง

แก้

ข้อมูลเพิ่มเติม

แก้

อ้างอิง

แก้
  1. Dana H. Ballard; Christopher M. Brown (1982). Computer Vision. Prentice Hall. ISBN 978-0-13-165316-0.
  2. Reinhard Klette (2014). Concise Computer Vision. Springer. ISBN 978-1-4471-6320-6.