ภาพดิจิทัลคืออะไร? เข้าใจเบื้องหลังไฟล์ภาพที่โลก AI ใช้กันในทุก ๆ วัน
บทความแนะนำ

ภาพดิจิทัลคืออะไร? เข้าใจเบื้องหลังไฟล์ภาพที่โลก AI ใช้กันในทุก ๆ วัน

Fundamentals
7 นาที

ไม่ว่าภาพจะมาจากการถ่ายเซลฟี่ ภาพทิวทัศน์จากการท่องเที่ยว หรือภาพหน้าจอจากการสั่งซื้อออนไลน์ ภาพทั้งหมดเหล่านี้ที่ปรากฏบนสมาร์ตโฟนของคุณนั้นจัดอยู่ในประเภท "ภาพดิจิทัล" (Digital Image)

ภาพดิจิทัลอาจดูเหมือนเป็นเพียงสื่อทัศนศิลป์ทั่วไป ทว่าในเชิงเทคโนโลยี ภาพเหล่านี้คือการแทนค่าด้วยโครงสร้างข้อมูลเชิงตัวเลขที่สามารถถูกประมวลผลโดยระบบคอมพิวเตอร์ได้อย่างมีประสิทธิภาพ ซึ่งรวมถึงการจัดเก็บ การวิเคราะห์ และการนำไปใช้งานในระบบปัญญาประดิษฐ์และการคำนวณเชิงลึก (deep computing) กล่าวได้ว่า ภาพดิจิทัลเปรียบเสมือนภาษาทางสายตาที่มนุษย์รับรู้ผ่านความงามและบริบท ขณะที่เครื่องจักรนั้นอ่านภาพในฐานะข้อมูลเชิงโครงสร้าง

การเปลี่ยนจากสัญญาณแอนะล็อกสู่ดิจิทัล

การรับรู้ภาพของมนุษย์เกิดจากการตรวจจับแสงและสี ซึ่งในธรรมชาติอยู่ในรูปของสัญญาณแอนะล็อกที่มีลักษณะต่อเนื่อง ไร้จุดเริ่มต้นหรือสิ้นสุดอย่างชัดเจน แต่สำหรับคอมพิวเตอร์ ซึ่งต้องพึ่งพาข้อมูลที่มีความเป็นระเบียบและสามารถจัดประเภทได้ การเข้าใจสัญญาณเหล่านี้จำเป็นต้องผ่านกระบวนการแปลงสัญญาณที่เรียกว่า Analog-to-Digital Conversion (ADC)

ChatGPT Image Apr 23, 2025, 02_05_26 PM.png

ภาพที่ 1 กระบวนการ Analog-to-Digital Conversion (ADC)

กระบวนการ ADC ซึ่งเป็นกลไกหลักในการสร้างภาพดิจิทัลสามารถแบ่งได้เป็นสองขั้นตอนสำคัญ ได้แก่

1. Sampling (การสุ่มตัวอย่างเชิงพื้นที่)

Sampling คือการแบ่งระนาบของภาพออกเป็นหน่วยย่อยที่เรียกว่า "พิกเซล" (pixel) ซึ่งเปรียบได้กับการวางโครงตารางลงบนภาพจริง พิกเซลแต่ละหน่วยมีพิกัดตำแหน่งที่แน่นอน และเป็นตัวแทนของพื้นที่เล็ก ๆ หนึ่งหน่วยในภาพต้นฉบับ ความละเอียดของภาพ (resolution) ขึ้นอยู่กับจำนวนพิกเซลต่อพื้นที่ ซึ่งส่งผลโดยตรงต่อคุณภาพของภาพที่ได้

2. Quantization (การแปลงค่าความเข้มของสัญญาณให้เป็นดิจิทัล)

หลังการสุ่มตัวอย่าง แต่ละพิกเซลจะถูกกำหนดค่าความเข้มแสงหรือค่าสีในรูปของจำนวนเต็ม โดยทั่วไป การแปลงจะใช้ช่วงบิต เช่น 8-bit ซึ่งให้ช่วงค่าระหว่าง 0 (ดำสนิท) ถึง 255 (ขาวบริสุทธิ์) สำหรับภาพสี ระบบ RGB จะถูกนำมาใช้โดยแยกการคำนวณออกเป็นสามช่องสัญญาณคือ Red, Green และ Blue เพื่อสร้างสีที่หลากหลายผ่านการรวมค่าระหว่างช่องสีเหล่านี้

หน่วยประมวลผลหลัก: เซนเซอร์รับภาพ

CCD_CMOS-2024-en.webp

ภาพที่ 2 ลักษณะทั่วไปของ Charge-Coupled Device (ซ้าย) และ Complementary Metal-Oxide Semiconductor (ขวา)

(ที่มา: https://www.baslerweb.com/en/learning/ccd-cmos/)

การสุ่มและการควอนไทซ์เกิดขึ้นภายในเซนเซอร์ภาพของอุปกรณ์ เช่น CCD (Charge-Coupled Device) หรือ CMOS (Complementary Metal-Oxide Semiconductor) ซึ่งทำหน้าที่เปลี่ยนแสงที่ตกกระทบให้เป็นกระแสไฟฟ้า ก่อนจะแปลงเป็นข้อมูลดิจิทัลโดยสมบูรณ์ กระบวนการทั้งหมดนี้ดำเนินไปแบบเบื้องหลังโดยไม่ต้องอาศัยการป้อนข้อมูลจากผู้ใช้งานโดยตรง โดยที่ CCD เหมาะกับงานที่ต้องการคุณภาพสูงสุดและ noise ต่ำ เช่น กล้องวิทยาศาสตร์หรือภาพยนตร์และ CMOS จะเหมาะกับอุปกรณ์ทั่วไป ต้นทุนต่ำ ความเร็วสูง ประหยัดพลังงาน เช่น สมาร์ตโฟนหรือ IoT

ประเภทของภาพดิจิทัล

ภาพขาวดำระดับเทา (Grayscale Image)

ประกอบด้วยเฉดสีเทาระหว่างดำและขาว โดยทั่วไปใช้ช่วงค่าระหว่าง 0–255 เหมาะกับการวิเคราะห์โครงสร้างภาพ เช่น:

  • การถ่ายภาพรังสี (X-ray)

  • ฟิล์มถ่ายภาพ

  • การตรวจจับขอบ (edge detection)

ภาพสองระดับ (Binary Image)

มีค่าความเข้มเพียงสองระดับ คือ ดำ (0) และขาว (1) เหมาะสำหรับงานที่ต้องการการแบ่งขอบเขตอย่างชัดเจน เช่น:

  • การแยกวัตถุออกจากพื้นหลัง (segmentation)

  • การรู้จำตัวอักษร (OCR)

  • การสกัดลักษณะเด่น (feature extraction)

ภาพสี (Color Image)

ภาพสีใช้การแทนค่าผ่านโมเดลสี เช่น RGB หรือ CMYK โดยภาพหนึ่ง ๆ สามารถประกอบด้วยสีได้มากกว่า 16 ล้านเฉด เหมาะสำหรับงานด้านวิทยาการคอมพิวเตอร์กราฟิก งานศิลป์ และการสร้างโมเดล AI ที่ต้องอาศัยข้อมูลสีในการจำแนกวัตถุ

รูปแบบการจัดเก็บภาพ

Raster Graphics (กราฟิกแบบพิกเซล)

รูปแบบการจัดเก็บภาพที่นิยมใช้ในชีวิตประจำวัน เช่น JPG PNG GIF ซึ่งประกอบด้วยตารางของพิกเซล

ข้อดี:

  • รองรับความละเอียดสูงและความสมจริงของสี

  • เหมาะกับภาพถ่ายหรือภาพที่ต้องการแสดงรายละเอียด

ข้อจำกัด:

  • การปรับขนาดส่งผลต่อคุณภาพ (ภาพแตก)

  • ไม่เหมาะกับงานที่ต้องการความยืดหยุ่นเชิงเรขาคณิต

Vector Graphics (กราฟิกแบบเวกเตอร์)

ใช้สมการทางคณิตศาสตร์เพื่อกำหนดรูปร่างและสี เช่น SVG AI EPS

ข้อดี:

  • ขยายภาพได้ไม่จำกัดโดยไม่สูญเสียคุณภาพ

  • เหมาะกับการออกแบบโลโก้ อินโฟกราฟิก หรือแผนภาพวิศวกรรม

ข้อจำกัด:

  • ไม่เหมาะกับภาพถ่ายหรือภาพที่มีความซับซ้อนทางธรรมชาติ

  • ต้องใช้โปรแกรมเฉพาะในการเปิดและแก้ไข

ปัจจัยที่มีผลต่อขนาดของไฟล์ภาพ

  • Resolution: ยิ่งความละเอียดสูง ไฟล์ยิ่งใหญ่

  • Bit Depth: บิตลึกสูงช่วยเพิ่มความแม่นยำในการแสดงสี

  • Compression:

    • Lossy: ลดขนาดไฟล์ด้วยการสูญเสียข้อมูลบางส่วน เช่น JPEG

    • Lossless: รักษาข้อมูลครบถ้วน เช่น PNG TIFF

การเลือกใช้รูปแบบไฟล์ควรพิจารณาตามวัตถุประสงค์ เช่น การเผยแพร่ผ่านเว็บ การเทรนโมเดลปัญญาประดิษฐ์ หรือการพิมพ์คุณภาพสูง

Reference

  • Gonzalez, R. C., & Woods, R. E. (2018). Digital Image Processing (4th ed.). Pearson.

  • Solomon, C., & Breckon, T. (2011). Fundamentals of Digital Image Processing. Wiley.

  • Pratt, W. K. (2007). Digital Image Processing: PIKS Scientific Inside (4th ed.). Hoboken, NJ: Wiley-Interscience.

พร้อมยกระดับธุรกิจของคุณด้วยเทคโนโลยี AI วันนี้

ติดต่อเราเพื่อรับคำปรึกษาและการสาธิตเทคโนโลยี Computer Vision ที่ช่วยวิเคราะห์ภาพอย่างแม่นยำและเชื่อถือได้

Face RecognitionALPRObject Detection & TrackingDeep LearningReal-time Analytics

นัดหมายการให้คำปรึกษาฟรี

1

สาธิตระบบวิเคราะห์ภาพด้วย AI

ดูการทำงานจริงของเทคโนโลยี Computer Vision ของเรา

2

วิเคราะห์ความต้องการเฉพาะ

รับข้อเสนอที่ปรับแต่งด้วย AI ตามความต้องการทางธุรกิจของคุณ