การสือสารที่มีอรรถรสสำหรับการมอง/อ่าน ที่ข้อมูลครบถ้วนโดยมีมิติ มุมมองและการเปรียบเทียบ จบในหน้าเดียวหรือรูปเดียว คือนิยาม Data Visualization ของผมครับ เราก็มาดูกันครับ เอาข้อมูลแบบไหนมาชนกับ Data Visualization แบบไหนถึงจะตรงประเด่นการนำเสนอข้อมูลด้วยภาพ
ต้องการเปรียบเทียบข้อมูล (Comparison)
กลุ่มนี้ก็จะมี
- Bar Chart
- Line Chart
- Bubble Chart
- Grouped Bar
- Table
- Pivot Table
Bar Chart และ Grouped Bar ใช้เปรียบเทียบข้อมูลตามเงื่อนไขที่สนใจ
ใช้เปรียบเทียบมิติจำนวนข้อมูลที่สนใจกับช่วงที่สนใจ เช่น เปรียบเทียบเป้าหมายที่ตั้งไว้กับข้อมูลที่ทำได้จริงในแต่ละเดือน, จำนวนนักศึกษา ในแต่ละปีการศึกษา เป็นต้น
Line Chart ใช้เปรียบเทียบเพื่อดูแนวโน้มของข้อมูล
ใช้เปรียบเทียบมิติของข้อมูล ในเชิงต้องการดูเพื่อเปรียบเทียบการเปลี่ยนแปลง ดูแนวโน้ม (Trends) โดยอาจจะเทียบกับมิติของเวลา (Time Series) และยังนำไปใช้ร่วมกับ machine learning เพื่อพยากรณ์ข้อมูลในอนาคตได้ด้วย เช่น ข้อมูลการถอนรายวิชาในแต่ละเดือนเปรีบเทียบ 3 ปีที่ผ่านมา จำนวนนักเรียนที่สมัครเข้าเรียนใน มอ. แยกตามโครงการ 5 ปีที่ผ่านมา เป็นต้น ตัวอย่างเป็นเปอร์เซ็นต์นักศึกษาเพศชายกับเพศหญิง
Bubble Chart ใช้แสดงข้อมูลที่มีความสัมพันธ์กันแบบ 3 มิติ
ใช้เปรียบเทียบแบบ 3 มิติข้อมูล เช่น
แกน X แสดง จำนวนอาจารย์
แกน Y แสดง จำนวนเงินค่าลงทะเบียน
ขนาดและจำนวนแต่ละฟอง แทน คณะและจำนวนนักศึกษา
ถ้าเปรียบเทียบแบบนี้ก็จะเห็นความสัมพันธ์ของข้อมูลทั้ง 3 ข้อมูลและสามารถตั้งเป้าหมาย หาค่ามากที่สุด น้อยที่สุดที่สนใจได้
Table ใช้เปรียบเทียบข้อมูลแบบแนวตั้ง
เป็นการเปรียบเทียบพื้นฐานที่สุดเลย เป็นการเปรียบเทียบชุดข้อมูลที่ไม่ซับซ้อน เช่น
Pivot Table ใช้เปรียบเทียบข้อมูลแนวนอน
เหมาะสำหรับการเปลี่ยนเทียบข้อมูลเพื่อหาความแตกต่างตามแนวนอน มักจะใช้กับเวลา เดือน ปี เป็นแนวนอนและรายการข้อมูลที่สนใจเป็นแนวตั้งที่สามารถ Filter ได้ เช่น จำนวนค่าลงทะเบียนในแต่ละปีแยกตามคณะ 5 ปีที่ผ่านมาเป็นแนวนอนและรายชื่อคณะเป็นแนวตั้งที่สามารถ Filter ได้ เป็นต้น
ต้องการดูการกระจาย (Distribution) สามารถใช้เมื่อต้องการดูความถี่ของข้อมูลว่ามีลักษณะการกระจายตัวอย่างไร
Histogram
Line Histrogram
Scatter Plot
Box Plot
Histogram แสดงความสัมพันธ์ระหว่างข้อมูล ดูการการจายความถี่ของข้อมูล
Scatter Plot แสดงการกระจายของการจับคู่ข้อมูล
เหมาะสำหรับแสดงการจับคู่ข้อมูลเพื่อดูการกระจายผล
เช่น การวัดผลก่อนเรียนและหลังเรียน การวัดผลการทดลองสองกลุ่มทดลอง การวัดน้ำหนักสองครั้งจากคนเดียวกัน 100 คนในวิธีควบคุมอาหาร เป็นต้น
จะเห็นอะไรจาก Scatter Plot
-แนวโน้มของข้อมูลระหว่างตัวแปร
-ความผิดปกติจากภาพรวม
-กลุ่มก้อนภาพรวมของข้อมูล
Box Plot เพื่อดูการกระจายของข้อมูลและมีค่าต่างๆประกอบอยู่ในกราฟคือ ค่ากลาง ค่าการการะจาย ค่ามากสุด น้อยที่สุดและข้อมูลห่างกลุ่มมาก (Outlier)
Box Plot Chart จะมีข้อมูลแบ่งออกเป็น 3 ช่วงคือ
25% (Q1) คือข้อมูล 25% แรกจากค่าต่ำขึ้นมา
50% (Q2) คือข้อมูลตัวที่มากกว่า 25% จนถึงตัวที่ 75% โดยแสดงออกมาในรูป สี่เหลี่ยมผืนผ้า
75% (Q3) คือข้อมูล 50% ของข้อมูลอยู่ เขียนแทนด้วยเส้นตรงอยู่ภายในรูปสี่เหลี่ยมผืนผ้า ค่านี้คือค่าค่ากลางของข้อมูลทั้งหมด (Median) และตรงค่า เฉลี่ย (Mean) จะแทนด้วย เครื่องหมายบวก
สำหรับตัวอย่างที่น่าจะยกได้สำหรับการศึกษาอาจจะเป็นผลการเรียนของนุักศึกษา
ดูการแบ่งสัดส่วน (Composition) ต้องการเห็นภาพรวมพร้อมกับส่วนต่างๆที่สนใจ
Treemap
Donut Chart
Stacked Area Chart
Stacked Bar
Pie Chart
Waterfall Chart
Treemap
เป็น Chart ตารางสี่เหลี่ยม โดยใช้สีแยกกลุ่มของข้อมูล และขนาดของสีสี่เหลี่ยมบอกถึงปริมาณของข้อมูลแต่ละกลุ่ม เป็นกราฟที่ดูง่ายเข้าใจในทันทีที่เห็น
Pie Chart
Pie Chart เป็น Chart ที่แสดงสัดส่วนของข้อมูลดังเดิมที่เข้าใจง่าย เห็นการแยกสัดส่วนตามสีของแต่ละส่วน (เหมือนพิสซ่ามากกว่าพาย)
ดูความสัมพันธ์ (Relationship) ของข้อมูล
Heatmap
Worldmap
Column/Line Chart
Scatter Plot
Bubble Chart
World map
world map ใช้รูปแผนที่โลกในการแสดงข้อมูลที่มีความสัมพันธ์กัน เป็น Chart สมัยใหม่เข้าใจง่ายและสวยงาม
วิเคราะห์ข้อมูลการมาอย่างยากลำบาก แต่ถ้านำเสนอไม่น่าสนใจ คนดูไม่เข้าใจ เลือกการแสดงผลไม่ตรงกับสิ่งที่ต้องการนำเสนอ เหมือนทำอาหารอร่อยแต่ไม่น่ากิน เราเลยจำเป็นที่จะต้องศึกษาวิธีนำเสนอข้อมูลในแบบ Data Visualication อย่างเข้าใจและสวยงาม
แหล่งข้อมูลที่ใช้ศึกษาและเขียนบทความ
แหล่งที่ 1
แหล่งที่ 2
แหล่งที่ 3