Tag: data science

  • Data Visualization นำเสนอข้อมูลเป็นรูป/กราฟแบบไหนดี ? กับข้อมูลที่มีอยู่

    การสือสารที่มีอรรถรสสำหรับการมอง/อ่าน ที่ข้อมูลครบถ้วนโดยมีมิติ มุมมองและการเปรียบเทียบ จบในหน้าเดียวหรือรูปเดียว คือนิยาม Data Visualization ของผมครับ เราก็มาดูกันครับ เอาข้อมูลแบบไหนมาชนกับ Data Visualization แบบไหนถึงจะตรงประเด่นการนำเสนอข้อมูลด้วยภาพ

    ต้องการเปรียบเทียบข้อมูล (Comparison)

    กลุ่มนี้ก็จะมี

    • Bar Chart
    • Line Chart
    • Bubble Chart
    • Grouped Bar
    • Table
    • Pivot Table

    Bar Chart และ Grouped Bar ใช้เปรียบเทียบข้อมูลตามเงื่อนไขที่สนใจ

    ใช้เปรียบเทียบมิติจำนวนข้อมูลที่สนใจกับช่วงที่สนใจ เช่น เปรียบเทียบเป้าหมายที่ตั้งไว้กับข้อมูลที่ทำได้จริงในแต่ละเดือน, จำนวนนักศึกษา ในแต่ละปีการศึกษา เป็นต้น

    Line Chart ใช้เปรียบเทียบเพื่อดูแนวโน้มของข้อมูล

    ใช้เปรียบเทียบมิติของข้อมูล ในเชิงต้องการดูเพื่อเปรียบเทียบการเปลี่ยนแปลง ดูแนวโน้ม (Trends) โดยอาจจะเทียบกับมิติของเวลา (Time Series) และยังนำไปใช้ร่วมกับ machine learning เพื่อพยากรณ์ข้อมูลในอนาคตได้ด้วย เช่น ข้อมูลการถอนรายวิชาในแต่ละเดือนเปรีบเทียบ 3 ปีที่ผ่านมา จำนวนนักเรียนที่สมัครเข้าเรียนใน มอ. แยกตามโครงการ 5 ปีที่ผ่านมา เป็นต้น ตัวอย่างเป็นเปอร์เซ็นต์นักศึกษาเพศชายกับเพศหญิง

    รูป Line Chart

    Bubble Chart ใช้แสดงข้อมูลที่มีความสัมพันธ์กันแบบ 3 มิติ

    ใช้เปรียบเทียบแบบ 3 มิติข้อมูล เช่น
    แกน X แสดง จำนวนอาจารย์
    แกน Y แสดง จำนวนเงินค่าลงทะเบียน
    ขนาดและจำนวนแต่ละฟอง แทน คณะและจำนวนนักศึกษา
    ถ้าเปรียบเทียบแบบนี้ก็จะเห็นความสัมพันธ์ของข้อมูลทั้ง 3 ข้อมูลและสามารถตั้งเป้าหมาย หาค่ามากที่สุด น้อยที่สุดที่สนใจได้

    รูป Bubble Chart ตัวอย่างเป็นข้อมูลสมมุติ

    Table ใช้เปรียบเทียบข้อมูลแบบแนวตั้ง

    เป็นการเปรียบเทียบพื้นฐานที่สุดเลย เป็นการเปรียบเทียบชุดข้อมูลที่ไม่ซับซ้อน เช่น

    รูป Table

    Pivot Table ใช้เปรียบเทียบข้อมูลแนวนอน

    เหมาะสำหรับการเปลี่ยนเทียบข้อมูลเพื่อหาความแตกต่างตามแนวนอน มักจะใช้กับเวลา เดือน ปี เป็นแนวนอนและรายการข้อมูลที่สนใจเป็นแนวตั้งที่สามารถ Filter ได้ เช่น จำนวนค่าลงทะเบียนในแต่ละปีแยกตามคณะ 5 ปีที่ผ่านมาเป็นแนวนอนและรายชื่อคณะเป็นแนวตั้งที่สามารถ Filter ได้ เป็นต้น

    รูป Pivot Table

    ต้องการดูการกระจาย (Distribution) สามารถใช้เมื่อต้องการดูความถี่ของข้อมูลว่ามีลักษณะการกระจายตัวอย่างไร

    Histogram
    Line Histrogram
    Scatter Plot
    Box Plot

    Histogram แสดงความสัมพันธ์ระหว่างข้อมูล ดูการการจายความถี่ของข้อมูล

    รูป Histogram

    Scatter Plot แสดงการกระจายของการจับคู่ข้อมูล

    ภาพจาก WHO

    เหมาะสำหรับแสดงการจับคู่ข้อมูลเพื่อดูการกระจายผล
    เช่น การวัดผลก่อนเรียนและหลังเรียน การวัดผลการทดลองสองกลุ่มทดลอง การวัดน้ำหนักสองครั้งจากคนเดียวกัน 100 คนในวิธีควบคุมอาหาร เป็นต้น

    จะเห็นอะไรจาก Scatter Plot
    -แนวโน้มของข้อมูลระหว่างตัวแปร
    -ความผิดปกติจากภาพรวม
    -กลุ่มก้อนภาพรวมของข้อมูล

    Box Plot เพื่อดูการกระจายของข้อมูลและมีค่าต่างๆประกอบอยู่ในกราฟคือ ค่ากลาง ค่าการการะจาย ค่ามากสุด น้อยที่สุดและข้อมูลห่างกลุ่มมาก (Outlier)

    รูป Box Chart

    Box Plot Chart จะมีข้อมูลแบ่งออกเป็น 3 ช่วงคือ
    25% (Q1) คือข้อมูล 25% แรกจากค่าต่ำขึ้นมา
    50% (Q2) คือข้อมูลตัวที่มากกว่า 25% จนถึงตัวที่ 75% โดยแสดงออกมาในรูป สี่เหลี่ยมผืนผ้า
    75% (Q3) คือข้อมูล 50% ของข้อมูลอยู่ เขียนแทนด้วยเส้นตรงอยู่ภายในรูปสี่เหลี่ยมผืนผ้า ค่านี้คือค่าค่ากลางของข้อมูลทั้งหมด (Median) และตรงค่า เฉลี่ย (Mean) จะแทนด้วย เครื่องหมายบวก
    สำหรับตัวอย่างที่น่าจะยกได้สำหรับการศึกษาอาจจะเป็นผลการเรียนของนุักศึกษา

    ดูการแบ่งสัดส่วน (Composition) ต้องการเห็นภาพรวมพร้อมกับส่วนต่างๆที่สนใจ

    Treemap
    Donut Chart
    Stacked Area Chart
    Stacked Bar
    Pie Chart
    Waterfall Chart

    Treemap

    รูป Treemap

    เป็น Chart ตารางสี่เหลี่ยม โดยใช้สีแยกกลุ่มของข้อมูล และขนาดของสีสี่เหลี่ยมบอกถึงปริมาณของข้อมูลแต่ละกลุ่ม เป็นกราฟที่ดูง่ายเข้าใจในทันทีที่เห็น

    Pie Chart

    รูป Pie Chart

    Pie Chart เป็น Chart ที่แสดงสัดส่วนของข้อมูลดังเดิมที่เข้าใจง่าย เห็นการแยกสัดส่วนตามสีของแต่ละส่วน (เหมือนพิสซ่ามากกว่าพาย)

    ดูความสัมพันธ์ (Relationship) ของข้อมูล

    Heatmap
    Worldmap
    Column/Line Chart
    Scatter Plot
    Bubble Chart

    World map

    รูป World Map

    world map ใช้รูปแผนที่โลกในการแสดงข้อมูลที่มีความสัมพันธ์กัน เป็น Chart สมัยใหม่เข้าใจง่ายและสวยงาม

    วิเคราะห์ข้อมูลการมาอย่างยากลำบาก แต่ถ้านำเสนอไม่น่าสนใจ คนดูไม่เข้าใจ เลือกการแสดงผลไม่ตรงกับสิ่งที่ต้องการนำเสนอ เหมือนทำอาหารอร่อยแต่ไม่น่ากิน เราเลยจำเป็นที่จะต้องศึกษาวิธีนำเสนอข้อมูลในแบบ Data Visualication อย่างเข้าใจและสวยงาม

    แหล่งข้อมูลที่ใช้ศึกษาและเขียนบทความ
    แหล่งที่ 1
    แหล่งที่ 2
    แหล่งที่ 3