Back to: Big Bang Analytics – รวมทุกเรื่องที่ DA ต้องรู้
มอง Table ให้เป็น “คลังข้อมูล”
ไม่ใช่ที่คำนวณ
ตารางสวยๆ ที่เห็นในออฟฟิศ — บางทีมันคือต้นเหตุของปัญหาทั้งหมด 😅
เริ่มจากปัญหาที่เจอบ่อยในชีวิตจริง
ลองนึกภาพตามนะครับ — สมมติเราได้รับไฟล์ Excel / Google Sheet มา แล้วเปิดขึ้นมาเจอหน้าตาแบบนี้:
| เดือน | สินค้า A | สินค้า B | สินค้า C | รวม |
|---|---|---|---|---|
| ม.ค. | 15,000 | 8,000 | 12,000 | 35,000 |
| ก.พ. | 18,000 | 9,500 | 11,000 | 38,500 |
| มี.ค. | 14,000 | 7,000 | 13,500 | 34,500 |
| รวม | 47,000 | 24,500 | 36,500 | — |
แนวคิดหลัก: Table คือ “คลังเก็บข้อมูล”
“Table ควรทำหน้าที่เก็บข้อมูลดิบให้ครบ ถูกต้อง และสะอาด — ไม่ใช่ที่สรุปผลหรือคำนวณ”
Table = รายงานสรุปสวยๆ ที่ผู้บริหารอ่านได้เลย
Table = คลังข้อมูล (Storage) ที่พร้อมนำไปวิเคราะห์ต่อ
ปัญหาที่ซ่อนอยู่ในตารางแบบแรก
ถ้าเอาตารางนี้ไปคำนวณต่อ แถว “รวม” จะถูกนับเป็นข้อมูลด้วยทันที ทำให้ผลลัพธ์ผิดหมดเลยครับ
วันนึงมีสินค้า D เพิ่มขึ้นมา → ต้องไปเพิ่ม Column ใหม่ → สูตรทุกอย่างพังหมด 💥
อยากดูเฉพาะสินค้า B ทำได้ยากมาก เพราะข้อมูลกระจายอยู่หลาย Column แทนที่จะอยู่ใน Row เดียวกัน
เครื่องมือวิเคราะห์ส่วนใหญ่ต้องการข้อมูลในรูปแบบที่ถูกต้องก่อน ถ้าเอาตารางแบบนี้ไปใส่ มักได้ผลลัพธ์แปลกๆ
ตารางที่ถูกต้องควรเป็นแบบนี้
ดูเยอะขึ้น ดูไม่สวยเท่า — แต่ถูกต้องกว่ามากสำหรับการวิเคราะห์ข้อมูลครับ
| date | product | sales | หมายเหตุ |
|---|---|---|---|
| 2024-01-01 | สินค้า A | 15,000 | ← 1 row = 1 record |
| 2024-01-01 | สินค้า B | 8,000 | |
| 2024-01-01 | สินค้า C | 12,000 | |
| 2024-02-01 | สินค้า A | 18,000 | |
| 2024-02-01 | สินค้า B | 9,500 | |
| 2024-02-01 | สินค้า C | 11,000 | |
| … ไม่มีแถว “รวม” เลย ✓ | |||
เปรียบเทียบให้เห็นชัดๆ
กฎง่ายๆ ของ Table ที่ดี (Tidy Data)
แต่ละแถวคือข้อมูลของสิ่งๆ เดียว เวลาเดียว
| ✅ | 2024-01-01 | สินค้า A | 15,000 → 1 แถว = ยอดขายสินค้า A เดือน ม.ค. |
| ❌ | ม.ค. | 15,000 | 8,000 → 1 แถว = ข้อมูลหลายสินค้าปนกัน |
Column คือประเภทของข้อมูล ไม่ใช่ชื่อสินค้าหรือชื่อเดือน
| ✅ | Column ชื่อ product เก็บชื่อสินค้า |
| ❌ | Column ชื่อ สินค้า A, สินค้า B — ค่าข้อมูลกลายเป็นชื่อ Column |
| ❌ | ห้ามมี → แถว “รวม”, แถว “เฉลี่ย”, แถว “% การเติบโต” |
| ✅ | เอาไปคำนวณใน Pivot Table หรือ Sheet แยกต่างหากแทน |
Workflow ที่ถูกต้องใน Google Sheets
แยก Storage ออกจาก Calculation ให้ชัดเจน — ถ้าข้อมูลดิบพัง ทุกอย่างก็พังหมดครับ
Google Sheets Structure
เก็บข้อมูลดิบ
ห้ามแตะ, ห้ามลบ, ห้ามเพิ่มสูตร — เก็บเอาไว้อย่างเดียว
วิเคราะห์และคำนวณ
Pivot Table, สูตร, การวิเคราะห์ต่างๆ ทำได้ที่นี่
แสดงผลและสรุป
กราฟ, สรุปสวยๆ, รายงานที่อ่านได้ง่าย
สรุปให้จำง่ายๆ
คลังข้อมูล — ทำหน้าที่เก็บให้ครบและถูกต้อง เหมือนฐานข้อมูลในระบบ
เครื่องมือวิเคราะห์ — ทำหน้าที่คำนวณและสรุปผล แยกออกจาก raw data เสมอ