Back to: Big Bang Analytics – รวมทุกเรื่องที่ DA ต้องรู้
0
Lesson 1.3
Find and Replace
ฟีเจอร์ที่ดูธรรมดา แต่ช่วยชีวิตในงาน Data Cleaning ได้บ่อยมากครับ 🧹
3:32
เนื้อหาประกอบ
เปิดใช้งานได้ด้วย Shortcut
Windows / Linux
Ctrl+H
Mac
⌘ Cmd+H
ทำไมถึงสำคัญในงาน Data?
ข้อมูลที่ได้มาในชีวิตจริงแทบไม่เคยสะอาดเลยครับ 😅 ลองดูตัวอย่างนี้:
| customer_name | region | status |
|---|---|---|
| สมชาย | กรุงเทพ | active |
| สมหญิง | กทม. ต่างกัน! | Active Case ต่างกัน |
| สมศักดิ์ | กรุงเทพฯ ต่างกัน! | ACTIVE Case ต่างกัน |
| สมปอง | bkk ต่างกัน! | actve Typo! |
🚨 ปัญหาที่ซ่อนอยู่
ถ้าเอาข้อมูลนี้ไปทำ Pivot Table ระบบจะมองว่า “กรุงเทพ”, “กทม.”, “กรุงเทพฯ”, “bkk” คือ 4 เมืองที่ต่างกัน! ผลลัพธ์จะผิดทันทีครับ
ลองใช้งานจริงได้เลย 👇
กรอก Find / Replace แล้วกด Replace All เพื่อดูผลลัพธ์ทันที:
Find and Replace — Interactive Demo
ลองเล่นได้เลย
ข้อมูลตัวอย่าง — กด Replace All เพื่อเห็นผล
กรณีที่ใช้บ่อยในงานจริง
Case 1
แก้ค่าที่ไม่สม่ำเสมอ (Region Standardization)
อยากให้ทุก region ที่หมายถึงกรุงเทพฯ เป็นคำเดียวกัน ทำทีละ step ได้เลยครับ:
กทม.
→
กรุงเทพมหานคร
Replace All
กรุงเทพฯ
→
กรุงเทพมหานคร
Replace All
bkk
→
กรุงเทพมหานคร
Replace All
Case 2
แก้ Typo
เจอคำผิดในข้อมูล แก้ได้ง่ายมาก:
actve
→
active
Replace All
Case 3
ลบอักขระที่ไม่ต้องการ
บางทีราคามีเครื่องหมาย ฿ ติดมา ทำให้ระบบมองว่าเป็น Text ไม่ใช่ตัวเลข:
฿
→
(เว้นว่าง)
Replace All → ลบออกทั้งหมด
ผลลัพธ์: ฿15,000 กลายเป็น 15,000 ที่คำนวณได้เลย
Options ที่ควรรู้จัก
กดที่ option แต่ละข้อเพื่อดูว่ามันทำงานอย่างไร:
Match case — แยกแยะตัวพิมพ์ใหญ่/เล็ก
Find: “Active” — จะเจอ:
Active ✓
active
ACTIVE
ปิด Match case → Find: “active” จะเจอทั้งหมด:
active ✓
Active ✓
ACTIVE ✓
Match entire cell contents — ต้องตรงทั้ง Cell
Find: “กรุงเทพ” — จะเจอเฉพาะ:
กรุงเทพ ✓
กรุงเทพมหานคร
เขตกรุงเทพ
ใช้ตอนกลัวว่า Replace จะไปแก้คำที่ไม่ต้องการแก้ครับ
⚠️ ข้อควรระวัง
1 — Backup ก่อนเสมอ
ก่อน Replace All ทุกครั้ง ให้ก็อปปี้ข้อมูลไว้ใน Sheet สำรองก่อนครับ เพราะถ้า Replace ผิด Ctrl+Z อาจย้อนกลับไม่ได้ครบทุกขั้นตอน
2 — ระวัง Replace กินคำที่ไม่ต้องการ
สมมติ Find “าย” Replace เป็น “xxx” — คำว่า “สมชาย”, “ขาย”, “ทราย” จะโดนด้วยทั้งหมด! วิธีแก้: ใช้ Match entire cell contents หรือระบุคำให้ละเอียดขึ้น
3 — กด Find ดูก่อน อย่าเพิ่ง Replace All
กด Find ดูว่ามันไปเจออะไรบ้าง แล้วค่อยกด Replace All ถ้ามั่นใจแล้ว
Workflow การใช้งานในงานจริง
1
รับข้อมูลดิบมาไม่ว่าจะจาก Excel, CSV, หรือระบบอื่น
2
Backup ข้อมูลไว้ใน Sheet สำรองสำคัญมากครับ อย่าข้ามขั้นตอนนี้
3
ดูภาพรวมข้อมูลหาความไม่สม่ำเสมอ, typo, อักขระแปลกๆ
4
ใช้ Find and Replace แก้ทีละปัญหาค่อยๆ ทำ กด Find ดูก่อน แล้วค่อย Replace All
5
ตรวจสอบผลลัพธ์อีกครั้งก่อนนำข้อมูลไปวิเคราะห์ต่อ
💡 จำไว้เสมอ
ข้อมูลที่ไม่สะอาด → การวิเคราะห์ที่ผิดพลาด → การตัดสินใจที่พลาดFind and Replace คือด่านแรกของ Data Cleaning ที่ทุกคนควรรู้จัก
ทดสอบความเข้าใจ
🧠 Quiz 1 / 3
อยากแก้ข้อมูลใน Column “status” ให้ “Active” และ “ACTIVE” กลายเป็น “active” ทั้งหมด — ควรทำอย่างไร?
🧠 Quiz 2 / 3
ข้อมูลในคอลัมน์ราคามี “฿” นำหน้าทุกตัว เช่น ฿500, ฿1200 อยากลบ ฿ ออกทั้งหมด ควรทำอย่างไร?
🧠 Quiz 3 / 3
อยาก Find คำว่า “กรุงเทพ” แต่ไม่อยากให้มันไปเจอ “กรุงเทพมหานคร” ด้วย ควรใช้ Option ไหน?
0/3