
คำที่ได้ยินทุกที่ แต่ไม่มีใครอธิบายให้เข้าใจได้จริงๆ
“Big Data” เป็นคำที่ผมได้ยินในห้องประชุมบ่อยมากครับ บางทีก็พูดกันแบบมั่นใจมาก บางทีก็พยักหน้าตามกันโดยที่ไม่แน่ใจว่าตัวเองเข้าใจจริงหรือเปล่า
ถ้าคุณเป็นคนนึงที่เคยนั่งฟังแล้วคิดว่า “ฉันน่าจะรู้เรื่องนี้แล้วแต่ยังงงอยู่” ไม่ต้องรู้สึกแย่ครับ
เพราะส่วนใหญ่คนที่พูดเรื่อง Big Data ก็อธิบายได้ไม่ครบเหมือนกัน
Big Data ไม่ใช่แค่ “data เยอะๆ” ครับ มันมีความหมายที่เฉพาะเจาะจงกว่านั้น
และถ้าเข้าใจมันจริงๆ จะเห็นว่ามันเกี่ยวข้องกับชีวิตประจำวันและธุรกิจในแบบที่ไม่เคยนึกถึงมาก่อน
Big Data ไม่ใช่แค่ “data เยอะ” — มันต่างกันอย่างไร?
นิยามที่ใช้กันมากที่สุดในวงการคือ 3V ครับ ซึ่งย่อมาจาก Volume, Velocity และ Variety
- Volume คือปริมาณ แต่ไม่ใช่แค่เยอะครับ ต้องเยอะจนเครื่องมือทั่วไปอย่าง Excel จัดการไม่ไหว พูดถึง terabyte หรือ petabyte ของข้อมูลที่ผลิตออกมาทุกวินาที ลองนึกภาพว่า Facebook มีผู้ใช้งานกว่า 3 พันล้านคน แต่ละคน like, comment, share, และเลื่อนฟีดวันละหลายร้อยครั้ง ข้อมูลทั้งหมดนั้นถูกเก็บและประมวลผลแบบ real-time ทั้งหมด ไม่มีซอฟต์แวร์สำเร็จรูปราคาถูกทำได้อย่างแน่นอนครับ
- Velocity คือความเร็ว ข้อมูลบางประเภทต้องประมวลผลทันทีที่เกิดขึ้น ไม่ใช่รอรวบรวมก่อนแล้วค่อยวิเคราะห์ทีหลัง ระบบตรวจจับการฉ้อโกงบัตรเครดิตต้องตัดสินใจในเสี้ยววินาทีว่า transaction นี้ปกติหรือไม่ ถ้ารอวิเคราะห์ตอนเช้าก็สายไปแล้วครับ
- Variety คือความหลากหลาย data ในยุคนี้ไม่ได้มาแค่ในรูปแบบตารางสวยๆ มันมาทั้งข้อความ รูปภาพ วิดีโอ เสียง ข้อมูล GPS สัญญาณจาก sensor และอีกหลายร้อยรูปแบบ การเอาสิ่งเหล่านี้มาวิเคราะห์ร่วมกันได้ต้องการระบบที่ซับซ้อนกว่าฐานข้อมูลธรรมดามาก
บางคนเพิ่ม V ที่ 4 และ 5 เข้าไปด้วย คือ Veracity ความน่าเชื่อถือของข้อมูล และ Value ว่าข้อมูลที่มีสร้างประโยชน์จริงได้ไหม แต่ 3V หลักก็เพียงพอให้เข้าใจภาพรวมแล้วครับ
Big Data เกิดขึ้นมาได้ยังไง ทำไมถึงเพิ่งมาฮิตอีกรอบ ?
ข้อมูลขนาดใหญ่ไม่ใช่เรื่องใหม่ครับ รัฐบาลและองค์กรใหญ่เก็บข้อมูลมวลชนมานานหลายทศวรรษแล้ว แต่สามอย่างที่เปลี่ยนไปในช่วง 15 ปีที่ผ่านมาทำให้มันกลายเป็นเรื่องของทุกคน
- ราคา storage ที่ตกลงมาอย่างน่าตกใจ ในปี 1980 ที่เก็บข้อมูล 1 gigabyte ราคาหลายแสนบาท ตอนนี้ซื้อ external hard drive 1 terabyte ได้ในราคาหลักพันครับ ทำให้การเก็บข้อมูลทุกอย่างแทบไม่มีต้นทุนเลยเมื่อเทียบกันแล้วกับเมื่อก่อน
- การมาของ smartphone และ internet of things ทุกคนพกอุปกรณ์ที่ผลิต data ตลอด 24 ชั่วโมง และทุกอย่างตั้งแต่ตู้เย็น นาฬิกา รถยนต์ ไปจนถึงสัญญาณไฟจราจรก็เริ่มเชื่อมต่ออินเทอร์เน็ตและส่งข้อมูลกลับมา
- เครื่องมือในการประมวลผล ระบบอย่าง Hadoop และ Spark ที่ Google และ Yahoo พัฒนาขึ้นช่วยให้การประมวลผลข้อมูลมหาศาลกระจายออกไปบน server หลายพันเครื่องพร้อมกันได้ ซึ่งก่อนหน้านั้นทำไม่ได้จริงๆ ครับ
สามอย่างนี้มาพร้อมกันและสร้าง perfect storm ที่ทำให้ Big Data กลายเป็นเรื่องจริงในทางปฏิบัติ ไม่ใช่แค่ในทางทฤษฎี
Big Data ถูกใช้จริงๆ ในชีวิตเราอย่างไรบ้าง?
นี่คือส่วนที่น่าสนใจที่สุดครับ เพราะ Big Data ไม่ใช่เรื่องไกลตัวอย่างที่หลายคนคิด
Netflix รู้ว่าคุณจะดูซีรีส์อะไรต่อ ก่อนที่คุณจะรู้ตัวเอง ระบบแนะนำของ Netflix วิเคราะห์ข้อมูลจากผู้ใช้กว่า 200 ล้านคน ทั้งว่าหยุดดูตรงไหน กรอย้อนกลับกี่ครั้ง ดูซ้ำกี่รอบ และดูในเวลากลางคืนหรือเปล่า รวมกับข้อมูลอีกหลายร้อยตัวแปร ผลคือ 80% ของสิ่งที่คนดูบน Netflix มาจากการแนะนำของระบบ ไม่ใช่จากการค้นหาเอง
Grab รู้ว่าควรส่งคนขับมาที่ไหนก่อนที่คุณจะกดสั่ง ระบบคาดการณ์ความต้องการของ Grab วิเคราะห์ข้อมูลหลายล้านการเดินทาง รูปแบบจราจรแบบ real-time สภาพอากาศ และ event ต่างๆ ในเมือง แล้วกระจายคนขับไปตามพื้นที่ที่คาดว่าจะมีความต้องการสูง ก่อนที่ผู้ใช้จะกดเรียกด้วยซ้ำ นั่นคือเหตุผลที่บางพื้นที่หาคนขับได้เร็วกว่าที่อื่นมากครับ
ธนาคารรู้ว่าบัตรเครดิตของคุณโดนขโมยข้อมูลหรือเปล่า โดยที่คุณยังไม่รู้ ระบบ fraud detection ใช้ Big Data วิเคราะห์ทุก transaction เปรียบเทียบกับ pattern การใช้จ่ายตลอดประวัติของคุณ และ flag ความผิดปกติแบบ real-time ก่อนที่ความเสียหายจะเกิดขึ้น งานนี้ประมวลผล transaction หลายล้านรายการต่อวินาทีพร้อมกันทั่วโลก ไม่มีทางทำได้โดยไม่มีโครงสร้างพื้นฐาน Big Data ครับ
โรงพยาบาลบางแห่งรู้ว่าผู้ป่วยคนไหนมีความเสี่ยงที่จะอาการแย่ลง ก่อนที่หมอจะสังเกตเห็น ระบบวิเคราะห์สัญญาณชีพแบบ real-time จาก sensor ที่ติดกับผู้ป่วย รวมกับประวัติการรักษาและข้อมูลทางคลินิก แล้วแจ้งเตือนพยาบาลเมื่อ pattern เริ่มเบี่ยงเบนออกจากปกติ บางโรงพยาบาลใช้ระบบนี้ลดอัตราการเสียชีวิตในห้อง ICU ได้จริงๆ
ถ้าไม่ใช่ data scientist ต้องรู้เรื่อง Big Data ไปทำไม?
ถือว่าเป็ฯคำถามที่สมเหตุสมผลมากครับ
คำตอบสั้นๆ คือเพราะมันกำลังกลายเป็น context ของทุกการตัดสินใจในธุรกิจ ไม่ว่าคุณจะทำงานสายไหนก็ตาม
นักการตลาดที่ไม่เข้าใจว่า campaign analytics ทำงานยังไงจะอธิบายไม่ได้ว่าทำไม ROI ถึงดีหรือแย่
HR ที่ไม่รู้ว่า people data วิเคราะห์ได้แค่ไหนจะตัดสินใจเรื่องการจ้างงานโดยใช้ความรู้สึกล้วนๆ
ผู้บริหารที่ไม่รู้ว่า Big Data มีข้อจำกัดอะไรจะเชื่อตัวเลขที่ทีมข้อมูลนำเสนอมาโดยไม่ตั้งคำถามที่ควรถาม
ที่สำคัญกว่านั้นคือการรู้เรื่อง Big Data ช่วยให้คุณรู้ว่าอะไรเป็นไปได้และอะไรไม่เป็นไปได้ครับ มีหลายองค์กรที่จ่ายเงินซื้อระบบ Big Data แพงๆ มาแล้วไม่ได้ใช้ประโยชน์เพราะไม่มีคนในองค์กรที่รู้ว่าจะถามคำถามอะไรกับมัน เหมือนมีห้องสมุดขนาดใหญ่มากแต่ไม่มีใครรู้หัวข้อที่อยากค้นหา
Big Data กับความเป็นส่วนตัว — tension ที่ยังไม่มีคำตอบ
ผมพูดเรื่องนี้ตรงๆ ครับ เพราะคิดว่าสำคัญและมักถูกข้ามไปในบทความประเภทนี้
Big Data ทำงานได้ดีที่สุดเมื่อมีข้อมูลเยอะและละเอียด แต่ข้อมูลที่ละเอียดที่สุดคือข้อมูลเกี่ยวกับพฤติกรรมและชีวิตของมนุษย์ ซึ่งก็คือข้อมูลส่วนตัวของเรานั่นเอง
tension ตรงนี้ยังไม่มีทางออกที่สมบูรณ์ครับ ระบบแนะนำที่ดีต้องการข้อมูลเยอะ ระบบตรวจจับโรคที่แม่นต้องการประวัติผู้ป่วยครบถ้วน ระบบจราจรอัจฉริยะต้องการรู้ว่าทุกคนอยู่ที่ไหน แต่ทุกอย่างเหล่านี้มาพร้อมกับคำถามว่าใครเป็นคนเก็บข้อมูล เก็บไว้ที่ไหน ใครเข้าถึงได้ และนำไปใช้ทำอะไรได้บ้าง
ประเด็นนี้ไม่ใช่เหตุผลให้กลัว Big Data ครับ แต่เป็นเหตุผลให้เราเป็นผู้บริโภคที่รู้ทันมากขึ้น ถามคำถามมากขึ้น และสนใจนโยบาย data privacy ของบริการที่ใช้อยู่มากขึ้น
Big Data ไม่ใช่เรื่องของ IT แต่เป็นเรื่องของทุกคนที่ต้องตัดสินใจ
ตอนที่ผมเริ่มทำงานในสายงาน Data แรกๆ Big Data ฟังดูเหมือนคำศัพท์เทคนิคที่วิศวกรใช้คุยกันเองครับ แต่ยิ่งทำมานาน ยิ่งเห็นว่ามันเป็นเรื่องของทุกคนที่ต้องตัดสินใจในยุคนี้
ไม่ว่าจะเป็นการเลือกว่าจะลงทุนขยายสาขาที่ไหน หรือว่าจะปรับ menu อะไรในร้าน
หรืออาจจะเป็นการดูว่าพนักงานลาออกเพราะอะไร หรือว่าลูกค้ากลุ่มไหนทำกำไรให้ธุรกิจจริงๆ ทุกคำถามเหล่านี้ตอบได้ดีขึ้นถ้ามีข้อมูลที่ถูกต้องและเครื่องมือที่เหมาะสม
Big Data ไม่ได้ทำให้คนที่ใช้มันฉลาดขึ้นครับ
แต่มันทำให้คนที่ถามคำถามที่ดีอยู่แล้วหาคำตอบได้เร็วขึ้นและแม่นยำขึ้น
และนั่นแหละคือเหตุผลที่คุณควรรู้จักมันตั้งแต่วันนี้
Leave a Reply