Data Science
ใช้ทำอะไร
ได้บ้าง?
จากร้านกาแฟเล็กๆ ไปถึงจรวดที่ขึ้นไปอวกาศ — Data Science อยู่ในนั้นทั้งหมดเลยครับ
บทนี้จะเปิดให้เห็นว่ามันทำได้จริงๆ อะไรบ้าง ทั้งในแบบที่ตื่นเต้น และแบบที่ใช้งานจริงทุกวัน
งาน Data Science แบ่งได้ 4 ประเภทใหญ่ๆ
ก่อนจะไปดูรายอุตสาหกรรม ขอให้เข้าใจ Framework ก่อนครับ ว่า Data Science ทำงานได้กี่แบบ เพราะแต่ละแบบใช้เครื่องมือและทักษะที่ต่างกัน
🔍
Type 1
Classification
จัดกลุ่ม หรือตัดสินใจว่า “ใช่ หรือ ไม่ใช่” จาก Input ที่รับเข้ามา
✉️ อีเมลนี้ Spam ไหม? / ลูกค้าจะ Churn ไหม? / รูปนี้มีแมวไหม?
📈
Type 2
Regression
ทำนายตัวเลขหรือค่าต่อเนื่อง เช่น ราคา ปริมาณ หรืออุณหภูมิ
🏠 บ้านนี้ควรราคาเท่าไหร่? / พรุ่งนี้จะขายได้กี่ชิ้น? / อุณหภูมิพรุ่งนี้?
🫧
Type 3
Clustering
หาโครงสร้างหรือกลุ่มในข้อมูลที่ไม่มีใครบอกล่วงหน้าว่ามีกี่กลุ่ม
👥 ลูกค้าของเราแบ่งเป็นกี่กลุ่ม? / ข่าวเหล่านี้มีกี่หัวข้อหลัก?
🎯
Type 4
Recommendation
แนะนำสิ่งที่ผู้ใช้น่าจะสนใจ โดยเรียนรู้จากพฤติกรรมและความชอบ
🎵 เพลงต่อไปควรเป็นเพลงอะไร? / สินค้าไหนที่คุณน่าจะซื้อด้วย?
💡
ทำไมต้องรู้ 4 ประเภทนี้?
เวลาเจอโจทย์ธุรกิจจริงๆ ขั้นแรกที่ Data Scientist ต้องทำคือ “แปลง Business Problem ให้เป็น Data Problem” และการรู้ว่ามันเป็น Classification, Regression, Clustering หรือ Recommendation จะบอกว่าต้องใช้เครื่องมืออะไรและวิธีประเมินผลยังไงครับ
เจาะรายอุตสาหกรรม — Data Science ทำอะไรจริงๆ บ้าง
ถึงเวลาดูรายละเอียดครับ กดเปิดอุตสาหกรรมที่สนใจดูได้เลย
ตรวจจับการทุจริต (Fraud Detection)
วิเคราะห์ Transaction แบบ Real-time ว่าผิดปกติไหม เช่น รูดบัตรในกรุงเทพฯ แล้วอีก 2 นาทีมีรายการในปารีส — ระบบจะ Block ทันทีโดยอัตโนมัติ
วิเคราะห์ความเสี่ยงในการให้สินเชื่อ
แทนที่จะดูแค่ Credit Score เดิมๆ ตอนนี้ธนาคารบางแห่งใช้ข้อมูลพฤติกรรมอื่นๆ เช่น ประวัติการชำระบิล หรือแม้แต่รูปแบบการใช้สมาร์ทโฟน เพื่อประเมินความน่าเชื่อถือ
ทำนายราคาหุ้นและ Algorithmic Trading
บริษัทลงทุนใช้ ML เพื่อหาสัญญาณการซื้อขายในข้อมูลมหาศาล บางกองทุน Hedge Fund เทรดโดยให้ Algorithm ตัดสินใจแทนมนุษย์เกือบทั้งหมด
Personalized Banking
แนะนำผลิตภัณฑ์ทางการเงินที่เหมาะกับลูกค้าแต่ละคน เช่น เวลาที่เหมาะสมที่จะเสนอประกัน หรือดอกเบี้ยพิเศษสำหรับคนที่กำลังจะ Churn
วินิจฉัยโรคจากภาพถ่าย
AI อ่าน X-ray, MRI, และภาพ Pathology ได้แม่นยำเทียบเท่าหรือเหนือกว่าแพทย์ผู้เชี่ยวชาญในบางกรณี เช่น การตรวจหามะเร็งเต้านมหรือมะเร็งผิวหนัง
ทำนายความเสี่ยงของผู้ป่วย
ระบบในโรงพยาบาลหลายแห่งใช้ ML ทำนายว่าผู้ป่วยคนไหนมีความเสี่ยงที่จะอาการทรุดลงใน 24 ชั่วโมงข้างหน้า เพื่อให้แพทย์เฝ้าระวังได้ล่วงหน้า
ค้นพบยาใหม่ (Drug Discovery)
กระบวนการพัฒนายาที่เคยใช้เวลา 10–15 ปี ตอนนี้ถูกเร่งด้วย ML ที่สามารถจำลองปฏิกิริยาของโมเลกุลและคาดการณ์ยาตัวใหม่ได้เร็วขึ้นมาก
วิเคราะห์การแพร่ระบาด
ช่วง COVID-19 นักวิทยาศาสตร์ใช้ Data Science จำลองการแพร่กระจาย ทำนายความต้องการเตียงผู้ป่วย และวางแผนการกระจายวัคซีนให้มีประสิทธิภาพสูงสุด
Recommendation Engine
Amazon รายงานว่า 35% ของยอดขายมาจากระบบแนะนำสินค้า ที่วิเคราะห์ว่าคนซื้อสินค้า A มักซื้อสินค้า B ควบคู่กันด้วย
Dynamic Pricing
ราคาสินค้าบน E-Commerce ปรับตัวหลายร้อยครั้งต่อวันตาม Demand, คู่แข่ง, เวลา, และ Profile ของลูกค้า โดย Algorithm ทำงานแทนทีมราคา
บริหาร Inventory และ Supply Chain
ทำนายว่าสินค้าไหนจะหมดสต็อกและควรสั่งเพิ่มเมื่อไหร่ Walmart ใช้ Data Science เพื่อให้ชั้นวางสินค้าเต็มอยู่เสมอโดยไม่ต้อง Overstock
Churn Prediction & Retention
ทำนายว่าลูกค้าคนไหนกำลังจะเลิกใช้บริการ แล้วส่ง Offer ที่ตรงใจก่อนที่เขาจะตัดสินใจออกไป ถูกกว่าการหาลูกค้าใหม่มากครับ
Predictive Maintenance
ติด Sensor บนเครื่องจักร แล้วใช้ ML ทำนายว่าเครื่องจะพังเมื่อไหร่ ก่อนที่มันจะหยุดทำงานจริงๆ ช่วยประหยัดต้นทุนการซ่อมฉุกเฉินได้มหาศาล
ตรวจสอบคุณภาพด้วย Computer Vision
กล้อง + AI ตรวจหา Defect บนสายการผลิตได้เร็วและแม่นกว่าสายตามนุษย์ บางโรงงานตรวจสินค้าได้หลายร้อยชิ้นต่อนาที
ปรับแต่ง Process Optimization
วิเคราะห์ข้อมูลจาก Sensor ทั่วทั้งโรงงานเพื่อหาจุดคอขวดและปรับพารามิเตอร์การผลิตให้ได้ Output สูงสุดโดยใช้พลังงานน้อยที่สุด
Personalized Learning Path
ระบบอย่าง Duolingo หรือ Khan Academy ใช้ ML ปรับเนื้อหาให้เหมาะกับผู้เรียนแต่ละคน ทำให้คนที่เรียนช้าหรือเร็วกว่าปกติได้รับการสอนในระดับที่เหมาะสม
ทำนายนักเรียนที่เสี่ยงหลุดออกจากระบบ
วิเคราะห์ pattern การเข้าเรียน การส่งงาน และผลการเรียน เพื่อระบุนักเรียนที่ต้องการความช่วยเหลือก่อนที่จะสายเกินไป
วิเคราะห์ประสิทธิภาพการสอน
ช่วยผู้บริหารโรงเรียนและมหาวิทยาลัยเข้าใจว่าวิธีการสอนแบบไหนส่งผลต่อการเรียนรู้ในระยะยาว และทรัพยากรควรไปอยู่ที่ไหน
Route Optimization
UPS ประหยัดน้ำมันได้หลายสิบล้านลิตรต่อปี โดยใช้ Algorithm หาเส้นทางที่สั้นที่สุดให้รถส่งของทุกคัน พร้อมคำนวณว่าตู้ไหนควรวางของก่อน-หลัง
Surge Pricing สำหรับ Ride-Hailing
Grab และ Uber คำนวณราคา Real-time โดยดูจาก Demand ของผู้โดยสาร Supply ของคนขับ ความหนาแน่นของการจราจร และเหตุการณ์พิเศษในพื้นที่
รถยนต์ไร้คนขับ
Tesla, Waymo ใช้ข้อมูลจากกล้อง Lidar และ Sensor นับล้านจุดต่อวินาทีเพื่อให้รถตัดสินใจได้ในทุกสถานการณ์บนถนน
Precision Agriculture
โดรนถ่ายภาพไร่นา แล้ว AI วิเคราะห์ว่าพื้นที่ส่วนไหนขาดน้ำ ส่วนไหนมีโรคพืช หรือส่วนไหนดินไม่ดี ทำให้เกษตรกรใช้ทรัพยากรได้อย่างแม่นยำ
ทำนายสภาพอากาศแม่นขึ้น
Model สภาพอากาศสมัยใหม่รันบน Supercomputer ด้วยข้อมูลจาก Sensor ทั่วโลก ทำให้การพยากรณ์อากาศ 10 วันข้างหน้าแม่นกว่าการพยากรณ์ 3 วันเมื่อ 30 ปีก่อน
ติดตาม Carbon Footprint
บริษัทและประเทศต่างๆ ใช้ Data Science วัดและติดตามการปล่อยคาร์บอน วิเคราะห์ว่ามาตรการไหนได้ผลจริงในการลด Emission
เรื่องจริงที่น่าทึ่ง — Data Science เปลี่ยนเกมได้จริงๆ
บางครั้งตัวเลขและกราฟอธิบายได้ไม่เต็มที่ครับ ขอเล่าเป็นเรื่องๆ ให้เห็นภาพมากขึ้นแทน
ปี 2002 ทีมเบสบอล Oakland Athletics มีงบประมาณน้อยที่สุดในลีก แต่ผู้จัดการทีม Billy Beane ตัดสินใจใช้ การวิเคราะห์สถิติเชิงลึก แทนการพึ่งพาสายตาและประสบการณ์ของ Scout
แทนที่จะซื้อนักกีฬาดาราราคาแพง เขาวิเคราะห์ข้อมูลและหาผู้เล่นที่ ตัวเลขสำคัญสูง แต่ราคาต่ำ เพราะตลาดยังไม่รู้จักวิธีประเมินมูลค่าที่ถูกต้อง
🏆
ผลลัพธ์: Oakland A’s ชนะรวด 20 เกมติดต่อกัน ทำลายสถิติ American League — ด้วยงบที่น้อยกว่าทีมอันดับ 1 ถึง 3 เท่า
การทำความเข้าใจว่าโปรตีนจะ “พับตัว” เป็นรูปร่างยังไง เป็นหนึ่งในปัญหายากที่สุดในชีววิทยาครับ มันสำคัญมากเพราะรูปร่างของโปรตีนกำหนดว่ามันจะทำหน้าที่อะไรในร่างกาย และยาใหม่จะออกฤทธิ์ยังไง
นักวิทยาศาสตร์พยายามแก้ปัญหานี้มา 50 ปีโดยใช้การทดลอง แต่ทำได้ช้ามาก ในปี 2020 AlphaFold ของ DeepMind ใช้ Deep Learning ทำนายโครงสร้างโปรตีนได้อย่างแม่นยำในเวลาไม่กี่วัน
🔬
ผลลัพธ์: AlphaFold เผยแพร่โครงสร้างโปรตีนกว่า 200 ล้านชนิดให้ทั่วโลกใช้ฟรี — เปิดทางให้การพัฒนายาใหม่รวดเร็วขึ้นอย่างมหาศาล
Data Center ของ Google กินไฟมหาศาล ระบบทำความเย็นคิดเป็นสัดส่วนใหญ่มากของพลังงานทั้งหมด ทีม DeepMind ของ Google สร้าง AI ที่เรียนรู้วิธีควบคุมระบบทำความเย็นจากข้อมูลของ Sensor หลายพันตัว
แทนที่จะให้วิศวกรตั้งค่าทีละจุด AI จะ ปรับตัวเองแบบ Real-time ตาม Load ของเซิร์ฟเวอร์และอุณหภูมิภายนอก
⚡
ผลลัพธ์: ลดการใช้พลังงานระบบทำความเย็นได้ 40% — ประหยัดไฟได้เทียบเท่ากับเมืองขนาดกลางหนึ่งเมืองต่อปี
แต่ Data Science ก็ทำไม่ได้ทุกอย่างนะครับ
ผมอยากพูดตรงๆ ในส่วนนี้ครับ เพราะในโลกของ Hype และโฆษณา หลายคนเชื่อว่า AI และ Data Science คือยาวิเศษที่แก้ได้ทุกปัญหา ซึ่งมันไม่จริงครับ
🗑️
Garbage In, Garbage Out
ถ้าข้อมูลที่ป้อนเข้าไปห่วย ผลลัพธ์ที่ได้ก็ห่วยครับ Data Science ไม่สามารถแปลงข้อมูลที่ไม่ดีให้กลายเป็น Insight ที่ดีได้ นั่นคือเหตุผลว่าทำไมเราถึงต้องเรียน Data Cleaning ใน Module 5
⚖️
Bias ในข้อมูลคือ Bias ในผลลัพธ์
ถ้าข้อมูลที่ใช้ Train Model มี Bias อยู่ Model ก็จะมี Bias ด้วย มีกรณีจริงที่ระบบคัดกรองใบสมัครงานที่ Train จากข้อมูลอดีตที่ เลือกปฏิบัติต่อผู้หญิง — เพราะ Data สะท้อนอคติของคนในอดีตนั่นเองครับ
🔮
ทำนายได้ แต่ไม่ใช่ทำนายได้เสมอ
Model ทำงานได้ดีในสภาพแวดล้อมที่คล้ายกับข้อมูลที่ Train มา แต่เมื่อเกิดเหตุการณ์ที่ไม่เคยเกิดขึ้นก่อน เช่น COVID-19 Model หลาย Model ล้มเหลวทั้งหมด เพราะไม่เคยเห็นข้อมูลแบบนั้นเลย
🧑⚖️
ยังต้องการคนตัดสินใจสุดท้าย
โดยเฉพาะในเรื่องที่ส่งผลต่อชีวิตคน เช่น การแพทย์ กฎหมาย หรือนโยบายสาธารณะ Data Science ช่วยประกอบการตัดสินใจได้ดีมาก แต่ไม่ควรตัดสินใจแทนมนุษย์ทั้งหมด
🎯
Data Scientist ที่ดีรู้ข้อจำกัดของตัวเองครับ
คนที่อันตรายในสายงานนี้ไม่ใช่คนที่ไม่รู้ แต่คือคนที่ ไม่รู้ว่าตัวเองไม่รู้ การเข้าใจข้อจำกัดของ Data Science จะทำให้คุณสื่อสาร Uncertainty ได้ถูกต้อง และ Stakeholder จะเชื่อถือคุณมากกว่าคนที่อ้างว่า Model ทำได้ทุกอย่างครับ
โลกกำลังต้องการคนสายนี้มากแค่ไหน?
ผมไม่อยากให้เรียนคอร์สนี้เพราะตัวเลขหรือ Hype ครับ แต่แค่อยากให้เห็นภาพตลาดที่เป็นจริงก่อน
#1
Data Scientist ติดอันดับ 1 งานที่ดีที่สุดในอเมริกา หลายปีซ้อน (Glassdoor)
35%
การเติบโตของตำแหน่งงานด้าน Data ในอีก 10 ปีข้างหน้า (US Bureau of Labor)
∞
ทุกอุตสาหกรรมมีความต้องการ ไม่ได้จำกัดแค่ Tech Company
แต่ที่สำคัญกว่าตัวเลขพวกนั้นครับ คือ ทักษะ Data Science มีคุณค่าในตัวมันเอง ต่อให้คุณไม่ได้เป็น Data Scientist เต็มตัว การรู้จักวิเคราะห์ข้อมูล ตั้งคำถามจากข้อมูล และสื่อสาร Insight ได้ชัดเจน จะทำให้คุณดีขึ้นในทุกสายงานที่คุณอยู่ครับ
“Data Science ไม่ใช่แค่อาชีพ
มันคือ วิธีคิด ที่ทำให้คุณตัดสินใจด้วยหลักฐาน
ไม่ใช่แค่ด้วยความรู้สึก”
— และนั่นแหละครับคือทักษะที่มีค่าในทุกสาขาอาชีพ
หยุดนิ่งสักครู่ แล้วลองถามตัวเองครับ
Q1
จากอุตสาหกรรมทั้งหมดที่เห็น มีสักอุตสาหกรรมหรือ Use Case ไหนที่ทำให้คุณรู้สึกตื่นเต้นหรืออยากทำมากที่สุด? ลองนึกว่าถ้าคุณมีทักษะ Data Science แล้ว คุณอยากนำมันไปประยุกต์ใช้กับปัญหาอะไรในโลกที่คุณสนใจ?
Q2
ในหัวข้อข้อจำกัดของ Data Science ข้อไหนที่คุณคิดว่า สำคัญและน่ากังวลที่สุด? และถ้าคุณต้องออกแบบระบบ Data Science สักระบบ คุณจะป้องกันปัญหานั้นยังไง?
คำถามข้อที่ 2 ไม่ต้องมีคำตอบที่สมบูรณ์นะครับ แค่ลองคิดมันคร่าวๆ ไว้ เพราะ Data Ethics และ Responsible AI เป็นเรื่องที่วงการกำลังถกเถียงกันอยู่จริงๆ และคนสายนี้ทุกคนต้องมีมุมมองเกี่ยวกับมันครับ