Data Science
= อะไร?
คำถามง่ายๆ ที่ตอบยากเกินคาด — ลองเปิดใจแล้วอ่านดูนะครับ
คุณอาจจะแปลกใจว่ามันใกล้ตัวกว่าที่คิดมาก
ก่อนอื่น — ลองนึกภาพนี้
สมมติว่าคุณเป็นเจ้าของร้านกาแฟเล็กๆ สักร้านนึงครับ ทุกวันมีลูกค้าเข้าออก มีออเดอร์เข้ามา มีของหมดสต็อก มีวันที่ขายดีและวันที่เงียบเหงา
หลังจากเปิดร้านมาหนึ่งปี คุณมี ข้อมูล อยู่มหาศาลเลยครับ แต่คำถามคือ — คุณ เอาข้อมูลพวกนั้นไปทำอะไรได้บ้าง?
นั่นแหละครับ คือจุดเริ่มต้นของ Data Science
Data Science คือการเอา “ข้อมูล” มาแปลงเป็น “ความเข้าใจ” แล้วเอาความเข้าใจนั้นไปตัดสินใจหรือแก้ปัญหาได้จริงๆ
ฟังดูง่ายใช่ไหมครับ? แต่คำถามต่อมาคือ แล้วมันต่างจากการ “ดูตัวเลข” หรือ “ทำ Excel” ยังไง?
ต่างกันตรงที่ Data Science มีกระบวนการที่เป็นระบบมากกว่า มีเครื่องมือที่ทรงพลังกว่า และที่สำคัญที่สุด — มันสามารถ หาคำตอบที่สายตามนุษย์มองไม่เห็น ได้ครับ
Data Science มาจากไหน?
Data Science ไม่ได้โผล่ขึ้นมาจากอากาศครับ มันคือการรวมกันของ 3 สาขาที่มีอยู่แล้วในโลก
Computer Science
การเขียนโปรแกรม
Data Science อยู่ตรงกลางของทั้ง 3 สาขานี้ครับ
📐
Statistics — คณิตและสถิติ
ช่วยให้เราเข้าใจว่าข้อมูลบอกอะไร เชื่อได้แค่ไหน และมีรูปแบบอะไรซ่อนอยู่ ไม่ต้องเก่งระดับมหาวิทยาลัยครับ แค่เข้าใจพื้นฐานก็พอ
💻
Computer Science — การเขียนโปรแกรม
ช่วยให้เราจัดการข้อมูลจำนวนมาก สร้าง Model และทำให้ทุกอย่างทำงานอัตโนมัติได้ เครื่องมือหลักคือ Python และ SQL ที่เราจะเรียนในคอร์สนี้
🏭
Domain Knowledge — ความรู้เฉพาะสาขา
ช่วยให้เราตั้งคำถามที่ถูกต้อง และแปลความหมายข้อมูลได้ถูกต้อง Data Scientist ในโรงพยาบาลกับในธนาคารต้องรู้บริบทที่ต่างกันครับ และนี่คือจุดที่พื้นเดิมของคุณมีค่ามากๆ
💡
ข่าวดีสำหรับคุณ
ไม่จำเป็นต้องเก่งทั้ง 3 อย่างเท่ากันครับ Data Scientist ส่วนใหญ่ในโลกจริงมีจุดแข็งไม่เหมือนกัน บางคนเก่ง Statistics บางคนเก่ง Coding บางคนรู้ Domain ลึกมาก แค่รู้เพียงพอในทุกด้าน และเก่งมากในด้านใดด้านหนึ่ง ก็ทำงานได้แล้วครับ
กลับมาที่ร้านกาแฟ — Data Science ทำอะไรได้จริงๆ?
ลองกลับไปที่ร้านกาแฟของเราครับ สมมติว่าเราเก็บข้อมูลทุกอย่างไว้ครบ ทั้งวัน-เวลา เมนูที่ขาย อากาศ จำนวนลูกค้า ราคา และโปรโมชั่น Data Science จะช่วยตอบคำถามพวกนี้ได้
☕
วิเคราะห์ข้อมูลอดีต
เมนูไหนขายดีที่สุดในวันฝนตก?
เอาข้อมูลยอดขายมาดูร่วมกับข้อมูลอากาศ แล้วหาแพทเทิร์น — แบบนี้คือ Descriptive Analytics ครับ บอกว่าอดีตเป็นยังไง
🔮
ทำนายอนาคต
พรุ่งนี้ควรเตรียมของเท่าไหร่?
สร้าง Model ที่เรียนรู้จากข้อมูลย้อนหลัง แล้วทำนายว่าพรุ่งนี้น่าจะขายได้กี่แก้ว — นี่คือ Predictive Analytics ที่ต้องใช้ Machine Learning
🎯
แนะนำการตัดสินใจ
ควรออกโปรโมชั่นอะไรเพื่อดึงลูกค้ากลับมา?
วิเคราะห์ว่าลูกค้ากลุ่มไหนหายไป ชอบอะไร และโปรโมชั่นแบบไหนที่ได้ผลสูงสุด — นี่คือ Prescriptive Analytics ที่ช่วยให้ตัดสินใจดีขึ้น
นี่คือตัวอย่างจากร้านกาแฟเล็กๆ ครับ แต่หลักการเดียวกันนี้ใช้ได้กับทุกอุตสาหกรรมเลย ตั้งแต่โรงพยาบาลที่ทำนายผู้ป่วยที่มีความเสี่ยง ไปจนถึง Netflix ที่รู้ว่าคุณจะชอบซีรีส์เรื่องไหนก่อนที่คุณจะรู้ตัวด้วยซ้ำ
Data Science ≠ AI ≠ Machine Learning
คำพวกนี้ถูกใช้ปนกันจนงงครับ ลองทำความเข้าใจความสัมพันธ์กันก่อนดีกว่า
🤖
AI — Artificial Intelligence
คำที่กว้างที่สุด หมายถึงทุกความพยายามที่จะให้เครื่องจักร “คิดหรือตัดสินใจ” ได้เหมือนมนุษย์ ครอบคลุมทั้ง Machine Learning, Robotics, Language Processing และอีกเยอะมาก Data Science อยู่ใน AI ครับ แต่ไม่ใช่ทั้งหมด
🧠
Machine Learning — ML
สาขาย่อยของ AI ที่สอนให้คอมพิวเตอร์ เรียนรู้จากข้อมูล โดยไม่ต้องโปรแกรมทุกอย่างเอง เป็นเครื่องมือสำคัญที่ Data Scientist ใช้ แต่ Data Science มีมากกว่านั้น
📊
Data Science
กระบวนการ end-to-end ของการ เก็บ → ทำความสะอาด → วิเคราะห์ → สร้าง Model → สื่อสาร ข้อมูล รวมถึงการใช้ ML ด้วย แต่ก็รวมถึงสถิติ การ visualize และการแปลความหมายด้วย
“Machine Learning คือ เครื่องมือ ชิ้นนึงในกล่องเครื่องมือของ Data Scientist
ไม่ใช่ว่าถ้าทำ Data Science แล้วต้องสร้าง AI ทุกครั้ง”
— เพราะบางทีแค่กราฟ Bar Chart ที่ดี ก็แก้ปัญหาได้แล้วครับ
แล้ว Data Science ใช้ในชีวิตจริงที่ไหนบ้าง?
ใกล้ตัวกว่าที่คิดมากครับ ลองดูตัวอย่างที่คุณอาจเจอทุกวันโดยไม่รู้ตัว
🎵
Spotify / YouTube
ระบบ Recommendation ที่แนะนำเพลงหรือวิดีโอที่คุณน่าจะชอบ ใช้ข้อมูลพฤติกรรมของคุณและคนที่มีรสนิยมคล้ายกัน
🏦
ธนาคาร
ตรวจจับการทำธุรกรรมผิดปกติแบบ real-time วิเคราะห์ความเสี่ยงในการให้สินเชื่อ และทำนายว่าลูกค้าคนไหนจะเลิกใช้บริการ
🏥
โรงพยาบาล
ทำนายความเสี่ยงของโรค วิเคราะห์ภาพถ่าย X-ray ด้วย AI ช่วยหมอวางแผนการรักษา และบริหารเตียงผู้ป่วยให้มีประสิทธิภาพ
🚗
Grab / Uber
คำนวณราคาแบบ Dynamic Pricing คาดการณ์ว่าต้องมีคนขับอยู่ที่ไหน และประมาณเวลาที่แม่นยำ
🛒
E-Commerce
แนะนำสินค้า ทำนายสินค้าที่จะหมดสต็อก จัดการ supply chain และวิเคราะห์ว่าโปรโมชั่นไหนได้ผลดีที่สุด
⚽
กีฬา
วิเคราะห์ประสิทธิภาพนักกีฬา ทำนายโอกาสชนะ วางแผนยุทธวิธีโดยดูจากข้อมูลทีมคู่แข่ง อย่างใน Moneyball ที่เป็นหนังครับ
🔑
ประเด็นสำคัญที่อยากให้จำ
Data Science ไม่ใช่แค่ “เทคโนโลยีสำหรับบริษัทใหญ่” ครับ มันคือวิธีคิดและชุดเครื่องมือที่ใครก็ใช้ได้ ตราบใดที่มีข้อมูลและคำถามที่อยากตอบ และในโลกปัจจุบัน ทุกธุรกิจมีข้อมูลครับ — รอคนที่รู้จักเอามันไปใช้อยู่
นิยามที่ผมชอบที่สุด
มีนิยาม Data Science อยู่เยอะมากครับ บางอันฟังดูเท่ แต่ซับซ้อนเกินจนใช้งานไม่ได้ นิยามที่ผมชอบที่สุดและใช้อธิบายตัวเองตลอดคือ
“Data Science คือการใช้ ข้อมูล เพื่อตอบคำถาม
ที่มีความหมายต่อ คน หรือ ธุรกิจ จริงๆ”
— ง่ายๆ แค่นี้เลยครับ
สังเกตว่านิยามนี้ไม่ได้พูดถึงสูตรคณิต ไม่ได้พูดถึง Python ไม่ได้พูดถึง Neural Network ครับ เพราะสิ่งเหล่านั้นคือ เครื่องมือ ไม่ใช่ จุดประสงค์
จุดประสงค์ของ Data Science คือ การแก้ปัญหาจริงๆ เสมอครับ และนั่นคือสิ่งที่จะทำให้คุณต่างจากคนที่แค่รู้จักใช้เครื่องมือ
📌 สรุปบทที่ 1.1 : Data Science คือการแปลงข้อมูลให้เป็นความเข้าใจที่ใช้ตัดสินใจได้จริง
มันมาจากการรวม Statistics + Computer Science + Domain Knowledge
และมันอยู่ในชีวิตประจำวันของคุณอยู่แล้ว คุณแค่ยังไม่เคยเรียกมันว่า “Data Science” เท่านั้นเองครับ
หยุดนิ่งสักครู่ แล้วลองถามตัวเองครับ
Q1
ในชีวิตหรืองานของคุณตอนนี้ มีข้อมูลอะไรบ้างที่คุณเก็บอยู่แล้ว (หรือมีอยู่แต่ไม่ได้ใช้) และถ้าคุณ “เข้าใจ” ข้อมูลนั้นจริงๆ มันจะช่วยตัดสินใจเรื่องอะไรได้บ้าง?
Q2
ใน 3 องค์ประกอบของ Data Science (Statistics, CS, Domain Knowledge) ตอนนี้คุณอยู่จุดไหน? คิดว่าจุดแข็งของตัวเองคืออะไร และอยากพัฒนาด้านไหนมากที่สุด?
ไม่มีคำตอบถูกหรือผิดนะครับ ลองจดไว้ใน Notebook ของตัวเองดู แล้วกลับมาอ่านอีกครั้งหลังจบคอร์สนี้ — คุณจะเห็นเองว่ามุมมองเปลี่ยนไปยังไง