
ก่อนจะเริ่มสร้างโมเดล Machine Learning สวยๆ หรือทำ Dashboard สุดเท่ หลายคนมักข้ามขั้นตอนที่สำคัญที่สุดไปโดยไม่รู้ตัว นั่นก็คือการทำ EDA หรือ Exploratory Data Analysis ซึ่งถ้าพูดง่ายๆ ก็คือการ “ทำความรู้จักข้อมูลก่อนเอาไปใช้งานจริง” นั่นเองครับ หลายคนที่เพิ่งเริ่มต้นเรียน data มักคิดว่าขั้นตอนนี้ไม่สำคัญ หรือข้ามไปเลยก็ได้ แต่ความจริงแล้ว EDA คือหัวใจของงาน data analytics เลยก็ว่าได้ เพราะถ้าไม่รู้จักข้อมูลที่ตัวเองมีอยู่ดีพอ จะสร้างอะไรออกมาก็ผิดพลาดได้ทั้งหมด บทความนี้จะพาทุกคนไปทำความเข้าใจ EDA แบบกันเอง ไม่งง และเอาไปใช้ได้จริงครับ EDA คืออะไรกันแน่ ? EDA ย่อมาจาก Exploratory Data Analysis ซึ่งหมายถึงกระบวนการสำรวจและวิเคราะห์ข้อมูลเบื้องต้น ก่อนที่จะนำข้อมูลไปประมวลผลจริงจัง เปรียบง่ายๆ ก็เหมือนกับที่เราซื้อผักมาแล้ว ก่อนจะเริ่มทำอาหาร เราก็ต้องหยิบขึ้นมาดูก่อนว่าสดไหม มีรูพยาธิไหม หรือเน่าไปส่วนไหนบ้าง ไม่ใช่หยิบทั้งหมดโยนลงกระทะทีเดียวเลย แนวคิด EDA ถูกพัฒนาโดย…

ในวันที่ AI ไม่ได้แค่ “ตอบคำถาม” อีกต่อไป ถ้าเมื่อสองสามปีก่อนเราพูดถึง AI เราอาจนึกถึงแชทบอทที่ตอบคำถามง่ายๆ หรือโมเดลที่ช่วยแนะนำหนังใน Netflix แต่ในปี 2026 สถานการณ์เปลี่ยนไปอย่างสิ้นเชิงแล้วล่ะครับ ตอนนี้เราอยู่ในยุคของ AI Agent — ระบบ AI ที่ไม่ได้แค่ “ตอบ” แต่สามารถ “ทำ” ให้ได้ด้วย ไม่ว่าจะเป็นการสั่งซื้อของ การวิเคราะห์รายงาน การส่งอีเมล หรือแม้แต่การเขียนโค้ดแล้วรันเอง ทั้งหมดนี้ทำได้แบบอัตโนมัติโดยที่มนุษย์ไม่ต้องคลิกอะไรเลย แต่ความลับของ AI Agent ที่ทรงพลังอยู่ที่อะไรรู้ไหมครับ? คำตอบคือ: Data ไงล่ะครับ วันนี้เราจะมาพูดถึงความสัมพันธ์ระหว่าง AI Agent กับ Data ว่าทำไมสองสิ่งนี้ถึงแยกกันไม่ออก และคนที่ทำงานด้าน Data ในยุคนี้ต้องปรับตัวยังไงบ้าง AI Agent คืออะไรกัน ? ก่อนอื่นขอปูพื้นกันก่อนนะครับ AI Agent คือระบบ AI ที่สามารถ…

ช่วงที่ผมเริ่มเรียนเรื่องเกี่ยวกับ Data Sci ใหม่ๆ ตอนได้ยินเรื่อง Clustering นี่เอาเข้าจริงก็งงอยู่นะครับ 555 แบบศัพท์ไรวะ ชื่อเท่เกิ้นนน พอได้หาข้อมูลไปมา ก็พอจะเข้าใจว่ามันคือการ “จัดกลุ่ม” แต่คำว่า “จัดกลุ่ม” เนี่ย เอาเข้าจริง พอพูดๆแล้ว ก็ยังไม่ค่อยเข้าใจเท่าไหร่นะครับ “จัดอะไร จัดทำไม จัดไปเพื่ออะไร” (ส่วนตัวเป็นคนที่ต้องเข้าใจว่า core ของการทำอะไรแบบนี้คือ เราจะทำไปเพื่ออะไร ? 555) ด้วยความที่เป็นคนที่ต้องเร้าหรือกับตัวเองเนี่ยแหละ เลยหาข้อมูลมาเยอะมาก ไม่ว่าจะอ่านเอา ถาม chatgpt, gemini เรียกได้ว่าเอาให้เคลียว่า “ทำไมเราต้องใช้มัน” จนเป็นในที่สุดครับ ก็ได้คลอดออกมากลายเป็นบทความนี้ 🙂 ให้ทุกคนได้อ่านกัน! Clustering คืออะไร ? ผมว่าพอผมเกริ่นให้ขนาดนี้ ก็น่าจะพอเห็นภาพลางๆกันละล่ะ Clustering ความหมายหลักของมันก็คือ “การจัดกลุ่มข้อมูล” โดยการจัดกลุ่มข้อมูลนั้น จะมีเกณฑ์กำหนดกำหนดว่า ข้อมูลแบบนี้ควรจะเป็นกลุ่มไหน ซึ่งสิ่งที่เอาเป็นเกณฑ์ในการแบ่งกลุ่มเนี่ย เราจะเรียกมันว่า “ลักษณะร่วม” ครับ…