3.2 การวิเคราะห์เชิงทำนาย

 การวิเคราะห์เชิงทำนาย



การวิเคราะห์เชิงทำนาย (predictive analysis) 
         เป็นการวิเคราะห์ข้อมูลในอดีตเพื่อหารูปแบบความสัมพันธ์ในชุดข้อมูลที่สามารถนำามาเป็นต้นแบบในการทำนาย การคาดการณ์ผลหรือสิ่งที่น่าจะเกิดขึ้นในอนาคต ซึ่งจะช่วยให้บุคคลหรือองค์กร สามารถตัดสินใจได้อย่างมีประสิทธิภาพ
         การคาดการณ์โอกาสที่ฝนจะตก อาศัยประสบการณ์และการสังเกตลักษณะท้องฟ้า ความแรงของลมที่พัด ทำให้ตัดสินใจว่าควรพกร่มหรือชุดกันฝนติดตัวไปด้วยหรือไม่ หากฝนตกแล้วได้พกร่มหรือชุดกันฝนไปด้วย ช่วยทำให้เปียกฝนน้อยลง แสดงว่าการตัดสนใจนั้นมีประสิทธิภาพ


การทำนายเชิงตัวเลข (Numeric Prediction)


        ใช้ข้อมูลในอดีตมาวิเคราะห์หาแนวโน้มเพื่อทำนายอนาคต ซึ่ง ผลลัพธ์ของการทำนายจะอยู่ในรูปตัวเลข
เช่น

  • หากต้องไปต่างประเทศ ควรตรวจสอบอุณหภูมิของประเทศที่จะไปในช่วงเวลานั้นๆ เพื่อวางแผนการจัดเตรียมเสื้อผ้าได้อย่างถูกต้อง
  • เกษตรกร ชวนสวน ต้องคาดการณ์ปริมาณน้ำฝนล่วงหน้าจากข้อมูลปริมาณน้ำฝนในอดีต เพื่อนำมาวางแผนการเพาะปลูก
  • สถาบันการศึกษาต้องคาดการณ์จำนวนนักเรียนที่จะเข้าศึกษาต่อ เพื่อวางแผนการดำเนินงานไปปีการศึกษาถัดไป

     การทำนายข้างต้น ทำได้โดยการนำข้อมูลในอดีต (สภาพอากาศ ปริมาณน้ำฝนในพื้นที่ หรือจำนวนนักเรียนที่เข้าศึกษาต่อ

ในปีการศึกษาก่อนหน้า) มา
วิเคราะห์หาความสัมพันธ์ระหว่างชุดข้อมูลและสร้างแบบจำลองในการทำนายที่ให้ผลลัพธ์เป็น

ตัวเลข 
ซึ่งโดยทั่วไปมีวิธีการทำนาย 
วิธี คือ 


 การทำนายโดยใช้กราฟ และ การทำนายโดยใช้สมการเชิงเส้น


     เมื่อข้อมูล ชุด มีความสัมพันธ์เชิงเส้นต่อกัน สามารถทำนายชุดข้อมูลที่สนใจ (y) เมื่อทราบค่าชุดข้อมูลอีกชุดหนึ่ง (x) ที่สัมพันธ์กัน เช่น จากตัวอย่างจำนวนวัวป่า (x) กับจำนวนม้าลาย (y) หากต้องการประมาณค่าจำนวนม้าลายจากข้อมูลจำนวนวัวป่า ต้องทำการลากเส้นตรงผ่านจุดด่างๆ ในแผนภาพการกระจายให้มากที่สุด เรียกเส้นตรงดังกล่าวว่า เส้นแนวโน้ม” และใช้เส้นแนวโน้มนี้ในการประมาณค่าจำนวนม้าลาย



เส้นแนวโน้ม (เส้นสีแดง) ลากผ่านจุดต่างๆ ในแผนภาพการกระจาย ของความสัมพันธ์จำนวนวัวป่ากับจำนวนม้าลาย

การทำนายค่าจากเส้นแนวโน้ม มีขั้นตอนดังนี้


1.  สร้างแผนภาพการกระจาย – ทำให้ทราบรูปแบบความสัมพันธ์ของข้อมูลคร่าวๆ



2.  ลากเส้นแนวโน้ม – ลากเส้นตรงผ่านจุดต่างๆ ที่อยู่บนแผนภาพการกระจายให้ได้จำนวนมากที่สุด (line of best fit) โดยจำนวนจุดที่อยู่เหนือเส้นและใต้เส้น ควรมีปริมาณใกล้เคียงกัน


3.  ทำนายค่าจากเส้นแนวโน้ม


  • ประมาณค่าจากเส้นแนวโน้ม – ในที่นี้ให้ เป็นค่าที่ต้องการทำนาย และ เป็นข้อมูลที่ทราบค่า โดยให้กำหนดจุดที่ทราบค่าบนแกน แล้วลากเส้นจากจุดนั้นขนานกับแกน ไปตัดกับเส้นแนวโน้ม แล้วลากเส้นจากจุดตัดบนเส้นแนวโน้ม ขนานกับแกน ไปตัดที่แกน จะได้ค่า ซึ่งเป็นค่าที่ต้องการทำนาย


การประมาณค่าจากเส้นแนวโน้ม (หากมีจำนวนวัวป่า 90 พันตัว จะมีจำนวนม้าลาย 112 พันตัว)

การทำนายเชิงหมวดหมู่ (Classification)



         ใช้ข้อมูลที่มีความสัมพันธ์กัน มาทำนายข้อมูลที่ไม่ใช่ข้อมูลตัวเลข เพื่อจำแนกว่าผลลัพธ์จะอยู่ในกลุ่มหรือหมวดหมู่ใด เช่น การทำนายว่าฝนจะตกหรือไม่ (ตกไม่ตก) อาหารจานโปรด(ต้มยำกุ้งผัดไทยกะเพราหมู) แนวเพลงที่ชอบ (แจ๊สป๊อปร็อกลูกทุ่ง) ประเภทเครื่องดื่ม (น้ำอัดลมน้ำผลไม้เครื่องดื่มเกลือแร่) เป็นต้น


       แนวคิดหลักในการทำนาย คือ ใช้ข้อมูลในอดีตที่มีการระบุหมวดหมู่มาแล้ว มาทำนายข้อมูลชุดใหม่ที่ยังไม่ทราบหมวดหมู่ โดยจะขอกล่าวถึงการจัดหมวดหมู่ด้วยวิธีการค้นหาเพื่อนบ้านใกล้เคียงที่สุด ตัว (K-Nearest Neighbors: K-NN)



ในการประเมินความถูกต้องในการจำแนกข้อมูล ต้องนำผลลัพธ์จากการจำแนกหมวดหมู่ ไปทดสอบกับชุดข้อมูลที่ทราบคำตอบอยู่แล้ว ซึ่งมักเป็นข้อมูลชุดเดียวกันกับข้อมูลตั้งต้น แต่ถูกแยกเฉพาะเพื่อการประมาณ ตัวอย่างเช่น หากใช้ข้อมูลในอดีตของการเกิดไฟป่า มาทำนายการเกิดไฟป่าในอนาคต โดยอาศัยค่าอุณหภูมิเฉลี่ยและความชื้นสัมพันธ์ในวันนั้นๆ จำนวนข้อมูลการเกิดไฟป่าในอดีตมี 20 ตัวอย่าง อาจแบ่งข้อมูลสำหรับสร้างรูปแบบการทำนาย 13 ชุด และใช้ข้อมูลอีก ชุด ในการทดสอบความถูกต้อง ของผลลัพธ์การทำนายว่าเกิดไฟป่าหรือไม่


คลิปย้อนหลัง


แหล่งอ้างอิงข้อมูล : https://itpoj.com/2020/08/14/data_analysis/





ไม่มีความคิดเห็น:

แสดงความคิดเห็น