จากบทความที่ผ่านมาเรื่อง Anchoring ทำให้เราค้นพบกันว่า การยึดติดกับข้อมูลตัวใดตัวหนึ่งมากเกินไปนั้นทำให้การตัดสินใจของเรามีอคติเจอปนอยู่ได้มาก อันที่จริงแล้วยังมีอคติอีกหลาย ๆ ประเภทแต่ขออนุญาติละเอาไว้ก่อน หากมีโอกาสจะทะยอยนำมาเสนอให้อ่านกันครับ
และจากที่มีเพื่อน ๆ หลายคนถามกันมาว่าผมมีวิธีในการกะเกณฑ์คาดเดาเรื่องต่าง ๆ รอบ ๆ ตัว ผ่านเครื่องไม้เครื่องมีทางคอมพิวเตอร์ได้อย่างไร
วันนี้เลยขอเสนอเรื่องเกี่ยวกับการชี้วัดทางคณิตศาสตร์ ซึ่งอาจช่วยให้เราใช้เป็นตัวเลือกประกอบการตัดสินใจ หรือแม้แต่สามารถนำมาใช้พยากรณ์เหตุการณ์ต่าง ๆ โดยหลีกเลี่ยงการเอาอคติเข้ามาเจอปนครับ

โดยข้อมูลที่จะทำการศึกษากันในวันนี้ผมขอเลือกใช้ อัตรารายได้และอัตราค่าใช้จ่ายเฉลี่ยต่อครัวเรือนต่อเดือนของประชากรชาวไทยครับ
เนื่องจากสมมุติฐานที่ว่า “อัตราค่าใช้จ่ายนั้นจะผันแปรตามอัตรารายได้ของเรา” จะให้ผลเป็นสมการเชิงเส้น ซึ่งง่ายต่อการศึกษาวิเคราะห์กันครับ

ข้อมูลดิบ "อัตรารายได้และอัตราค่าใช้จ่ายเฉลี่ยต่อครัวเรือนต่อเดือนของประชากรชาวไทย"
ปีพ.ศ.      2537    2539    2541    2543    2545    2547    2549    2550    2552
รายได้      8,262      10,779      12,492      12,150      13,736      14,963      17,787      18,660      20,904
ค่าใช้จ่าย      7,567      9,190      10,389      9,848      10,889      12,297      14,311      14,500      16,205

จากข้อมูลดิบเหล่านี้หากเรานำมาพล็อตเป็นกราฟจะเห็นความสัมพันธ์ของข้อมูลได้ชัดเจนขึ้นครับ

** ใช้โปรแกรมภาษาไทยธอนเวอร์ชั่น 1.11 ขึ้นไป ดาวน์โหลดได้ที่นี่ครับ

#คำสั่งภาษาไทยธอน
กราฟของฉัน = สร้างกราฟ("แบบจำลองอัตราส่วนการบริโภค\nของประชากรชาวไทย",(640,480))
X = [8262,10779,12492,12150,13736,14963,17787,18660,20904] #อัตรารายได้เฉลี่ยต่อครัวเรือนต่อเดือนของประชากรชาวไทย
Y = [7567,9190,10389,9848,10889,12297,14311,14500,16205] #อัตราค่าใช้จ่ายเฉลี่ยต่อครัวเรือนต่อเดือนของประชากรชาวไทย
กราฟของฉัน.พล็อต(X,Y,สี=(255,0,0),สัญลักษณ์=0)
กราฟของฉัน.ตั้งชื่อแกนเอ็กซ์("รายได้เฉลี่ยต่อเดือน")
กราฟของฉัน.ตั้งชื่อแกนวาย("ค่าใช้จ่ายเฉลี่ยต่อเดือน")
กราฟของฉัน.ใส่เส้นตาราง()



จากความสัมพันธ์ดังกล่าวนำมาคำนวณได้เป็นโมเดลทางคณิตศาสตร์คือ Y = 1646.4454 + 0.6966(X)
โดยที่ Y คือ อัตราค่าใช้จ่ายเฉลี่ยต่อครัวเรือนต่อเดือนของประชากรชาวไทย ซึ่งจะผันแปลตามตัวแปล X
โดยที่ X คือ อัตรารายได้เฉลี่ยต่อครัวเรือนต่อเดือนของประชากรชาวไทย
หากเรานำโมเดลดังกล่าวซึ่งเป็นสมการเชิงเส้น มาพล็อตเป็นกราฟจะได้หน้าตาออกมาดังนี้

#คำสั่งภาษาไทยธอน
กราฟของฉัน = สร้างกราฟ("แบบจำลองอัตราส่วนการบริโภค\nของประชากรชาวไทย",(640,480))
X = [8262,10779,12492,12150,13736,14963,17787,18660,20904] #อัตรารายได้เฉลี่ยต่อครัวเรือนต่อเดือนของประชากรชาวไทย
Y = [7567,9190,10389,9848,10889,12297,14311,14500,16205] #อัตราค่าใช้จ่ายเฉลี่ยต่อครัวเรือนต่อเดือนของประชากรชาวไทย
กราฟของฉัน.พล็อต(X,Y,สี=(255,0,0),สัญลักษณ์=0)
กราฟของฉัน.ตั้งชื่อแกนเอ็กซ์("รายได้เฉลี่ยต่อเดือน")
กราฟของฉัน.ตั้งชื่อแกนวาย("ค่าใช้จ่ายเฉลี่ยต่อเดือน")
กราฟของฉัน.ใส่เส้นตาราง()
b1 = 1646.4454965026653
b2 = 0.69664611572596047
แบบจำลอง = คำสั่งย่อ x:b1 + b2*x
Z = []
แต่ละ ตัวข้อมูล ใน X:
	Z.ต่อด้วย(แบบจำลอง(ตัวข้อมูล))

กราฟของฉัน.พล็อต(X,Z,สี=(0,255,0))


โดยที่เส้นสีเขียวคือเส้นที่คำนวนจากโมเดลโดยให้ Y เป็นตัวแปลที่ผันแปลตาม X
จะเห็นได้ว่าแต่ละจุดซึ่งเป็นข้อมูลดิบนั้นมีจุดเบี่ยงเบนออกไปจากเส้นบ้างแต่สุดท้ายแล้วไม่ว่าจะเบียงเบนออกไปมากกว่าหรือน้อยกว่า(ค่า +- ตามแกน Y)สุดท้ายแล้วมักจะถดถอยมาที่บริเวณเส้นนี้เสมอ เราเรียกการถดถอยนี้ว่า “การถดถอยสู่ค่าเฉลี่ย” โดยการที่ค่าที่แท้จริงในข้อมูลดิบนั้นคลาดเคลื่อนออกไปจากเส้นในสมการนี้ เราเรียกมันว่า”ตัวรบกวน”(disturbance) หรือ”ความผิดพลาด”(error) ในระบบ
ซึ่งเป็นเรื่องปกติในทางสถิติ โดยที่จุดคลาดเคลื่อนเหล่านั้นอาจมาจากปัจจัยภายนอกต่าง ๆ ที่เข้ามาส่งผลกระทบต่อข้อมูลดิบ ซึ่งปัจจัยภายนอกเหล่านี้อาจมีได้มากมายหลาย ๆ ปัจจัยด้วยกัน แต่โดยทั่วไปแล้วเราจะละมันเอาไว้ในฐานะ”ตัวรบกวน”ในระบบ เพราะการคำนวนในทุก ๆ ปัจจัยพร้อม ๆ กันเป็นเรื่องที่ทำได้ยากและทำให้โมเดลของเรามีความซับซ้อนจนนำมาใช้งานจริงได้ยากยิ่งขึ้น

นอกจากนี้ข้อมูลจากการคำนวนได้ค่าสัมประสิทธิ์(coefficient of determination) อยู่ที่ 0.99452698707886478 ซึ่งหมายความว่า โมเดลนี้มีความเข้ากันกับข้อมูลดิบมาก หรืออีกนัยหนึ่งคือ มีค่าความผิดพลาดอยู่ที่ประมาณ +-0.5473%

จากโมเดลดังกล่าวหากเรามุ่งประเด็นความสนใจไปที่ “ตัวคูณ” ของสมการหรือค่า 0.6966 จะเห็นได้ว่าอัตราการออม(รายได้-ค่าใช้จ่าย)ของคนทั้งประเทศ มีค่าวิ่งเข้าใกล้ 30% เมื่อมีรายได้มากขึ้น (1-0.6966=0.3034) ซึ่งถือเป็นตัวเลขแนวโน้มการออมที่ดี

นอกจากนี้เรายังสามารถนำโมเดลนี้มาพยากรณ์/คาดการณ์ข้อมูลในอนาคตได้เช่น
หากเราคาดว่าถ้าอัตรารายได้เฉลี่ยต่อครัวเรือนต่อเดือนในปี 2554 จะมีค่าอยู่ที่ 23404 บาท อัตราค่าใช้จ่ายเฉลี่ยต่อครัวเรือนต่อเดือน ก็จะอยู่ที่ประมาณ 1646.4454 + 0.6966(23404) = 17949.6718 บาท
หรืออีก scenario ถ้าหากอัตรารายได้เฉลี่ยต่อครัวเรือนต่อเดือนในปี 2554 อยู่ที่ 21904 บาท อัตราค่าใช้จ่ายเฉลี่ยต่อครัวเรือนต่อเดือน ก็จะอยู่ที่ประมาณ 1646.4454 + 0.6966(21904) = 16904.7718 บาท

เรื่องของการคำนวนพยากรณ์ยังไม่จบแค่เพียงเท่านี้ หากมีเวลาจะเข้ามาขยายผลต่อเร็ว ๆ นี้ครับ

แหล่งที่มาของข้อมูลดิบ: www.nso.go.th

Comments
  1. […] อัตราส่วนการบริโภคของชาวไทย […]

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s