ความน่าจะเป็นแบบเบส์
บทความนี้อาจต้องการตรวจสอบต้นฉบับ ในด้านไวยากรณ์ รูปแบบการเขียน การเรียบเรียง คุณภาพ หรือการสะกด คุณสามารถช่วยพัฒนาบทความได้ |
ในทฤษฎีความน่าจะเป็น สถิติ การอนุมาน และปัญญาประดิษฐ์ บางครั้งจะพบคำว่า แบบเบส์ (Bayesian) มาขยายชื่อทฤษฎีหรือโมเดลต่าง ๆ โดยทุกครั้งที่พบคำขยายนี้หมายความว่าได้มีการนำปรัชญาหรือหลักการของ ทฤษฎีความน่าจะเป็นแบบเบส์ (บางท่านเรียก การอนุมานแบบเบส์ หรือ สถิติแบบเบส์) มาใช้กับสาขาความรู้นั้น ๆ
ถ้าจะกล่าวอย่างไม่เป็นทางการ, ทฤษฎีความน่าจะเป็นแบบเบส์แปลความหมายของคำว่า ความน่าจะเป็น เป็น ความเชื่อมั่นส่วนบุคคลในเหตุการณ์หนึ่ง ๆ ซึ่งต่างจากทฤษฎีความน่าจะเป็นของคอลโมโกรอฟ (ที่มักถูกเรียกว่าทฤษฎีความน่าจะเป็นเชิงความถี่) ที่มักแปลความหมายของความน่าจะเป็น (โดยต้องแปลควบคู่ไปกับการทดลองเสมอ) ดังนี้ ความน่าจะเป็นของเหตุการณ์ A คือ อัตราส่วนของจำนวนครั้งของเหตุการณ์ A ที่ทดลองสำเร็จเทียบกับจำนวนครั้งที่ทดลองทั้งหมด จุดแตกต่างสำคัญระหว่างทฤษฎีทั้งสองประเภทมีดังนี้
- ความหมายของความน่าจะเป็น
- พวกเบส์มอง ความน่าจะเป็น เป็นความเชื่อส่วนบุคคล
- พวกเชิงความถี่มอง ความน่าจะเป็น เป็นคุณสมบัติหนึ่งที่ถูกฝังอยู่ในวัตถุ (ไม่ขึ้นกับตัวบุคคล)
- การนำทฤษฎีไปใช้งาน - ในการนำทฤษฎีความน่าจะเป็นเชิงความถี่ไปใช้จะต้องมีการทดลองเชิงแนวคิด (conceptual experiment) ควบคู่ไปด้วยเสมอ เหตุการณ์ใดๆ ก็ตามที่ไม่มีการทดลองเชิงแนวคิดที่สมเหตุสมผลพอ จะไม่สามารถนำทฤษฎีความน่าจะเป็นเชิงความถี่ไปใช้งานได้ เช่น เราไม่สามารถจินตนาการการทดลองเพื่อทดสอบว่า มีมนุษย์ต่างดาวอยู่หรือไม่ ได้. ฉะนั้นประโยค ความน่าจะเป็นที่จะมีมนุษย์ต่างดาว ไม่มีความหมายในทฤษฎีความน่าจะเป็นเชิงความถี่ แต่เราสามารถนำทฤษฎีความน่าจะเป็นแบบเบส์มาอ้างความน่าจะเป็นประเภทนี้ได้ ในมุมมองนี้เราอาจกล่าวได้ว่าทฤษฎีความน่าจะเป็นแบบเบส์สามารถนำไปประยุกต์ใช้งานได้กว้างขวางมากกว่า
กล่าวโดยสรุปทฤษฎีความน่าจะเป็นแบบเบส์ มีปรัชญาที่ต่างจากทฤษฎีความน่าจะเป็นเชิงความถี่เกือบสิ้นเชิงถึงแม้จะมีสัจพจน์พื้นฐานแบบเดียวกัน โดยในทฤษฎีความน่าจะเป็นแบบเบส์นั้นมอง ความน่าจะเป็น, สถิติ หรือการอนุมานเป็นเรื่องเดียวกัน
ประวัติของความน่าจะเป็นแบบเบส์
แก้ชื่อเรียก "แบบเบส์" เพิ่งจะมาใช้ในราวปี ค.ศ. 1750 โดยมีต้นกำเนิดมาจากชื่อของ โทมัส เบส์ ผู้ซึ่งเสนอทฤษฎีบทของเบส์เป็นคนแรก (เท่าที่ทราบในประวัติศาสตร์) ในเวลาถัดมาปีแยร์-ซีมง ลาปลาสได้เสนอทฤษฎีบทของเบส์เช่นกัน โดยในขณะนั้นลาปลาสไม่ทราบว่ามีงานของเบส์อยู่ ทฤษฎีบทของเบส์ในแบบของลาปลาสถูกนำไปใช้งานอย่างกว้างขวางชนิดที่ตัวของเบส์เองก็อาจคาดไม่ถึง (ทั้งนี้เนื่องจากการแปลความหมายของ ความน่าจะเป็น ของลาปลาสนั้นกว้างมากอย่างที่ได้กล่าวเอาไว้ในบทนำ) โดยลาปลาสได้นำไปในประยุกต์ใช้ในปัญหาของกลศาสตร์, ดาราศาสตร์, สถิติการแพทย์ (medical statistics) หรือแม้แต่ นิติศาสตร์
ลาปลาสได้ใช้ทฤษฎีความน่าจะเป็น (แบบเบส์) ในการทำนายมวลของดาวเสาร์โดยใช้ข้อมูลของวงโคจรดาวเสาร์ที่มีอยู่ในขณะนั้น โดยลาปลาสมั่นใจผลการทำนายมากถึงขนาดกล่าวว่า "ผมพนัน 1 ต่อ 11000 ว่ามวลของดาวเสาร์จะคลาดเคลื่อนไม่เกิน 1/100 ของมวลที่ผมคำนวณได้" ถ้าเขายังมีชีวิตอยู่ไปอีก 150 ปี ลาปลาสคงจะได้ทราบว่าตัวเองชนะพนัน เนื่องจากในเวลานั้นพบว่ามวลของดาวเสาร์มีความคลาดเคลื่อนจากผลการคำนวณของลาปลาสเพียง 0.63%. สังเกตว่าไม่มีทางที่เราจะใช้ทฤษฎีความน่าจะเป็นเชิงความถี่ในปัญหานี้ได้เลย (ไม่สามารถสร้างการทดลองเชิงแนวคิดที่ว่า "ทดลองสร้างดาวเสาร์มา N ครั้ง มี M ครั้งที่ ..." ได้อย่างสมเหตุสมผล)
ความหมายของตัวเลขค่าความน่าจะเป็น
แก้ความหมายของตัวเลขของความน่าจะเป็นแบบเบส์ (เช่นตัวเลข 0.72 ใน "มีความน่าจะเป็น 0.72 ที่ ...") มีการแปลในหลายความหมาย (เนื่องจากในหมู่ผู้สนับสนุนความน่าจะเป็นแบบเบส์ก็มีความเห็นไม่ค่อยตรงกันในรายละเอียดหลาย ๆ ประเด็น) การแปลความหมายหนึ่งที่นิยมใช้กันมากมีดังนี้
- มองในแง่ของการพนัน ดังเช่นที่ลาปลาสใช้ เช่น ความน่าจะเป็น 1/3 มีความหมายเหมือนพนัน 1 ต่อ 2 (แทง 1 ได้ 2 ไม่รวมทุน) มุมมองนี้ถูกเสนออีกครั้งโดยบรูโน เด ฟิเนตติ หนึ่งในผู้บุกเบิกทฤษฎีความน่าจะเป็นแบบเบส์ในศตวรรษที่ 20
- มองในแง่ที่ว่าทฤษฎีความน่าจะเป็นเป็นส่วนขยายของตรรกศาสตร์ นั่นคือในตรรกศาสตร์ดั้งเดิม ประพจน์จะมีค่าความจริง ได้แค่ จริง หรือ เท็จ นั่นคือ 1 หรือ 0 เท่านั้น. การเพิ่มตัวเลขในช่วง 0 ถึง 1 จึงเป็นการเพิ่มความไม่แน่นอน เข้าไปในระบบตรรกศาสตร์ดั้งเดิม สังเกตว่าตัวเลขความน่าจะเป็นต้องอยู่ในช่วง 0 ถึง 1 ตามสัจพจน์ของความน่าจะเป็น. มุมมองนี้ถูกเสนอโดย แฮโรลด์ เจฟฟรีย์, ริชาร์ด คอกซ์ และ เอ็ดวิน ทอมป์สัน เจนส์
ผู้บุกเบิกทฤษฎีความน่าจะเป็นแบบเบส์ที่มีชื่อเสียงคนอื่นๆ คือ จอห์น เมย์นาร์ด เคนส์, เลโอนาร์ด ซาเวจ, แฟรงค์ แรมซีย์, รูดอร์ฟ คาร์นาพ โดยนักทฤษฎีความน่าจะเป็นแบบเบส์ที่โด่งดังในยุคคลาสสิก (1930-1960) ที่ยังมีชีวิตอยู่ในปัจจุบันก็คือ เดนนิส ลินด์ลีย์. เจนส์ให้ข้อสังเกตไว้ว่าผู้สนับสนุนทฤษฎีแบบเบส์ที่มีชื่อเสียงมักเป็นบุคคลจากสาขาอื่นที่ไม่ใช่คณิตศาสตร์ ไม่ว่าจะเป็นตัวเขา และคอกซ์ที่เป็นนักฟิสิกส์, เซอร์ แฮโรลด์ เจฟฟรีย์ที่เป็นนักธรณีวิทยา, เคนส์ที่เป็นนักเศรษฐศาสตร์ หรือ คาร์นาพที่เป็นนักปรัชญาวิทยาศาสตร์ ทั้งนี้อาจเป็นเพราะบุคคลเหล่านี้ต้องการนำทฤษฎีความน่าจะเป็นไปใช้งานจริง และต่างก็พบว่าทฤษฎีความน่าจะเป็นเชิงความถี่ไม่กว้างขวางพอที่จะเอาไปใช้จริงได้ อีกทั้งสถิติเชิงความถี่ก็ไม่น่าเชื่อถือ และสมเหตุสมผลพอ บุคคลเหล่านี้จึงต้องพัฒนาทฤษฎีความน่าจะเป็นที่สามารถนำไปใช้ได้จริงขึ้นมา และต่างก็ค้นพบแนวทางเดียวกันซึ่งก็คือสิ่งที่ลาปลาสได้แสดงไว้แล้วเมื่อราวต้นคริสต์ศตวรรษที่ 19
ความหมายทางคณิตศาสตร์
แก้ทฤษฎีบทของเบย์ถูกระบุทางคณิตศาสตร์เป็นสมการต่อไปนี้[1]
โดยที่ และ คือ เหตุการณ์ และ
- คือ ความน่าจะเป็นแบบมีเงื่อนไข: ความน่าจะเป็นของเหตุการณ์ ที่เกิดขึ้น โดยที่ เป็นจริง หรือเรียกอีกอย่างว่า ความน่าจะเป็นภายหลัง ของ เมื่อพิจารณาจาก
- เป็นความน่าจะเป็นแบบมีเงื่อนไขเช่นเดียวกัน: ความน่าจะเป็นที่เหตุการณ์ จะเกิดขึ้น เมื่อ เป็นจริง นอกจากนี้ยังสามารถตีความได้ว่าเป็น likelihood ของ ที่กำหนด คงที่ เพราะ
- และ คือความน่าจะเป็นที่ และ จะเกิดขึ้นโดยไม่มีการกำหนดเงื่อนไขใดๆ รู้จักกันในชื่อ ความน่าจะเป็นก่อนหน้า และ ความน่าจะเป็นส่วนเพิ่ม
แหล่งข้อมูลอื่น
แก้- On-line textbook: Information Theory, Inference, and Learning Algorithms, by David MacKay, has many chapters on Bayesian methods, including introductory examples; compelling arguments in favour of Bayesian methods (in the style of Edwin Jaynes) ; state-of-the-art Monte Carlo methods, message-passing methods, and variational methods; and examples illustrating the intimate connections between Bayesian inference and data compression.
- Jaynes, E.T. (2003) Probability Theory : The Logic of Science.
- Bretthorst, G. Larry, 1988, Bayesian Spectrum Analysis and Parameter Estimation in Lecture Notes in Statistics, 48, Springer-Verlag, New York, New York;
- http://www-groups.dcs.st-andrews.ac.uk/history/Mathematicians/Ramsey.html เก็บถาวร 2019-06-09 ที่ เวย์แบ็กแมชชีน
- W. Feller. An Introduction to Probability Theory and Its Applications, vol. 1, 3rd Edition. John Wiley & Sons, INC, 1968.
- novomind AG "Outlook categorizing tool based on Bayesian filtering" เก็บถาวร 2006-12-05 ที่ เวย์แบ็กแมชชีน
- Howard Raiffa Decision Analysis: Introductory Lectures on Choices under Uncertainty. McGraw Hill, College Custom Series. (1997) ISBN 007-052579-X
- ↑ Kemp, C. D.; Stuart, A.; Ord, J. K. (1988-03). "Kendall's Advanced Theory of Statistics, Volume 1, Distribution Theory". Biometrics. 44 (1): 313. doi:10.2307/2531923. ISSN 0006-341X.
{{cite journal}}
: ตรวจสอบค่าวันที่ใน:|date=
(help)