Hello World – Linear Regression
สวัสดีครับทุกคน วันนี้เราจะมาเรียนรู้เรื่อง Linear Regression ไปด้วยกันนะครับ หัวข้อที่เราจะพูดถึงในวันนี้ครอบคลุมตั้งแต่การวิเคราะห์ข้อมูลเบื้องต้น ไปจนถึงการสร้างโมเดลทำนายผลด้วย Linear Regression ครับ เราจะมาทำความเข้าใจตั้งแต่พื้นฐานของ Data Analytic, Cloud Computing, การใช้งาน Google Sheet, สมการเส้นตรง, การสร้างโมเดลอย่างง่าย ไปจนถึงการประยุกต์ใช้ Simple Linear Regression ในสถานการณ์จริง เพื่อให้ทุกคนสามารถนำความรู้เหล่านี้ไปประยุกต์ใช้ได้จริงครับ
Data Analytic
Data Analytic คืออะไร
Data Analytic คือ การนำข้อมูลมาวิเคราะห์เพื่อช่วยในการตัดสินใจทางธุรกิจให้มีประสิทธิภาพมากยิ่งขึ้น โดยมีเป้าหมายหลักคือการค้นหา Insight และรูปแบบที่ซ่อนอยู่ในข้อมูล เพื่อนำมาใช้ในการวางแผนและตัดสินใจในด้านต่างๆ
การเปลี่ยนข้อมูลให้ช่วยในการตัดสินใจ
กระบวนการ Data Analytic เริ่มต้นจากการนำข้อมูลดิบ (Raw Data) ที่อาจจะอยู่ในรูปแบบที่ซับซ้อนและไม่มีโครงสร้าง มาจัดระเบียบและวิเคราะห์ เพื่อให้ได้ข้อมูลเชิงลึกที่สามารถนำไปใช้ในการตัดสินใจทางธุรกิจได้
Raw Data และการจัดระเบียบข้อมูล
Raw Data คือ ข้อมูลดิบที่ยังไม่ได้ผ่านการประมวลผลใดๆ อาจมีรูปแบบที่หลากหลายและไม่เป็นระเบียบ การจัดระเบียบข้อมูลเป็นขั้นตอนสำคัญในการเตรียมข้อมูลให้พร้อมสำหรับการวิเคราะห์
Cloud Computing
Cloud คืออะไร
Cloud Computing คือ การให้บริการทรัพยากรคอมพิวเตอร์ผ่านอินเทอร์เน็ต ซึ่งหมายความว่าเราสามารถเข้าถึงและใช้งานบริการต่างๆ ได้โดยไม่ต้องติดตั้งโปรแกรมหรือจัดเก็บข้อมูลไว้ในเครื่องคอมพิวเตอร์ของเราเอง
ตัวอย่าง Cloud Service
ตัวอย่าง Cloud Service ที่เราคุ้นเคยกันดี เช่น อีเมล (Gmail, Hotmail), YouTube, Discord, Twitter และ Facebook บริการเหล่านี้ช่วยให้เราสามารถทำงานและเข้าถึงข้อมูลได้จากทุกที่ที่มีอินเทอร์เน็ต
Software as a Service (SaaS)
Software as a Service (SaaS) เป็นรูปแบบหนึ่งของ Cloud Computing ที่ผู้ให้บริการจะดูแลและจัดการซอฟต์แวร์ให้ทั้งหมด ผู้ใช้งานเพียงแค่เข้าใช้งานผ่านอินเทอร์เน็ต เช่น Google Sheet ที่เราจะใช้ในวันนี้
อนาคตของ Cloud Computing
Cloud Computing มีบทบาทสำคัญในการเปลี่ยนแปลงวิธีการทำงานและการใช้ชีวิตของเราในปัจจุบัน และมีแนวโน้มที่จะเติบโตและพัฒนาต่อไปในอนาคต
Review Basic Spreadsheet
Google Sheet คืออะไร
Google Sheet เป็นโปรแกรม Spreadsheet ที่ให้บริการผ่าน Cloud (SaaS) ช่วยให้เราสามารถสร้าง, แก้ไข, และแชร์ Spreadsheet ได้อย่างง่ายดาย
ฟังก์ชันใน Google Sheet
Google Sheet มีฟังก์ชันมากมายที่ช่วยในการคำนวณและวิเคราะห์ข้อมูล เช่น ฟังก์ชัน SUM, AVERAGE, MIN, MAX และอื่นๆ อีกมากมาย
ฟังก์ชัน Rand
ฟังก์ชัน RAND ใช้สำหรับสร้างตัวเลขสุ่มระหว่าง 0 ถึง 1 ซึ่งเป็นประโยชน์ในการสร้างข้อมูลจำลอง (Simulation) และการทดสอบโมเดล
Array Formula
Array Formula เป็นฟังก์ชันที่ช่วยให้เราสามารถคำนวณข้อมูลหลายๆ แถวหรือคอลัมน์ได้พร้อมกัน โดยใช้สูตรเพียงครั้งเดียว
การสร้าง Array
การสร้าง Array คือ การจัดกลุ่มข้อมูลให้อยู่ในรูปแบบของตารางหรือ Matrix ซึ่งเป็นสิ่งจำเป็นในการใช้ Array Formula
การสร้าง Matrix
Matrix คือ ตารางข้อมูลที่มีแถวและคอลัมน์ การสร้าง Matrix ช่วยให้เราสามารถจัดการและวิเคราะห์ข้อมูลที่มีความซับซ้อนได้ง่ายขึ้น
Linear Equation
สมการเส้นตรงเบื้องต้น
สมการเส้นตรง (Linear Equation) เป็นสมการที่แสดงความสัมพันธ์ระหว่างตัวแปรสองตัวแปรในรูปแบบของเส้นตรง สมการพื้นฐานคือ Y = a + bX โดยที่ Y คือ ตัวแปรตาม, X คือ ตัวแปรอิสระ, a คือ Y-intercept และ b คือ Slope
Y-intercept และ Slope
Y-intercept (จุดตัดแกน Y) คือ ค่าของ Y เมื่อ X = 0 ส่วน Slope (ความชัน) คือ อัตราการเปลี่ยนแปลงของ Y เมื่อ X เปลี่ยนไปหนึ่งหน่วย
การตีความ Slope
Slope บอกถึงทิศทางและความชันของเส้นตรง ถ้า Slope เป็นบวก หมายความว่าเมื่อ X เพิ่มขึ้น Y ก็จะเพิ่มขึ้นด้วย ในทางกลับกัน ถ้า Slope เป็นลบ หมายความว่าเมื่อ X เพิ่มขึ้น Y จะลดลง
Slope เป็นบวกและลบ
Slope ที่เป็นบวกแสดงถึงความสัมพันธ์แบบผกผันระหว่างตัวแปรทั้งสอง ในขณะที่ Slope ที่เป็นลบแสดงถึงความสัมพันธ์แบบตรงกันข้าม
ความสัมพันธ์ของตัวแปร
สมการเส้นตรงช่วยให้เราเข้าใจความสัมพันธ์ระหว่างตัวแปรต่างๆ และสามารถนำไปใช้ในการทำนายค่าของตัวแปรตามได้
Build Basic Model
Data Entry
Data Entry คือ การป้อนข้อมูลลงใน Spreadsheet ซึ่งเป็นขั้นตอนแรกในการสร้างโมเดล
การสร้าง Series
การสร้าง Series คือ การสร้างลำดับข้อมูล เช่น ลำดับตัวเลข หรือ วันที่ ซึ่งช่วยให้เราสามารถสร้างข้อมูลได้อย่างรวดเร็ว
การใช้ฟังก์ชัน Rand
ฟังก์ชัน RAND สามารถนำมาใช้ในการสร้างข้อมูลสุ่ม เพื่อจำลองสถานการณ์ต่างๆ และทดสอบโมเดล
การใช้ Array Formula
Array Formula ช่วยให้เราสามารถคำนวณข้อมูลจำนวนมากได้อย่างรวดเร็วและมีประสิทธิภาพ
การใช้ฟังก์ชัน Year, Month, Day
ฟังก์ชัน YEAR, MONTH, DAY ช่วยในการแยกส่วนประกอบของวันที่ออกมา เพื่อนำไปวิเคราะห์ข้อมูล
การใช้ฟังก์ชัน Date
ฟังก์ชัน DATE ใช้ในการสร้างวันที่จากส่วนประกอบต่างๆ เช่น ปี, เดือน, และวัน
การ Copy Format
การ Copy Format ช่วยให้เราสามารถคัดลอกรูปแบบของข้อมูล เช่น ตัวอักษร, สี, และรูปแบบตัวเลข ไปยังข้อมูลอื่นๆ ได้อย่างง่ายดาย
Data Completeness
Missing Data
Missing Data คือ ข้อมูลที่ขาดหายไป ซึ่งอาจส่งผลกระทบต่อความถูกต้องของโมเดล การจัดการกับ Missing Data เป็นสิ่งสำคัญในการวิเคราะห์ข้อมูล
การใช้ฟังก์ชัน Count Blank
ฟังก์ชัน COUNTBLANK ใช้ในการนับจำนวนช่องว่างในข้อมูล ซึ่งช่วยในการตรวจสอบ Missing Data
การ Field Missing Value
การ Field Missing Value คือ การเติมค่าลงในช่องว่างของข้อมูล เช่น การใช้ค่าเฉลี่ย หรือค่าอื่นๆ ที่เหมาะสม
Basic Statistics
การหา Sample Size
Sample Size คือ จำนวนข้อมูลที่เรานำมาใช้ในการวิเคราะห์ การหา Sample Size ที่เหมาะสมช่วยให้ผลการวิเคราะห์มีความน่าเชื่อถือ
การใช้ฟังก์ชัน Counta
ฟังก์ชัน COUNTA ใช้ในการนับจำนวนเซลล์ที่มีข้อมูล
การหาค่า Sum, Average, Min, Max, Standard Deviation
ฟังก์ชัน SUM, AVERAGE, MIN, MAX, และ STDEV ช่วยในการคำนวณค่าทางสถิติพื้นฐาน เช่น ผลรวม, ค่าเฉลี่ย, ค่าต่ำสุด, ค่าสูงสุด, และส่วนเบี่ยงเบนมาตรฐาน
การใช้ฟังก์ชัน Count If
ฟังก์ชัน COUNTIF ใช้ในการนับจำนวนข้อมูลที่มีเงื่อนไข
การใช้ฟังก์ชัน Average If
ฟังก์ชัน AVERAGEIF ใช้ในการหาค่าเฉลี่ยของข้อมูลที่มีเงื่อนไข
การใช้ฟังก์ชัน Formulate Text
ฟังก์ชัน TEXT ใช้ในการจัดรูปแบบข้อความ เช่น การแปลงตัวเลขเป็นข้อความในรูปแบบต่างๆ
Simple Linear Regression
Linear Equation
Linear Equation คือ สมการเส้นตรงที่แสดงความสัมพันธ์ระหว่างตัวแปรสองตัวแปร
การ Plot กราฟ
การ Plot กราฟช่วยให้เราเห็นภาพความสัมพันธ์ระหว่างตัวแปรต่างๆ ได้อย่างชัดเจน
การใช้ฟังก์ชัน Intercept และ Slope
ฟังก์ชัน INTERCEPT และ SLOPE ใช้ในการคำนวณค่า Y-intercept และ Slope ของสมการเส้นตรง
การหาค่า Intercept และ Slope
การคำนวณค่า Intercept และ Slope เป็นขั้นตอนสำคัญในการสร้างโมเดล Linear Regression
การตีความผลลัพธ์
การตีความผลลัพธ์ของ Linear Regression ช่วยให้เราเข้าใจความสัมพันธ์ระหว่างตัวแปร และสามารถนำไปใช้ในการทำนายผลได้
ความแปรปรวนของข้อมูล
ความแปรปรวนของข้อมูลส่งผลต่อความแม่นยำของโมเดล Linear Regression
Simple Linear Regression
Simple Linear Regression คือ การวิเคราะห์ความสัมพันธ์ระหว่างตัวแปรอิสระหนึ่งตัวแปร และตัวแปรตามหนึ่งตัวแปร
The Best Fitted LINE
The Best Fitted LINE คือ เส้นตรงที่เหมาะสมที่สุดในการแสดงความสัมพันธ์ระหว่างตัวแปร
การวัด Error
การวัด Error เป็นการประเมินความคลาดเคลื่อนของโมเดล
Actual Point
Actual Point คือ ค่าจริงของข้อมูล
Prediction Error
Prediction Error คือ ความแตกต่างระหว่างค่าที่ทำนายได้กับค่าจริง
Sum of Square Error (SSE)
Sum of Square Error (SSE) คือ ผลรวมของค่า Error ที่ยกกำลังสอง ซึ่งใช้ในการวัดความแม่นยำของโมเดล
💬 ปรึกษาการเงินฟรีกับผู้เชี่ยวชาญ คลิกเพื่อแอดไลน์
หรือสแกน QR เพื่อแอด

Leave a Reply