Hello World – Linear Regression: เรียนรู้การวิเคราะห์ข้อมูลและสมการเส้นตรง

Hello World – Linear Regression

สวัสดีครับทุกคน วันนี้เราจะมาเรียนรู้เรื่อง Linear Regression ไปด้วยกันนะครับ หัวข้อที่เราจะพูดถึงในวันนี้ครอบคลุมตั้งแต่การวิเคราะห์ข้อมูลเบื้องต้น ไปจนถึงการสร้างโมเดลทำนายผลด้วย Linear Regression ครับ เราจะมาทำความเข้าใจตั้งแต่พื้นฐานของ Data Analytic, Cloud Computing, การใช้งาน Google Sheet, สมการเส้นตรง, การสร้างโมเดลอย่างง่าย ไปจนถึงการประยุกต์ใช้ Simple Linear Regression ในสถานการณ์จริง เพื่อให้ทุกคนสามารถนำความรู้เหล่านี้ไปประยุกต์ใช้ได้จริงครับ

Data Analytic

Data Analytic คืออะไร

Data Analytic คือ การนำข้อมูลมาวิเคราะห์เพื่อช่วยในการตัดสินใจทางธุรกิจให้มีประสิทธิภาพมากยิ่งขึ้น โดยมีเป้าหมายหลักคือการค้นหา Insight และรูปแบบที่ซ่อนอยู่ในข้อมูล เพื่อนำมาใช้ในการวางแผนและตัดสินใจในด้านต่างๆ

การเปลี่ยนข้อมูลให้ช่วยในการตัดสินใจ

กระบวนการ Data Analytic เริ่มต้นจากการนำข้อมูลดิบ (Raw Data) ที่อาจจะอยู่ในรูปแบบที่ซับซ้อนและไม่มีโครงสร้าง มาจัดระเบียบและวิเคราะห์ เพื่อให้ได้ข้อมูลเชิงลึกที่สามารถนำไปใช้ในการตัดสินใจทางธุรกิจได้

Raw Data และการจัดระเบียบข้อมูล

Raw Data คือ ข้อมูลดิบที่ยังไม่ได้ผ่านการประมวลผลใดๆ อาจมีรูปแบบที่หลากหลายและไม่เป็นระเบียบ การจัดระเบียบข้อมูลเป็นขั้นตอนสำคัญในการเตรียมข้อมูลให้พร้อมสำหรับการวิเคราะห์

Cloud Computing

Cloud คืออะไร

Cloud Computing คือ การให้บริการทรัพยากรคอมพิวเตอร์ผ่านอินเทอร์เน็ต ซึ่งหมายความว่าเราสามารถเข้าถึงและใช้งานบริการต่างๆ ได้โดยไม่ต้องติดตั้งโปรแกรมหรือจัดเก็บข้อมูลไว้ในเครื่องคอมพิวเตอร์ของเราเอง

ตัวอย่าง Cloud Service

ตัวอย่าง Cloud Service ที่เราคุ้นเคยกันดี เช่น อีเมล (Gmail, Hotmail), YouTube, Discord, Twitter และ Facebook บริการเหล่านี้ช่วยให้เราสามารถทำงานและเข้าถึงข้อมูลได้จากทุกที่ที่มีอินเทอร์เน็ต

Software as a Service (SaaS)

Software as a Service (SaaS) เป็นรูปแบบหนึ่งของ Cloud Computing ที่ผู้ให้บริการจะดูแลและจัดการซอฟต์แวร์ให้ทั้งหมด ผู้ใช้งานเพียงแค่เข้าใช้งานผ่านอินเทอร์เน็ต เช่น Google Sheet ที่เราจะใช้ในวันนี้

อนาคตของ Cloud Computing

Cloud Computing มีบทบาทสำคัญในการเปลี่ยนแปลงวิธีการทำงานและการใช้ชีวิตของเราในปัจจุบัน และมีแนวโน้มที่จะเติบโตและพัฒนาต่อไปในอนาคต

Review Basic Spreadsheet

Google Sheet คืออะไร

Google Sheet เป็นโปรแกรม Spreadsheet ที่ให้บริการผ่าน Cloud (SaaS) ช่วยให้เราสามารถสร้าง, แก้ไข, และแชร์ Spreadsheet ได้อย่างง่ายดาย

ฟังก์ชันใน Google Sheet

Google Sheet มีฟังก์ชันมากมายที่ช่วยในการคำนวณและวิเคราะห์ข้อมูล เช่น ฟังก์ชัน SUM, AVERAGE, MIN, MAX และอื่นๆ อีกมากมาย

ฟังก์ชัน Rand

ฟังก์ชัน RAND ใช้สำหรับสร้างตัวเลขสุ่มระหว่าง 0 ถึง 1 ซึ่งเป็นประโยชน์ในการสร้างข้อมูลจำลอง (Simulation) และการทดสอบโมเดล

Array Formula

Array Formula เป็นฟังก์ชันที่ช่วยให้เราสามารถคำนวณข้อมูลหลายๆ แถวหรือคอลัมน์ได้พร้อมกัน โดยใช้สูตรเพียงครั้งเดียว

การสร้าง Array

การสร้าง Array คือ การจัดกลุ่มข้อมูลให้อยู่ในรูปแบบของตารางหรือ Matrix ซึ่งเป็นสิ่งจำเป็นในการใช้ Array Formula

การสร้าง Matrix

Matrix คือ ตารางข้อมูลที่มีแถวและคอลัมน์ การสร้าง Matrix ช่วยให้เราสามารถจัดการและวิเคราะห์ข้อมูลที่มีความซับซ้อนได้ง่ายขึ้น

Linear Equation

สมการเส้นตรงเบื้องต้น

สมการเส้นตรง (Linear Equation) เป็นสมการที่แสดงความสัมพันธ์ระหว่างตัวแปรสองตัวแปรในรูปแบบของเส้นตรง สมการพื้นฐานคือ Y = a + bX โดยที่ Y คือ ตัวแปรตาม, X คือ ตัวแปรอิสระ, a คือ Y-intercept และ b คือ Slope

Y-intercept และ Slope

Y-intercept (จุดตัดแกน Y) คือ ค่าของ Y เมื่อ X = 0 ส่วน Slope (ความชัน) คือ อัตราการเปลี่ยนแปลงของ Y เมื่อ X เปลี่ยนไปหนึ่งหน่วย

การตีความ Slope

Slope บอกถึงทิศทางและความชันของเส้นตรง ถ้า Slope เป็นบวก หมายความว่าเมื่อ X เพิ่มขึ้น Y ก็จะเพิ่มขึ้นด้วย ในทางกลับกัน ถ้า Slope เป็นลบ หมายความว่าเมื่อ X เพิ่มขึ้น Y จะลดลง

Slope เป็นบวกและลบ

Slope ที่เป็นบวกแสดงถึงความสัมพันธ์แบบผกผันระหว่างตัวแปรทั้งสอง ในขณะที่ Slope ที่เป็นลบแสดงถึงความสัมพันธ์แบบตรงกันข้าม

ความสัมพันธ์ของตัวแปร

สมการเส้นตรงช่วยให้เราเข้าใจความสัมพันธ์ระหว่างตัวแปรต่างๆ และสามารถนำไปใช้ในการทำนายค่าของตัวแปรตามได้

Build Basic Model

Data Entry

Data Entry คือ การป้อนข้อมูลลงใน Spreadsheet ซึ่งเป็นขั้นตอนแรกในการสร้างโมเดล

การสร้าง Series

การสร้าง Series คือ การสร้างลำดับข้อมูล เช่น ลำดับตัวเลข หรือ วันที่ ซึ่งช่วยให้เราสามารถสร้างข้อมูลได้อย่างรวดเร็ว

การใช้ฟังก์ชัน Rand

ฟังก์ชัน RAND สามารถนำมาใช้ในการสร้างข้อมูลสุ่ม เพื่อจำลองสถานการณ์ต่างๆ และทดสอบโมเดล

การใช้ Array Formula

Array Formula ช่วยให้เราสามารถคำนวณข้อมูลจำนวนมากได้อย่างรวดเร็วและมีประสิทธิภาพ

การใช้ฟังก์ชัน Year, Month, Day

ฟังก์ชัน YEAR, MONTH, DAY ช่วยในการแยกส่วนประกอบของวันที่ออกมา เพื่อนำไปวิเคราะห์ข้อมูล

การใช้ฟังก์ชัน Date

ฟังก์ชัน DATE ใช้ในการสร้างวันที่จากส่วนประกอบต่างๆ เช่น ปี, เดือน, และวัน

การ Copy Format

การ Copy Format ช่วยให้เราสามารถคัดลอกรูปแบบของข้อมูล เช่น ตัวอักษร, สี, และรูปแบบตัวเลข ไปยังข้อมูลอื่นๆ ได้อย่างง่ายดาย

Data Completeness

Missing Data

Missing Data คือ ข้อมูลที่ขาดหายไป ซึ่งอาจส่งผลกระทบต่อความถูกต้องของโมเดล การจัดการกับ Missing Data เป็นสิ่งสำคัญในการวิเคราะห์ข้อมูล

การใช้ฟังก์ชัน Count Blank

ฟังก์ชัน COUNTBLANK ใช้ในการนับจำนวนช่องว่างในข้อมูล ซึ่งช่วยในการตรวจสอบ Missing Data

การ Field Missing Value

การ Field Missing Value คือ การเติมค่าลงในช่องว่างของข้อมูล เช่น การใช้ค่าเฉลี่ย หรือค่าอื่นๆ ที่เหมาะสม

Basic Statistics

การหา Sample Size

Sample Size คือ จำนวนข้อมูลที่เรานำมาใช้ในการวิเคราะห์ การหา Sample Size ที่เหมาะสมช่วยให้ผลการวิเคราะห์มีความน่าเชื่อถือ

การใช้ฟังก์ชัน Counta

ฟังก์ชัน COUNTA ใช้ในการนับจำนวนเซลล์ที่มีข้อมูล

การหาค่า Sum, Average, Min, Max, Standard Deviation

ฟังก์ชัน SUM, AVERAGE, MIN, MAX, และ STDEV ช่วยในการคำนวณค่าทางสถิติพื้นฐาน เช่น ผลรวม, ค่าเฉลี่ย, ค่าต่ำสุด, ค่าสูงสุด, และส่วนเบี่ยงเบนมาตรฐาน

การใช้ฟังก์ชัน Count If

ฟังก์ชัน COUNTIF ใช้ในการนับจำนวนข้อมูลที่มีเงื่อนไข

การใช้ฟังก์ชัน Average If

ฟังก์ชัน AVERAGEIF ใช้ในการหาค่าเฉลี่ยของข้อมูลที่มีเงื่อนไข

การใช้ฟังก์ชัน Formulate Text

ฟังก์ชัน TEXT ใช้ในการจัดรูปแบบข้อความ เช่น การแปลงตัวเลขเป็นข้อความในรูปแบบต่างๆ

Simple Linear Regression

Linear Equation

Linear Equation คือ สมการเส้นตรงที่แสดงความสัมพันธ์ระหว่างตัวแปรสองตัวแปร

การ Plot กราฟ

การ Plot กราฟช่วยให้เราเห็นภาพความสัมพันธ์ระหว่างตัวแปรต่างๆ ได้อย่างชัดเจน

การใช้ฟังก์ชัน Intercept และ Slope

ฟังก์ชัน INTERCEPT และ SLOPE ใช้ในการคำนวณค่า Y-intercept และ Slope ของสมการเส้นตรง

การหาค่า Intercept และ Slope

การคำนวณค่า Intercept และ Slope เป็นขั้นตอนสำคัญในการสร้างโมเดล Linear Regression

การตีความผลลัพธ์

การตีความผลลัพธ์ของ Linear Regression ช่วยให้เราเข้าใจความสัมพันธ์ระหว่างตัวแปร และสามารถนำไปใช้ในการทำนายผลได้

ความแปรปรวนของข้อมูล

ความแปรปรวนของข้อมูลส่งผลต่อความแม่นยำของโมเดล Linear Regression

Simple Linear Regression

Simple Linear Regression คือ การวิเคราะห์ความสัมพันธ์ระหว่างตัวแปรอิสระหนึ่งตัวแปร และตัวแปรตามหนึ่งตัวแปร

The Best Fitted LINE

The Best Fitted LINE คือ เส้นตรงที่เหมาะสมที่สุดในการแสดงความสัมพันธ์ระหว่างตัวแปร

การวัด Error

การวัด Error เป็นการประเมินความคลาดเคลื่อนของโมเดล

Actual Point

Actual Point คือ ค่าจริงของข้อมูล

Prediction Error

Prediction Error คือ ความแตกต่างระหว่างค่าที่ทำนายได้กับค่าจริง

Sum of Square Error (SSE)

Sum of Square Error (SSE) คือ ผลรวมของค่า Error ที่ยกกำลังสอง ซึ่งใช้ในการวัดความแม่นยำของโมเดล


💬 ปรึกษาการเงินฟรีกับผู้เชี่ยวชาญ คลิกเพื่อแอดไลน์


👉 แอดไลน์เพื่อปรึกษาฟรี


หรือสแกน QR เพื่อแอด

QR Code Line