Batch processing การประมวลผลข้อมูลปริมาณการใช้ไฟฟ้าในรอบเดือน

Stream processing แยกข้อมูลเป็น 2 ส่วน: Train --> สร้างโมเดล, Test --> ทดสอบโมเดล

Digitization จำนวนตัวอย่างข้อมูลที่มีประเภทของคำตอบเป็น positive

First principal component ค่าคำตอบจริงเป็น positive โมเดลทำนายเป็น negative

Dimensionality reduction อธิบายประสิทธิภาพของ classification model

Feature extraction การแปลงอินพุตภาพหรือเสียงให้เป็นค่าตัวเลขดิจิตอล

Train/Test split การเลือก principal component หรือตัวแปรที่สำคัญๆ และตัดตัวอื่นๆทิ้ง

K-fold Cross Validation โมเดลทำนายผลชุดข้อมูลทั้ง training set และ test set ได้ไม่ดีเนื่องจาก โมเดลมี complexity ต่ำเกินไป

Model training การตรวจสอบการโจมตีเครือข่ายคอมพิวเตอร์ทางออนไลน์

Overfitting model ตัวแปรที่เก็บข้อมูลเดิม (variance) อยู่มากที่สุด

Accuracy, Confusion Matrix จำนวนตัวอย่างข้อมูลที่มีประเภทของคำตอบเป็น negative

R-squared, Root Mean Square Error กระบวนการปรับ model parameters จนกระทั่งผลต่างของค่าที่โมเดลทำนายกับค่าคำตอบจริงมีค่าต่ำสุด

False Negative (FN) จำนวนตัวอย่างข้อมูลที่โมเดลทำนายประเภทผิดพลาด

FP + FN แยกข้อมูลออกเป็น K ส่วนเท่าๆกัน โดย K-1 ส่วนใช้สร้างโมเดล อีก 1 ส่วนใช้ทดสอบ และทำวนไปกับข้อมูลทุกส่วนจำนวน K ครั้ง

TP + FN โมเดลทำนายผลชุดข้อมูล training set ได้ดี แต่ทำนายผลชุด test set ได้ไม่ดี

TP + FP จำนวนตัวอย่างข้อมูลที่โมเดลทำนายประเภทเป็น positive

Missing phrase1 - 16 อธิบายประสิทธิภาพของ regression model

Missing phrase1 - 17 การแปลงข้อมูลอินพุตให้เป็นข้อมูลที่ ML algorithm สามารถประมวลผลต่อได้

Use the "Printable HTML" button to get a clean page, in either HTML or PDF, that you can use your browser's print button to print. This page won't have buttons or ads, just your puzzle. The PDF format allows the web site to know how large a printer page is, and the fonts are scaled to fill the page. The PDF takes awhile to generate. Don't panic!