Batch processing | | การประมวลผลข้อมูลปริมาณการใช้ไฟฟ้าในรอบเดือน |
Stream processing | | แยกข้อมูลเป็น 2 ส่วน: Train --> สร้างโมเดล, Test --> ทดสอบโมเดล |
Digitization | | จำนวนตัวอย่างข้อมูลที่มีประเภทของคำตอบเป็น positive |
First principal component | | ค่าคำตอบจริงเป็น positive โมเดลทำนายเป็น negative |
Dimensionality reduction | | อธิบายประสิทธิภาพของ classification model |
Feature extraction | | การแปลงอินพุตภาพหรือเสียงให้เป็นค่าตัวเลขดิจิตอล |
Train/Test split | | การเลือก principal component หรือตัวแปรที่สำคัญๆ และตัดตัวอื่นๆทิ้ง |
K-fold Cross Validation | | โมเดลทำนายผลชุดข้อมูลทั้ง training set และ test set ได้ไม่ดีเนื่องจาก โมเดลมี complexity ต่ำเกินไป |
Model training | | การตรวจสอบการโจมตีเครือข่ายคอมพิวเตอร์ทางออนไลน์ |
Overfitting model | | ตัวแปรที่เก็บข้อมูลเดิม (variance) อยู่มากที่สุด |
Accuracy, Confusion Matrix | | จำนวนตัวอย่างข้อมูลที่มีประเภทของคำตอบเป็น negative |
R-squared, Root Mean Square Error | | กระบวนการปรับ model parameters จนกระทั่งผลต่างของค่าที่โมเดลทำนายกับค่าคำตอบจริงมีค่าต่ำสุด |
False Negative (FN) | | จำนวนตัวอย่างข้อมูลที่โมเดลทำนายประเภทผิดพลาด |
FP + FN | | แยกข้อมูลออกเป็น K ส่วนเท่าๆกัน โดย K-1 ส่วนใช้สร้างโมเดล อีก 1 ส่วนใช้ทดสอบ และทำวนไปกับข้อมูลทุกส่วนจำนวน K ครั้ง |
TP + FN | | โมเดลทำนายผลชุดข้อมูล training set ได้ดี แต่ทำนายผลชุด test set ได้ไม่ดี |
TP + FP | | จำนวนตัวอย่างข้อมูลที่โมเดลทำนายประเภทเป็น positive |
Missing phrase1 - 16 | | อธิบายประสิทธิภาพของ regression model |
Missing phrase1 - 17 | | การแปลงข้อมูลอินพุตให้เป็นข้อมูลที่ ML algorithm สามารถประมวลผลต่อได้ |