κ°λ°μκ° μμ보λ μ΄μ κ°μ§
μ€λΉ κ²°ν¨κ³Ό μ΄μ κ°μ§
μ λ ₯ μ€λΉμμ λ°μνλ κ²°ν¨μλ μ§λ½(λμ ), κ³ΌλΆν, κ³Όμ΄ λ±μ μ€λ₯μ κ²½κ³ μνλ₯Ό ν¬ν¨νκ³ μμ΅λλ€. μ λ ₯ μ€λΉ λͺ¨λν°λ§ μμ€ν
μμμ μ΄μ κ°μ§λ κ° μ€λΉ λλ°μ΄μ€λ‘λΆν° μμ§λλ ν΄νΈ λ°μ΄ν° μ΄μΈμ μκ³μ΄ λ°μ΄ν°λ₯Ό λΆμνμ¬ μ μμ μΈ λ°μ΄ν° λ²μ£Όμ μνμ§ μλ μ΄μμΉλ₯Ό νλ³νκ³ μ λ ₯ μ€λΉ κ²°ν¨ λλ μμ μ§νλ₯Ό μμΈ‘νλλ° νμ©λ©λλ€. μ΄λ―Έ μ΄μ κ°μ§(Anomaly Detection)
λ₯Ό ν΅ν΄μ μ€λ§νΈ ν©ν 리μμλ μ€λΉ λΆλμ κ²μΆνκ³ κΈμ΅ λΆμΌμμλ μ΄μκ±°λ νμ§(Fraud Detection)νλ λ€μνκ² νμ©λκ³ μμ΅λλ€.
μ΄μμΉ λ°μ΄ν°λ₯Ό κ°μ§νλ λ°©λ²
μ΄μμΉ(Anomaly) λ°μ΄ν°λ₯Ό κ°μ§νλ λ°©λ²μ ν΅κ³νμ κ·Όκ±°μ μν νλ³
λΆν° AI λ¨Έμ λ¬λμ νμ΅ λ° μμΈ‘ λͺ¨λΈ
κΈ°λ°μ λ°©λ²μΌλ‘ λ°μ λμ΄ μ¬μ©λκ³ μλ κ²μΌλ‘ 보μ
λλ€. λ€μμ μμλ€μμλ λΉμ μ λ°μ΄ν°λ₯Ό κ°μ§νλ λ°©λ²μ λν΄μ λ€λ£¨κ³ μλ κ±Έ νμΈν μ μμμ΅λλ€.
- μκ³μ΄ λ°μ΄ν° μμ μ¨μ΄μλ μ΄μ μ§νλ₯Ό μ°Ύλ λ₯ λ¬λ κΈ°μ
- λͺ¬μ€ν° λλ €μ‘λ 맀ν¬λ‘ λλ €μ‘κΈ°
- μΉ΄μΉ΄μ€ν‘ λ©μμ§ μ§ν μ΄μκ°μ§ μμ€ν μ κ°μ μ¬λ‘
β Z-Score based Anomaly Detection
λ¨Όμ , Z-Scoreλ₯Ό ν΅ν μ΄μ κ°μ§λ ν΅κ³νμ μΌλ‘ μ μμ μΈ λ°μ΄ν°κ° 3νμ€νΈμ°¨ λ²μμ μνλ€λ 3μκ·Έλ§ κ·μΉ(3-sigma Rule)μ μν κ²½νμ μΈ μΆμ μ κ·Όκ±°λ‘
μ΄μμΉ λ°μ΄ν°λ₯Ό νλ³νλ λ°©μμ
λλ€. λ λ€λ₯Έ ν΅κ³νμ λ°©μμλ μκΈ°νκ·(Auto Regressive)μ μ΄λ νκ· (Moving Average)μΌλ‘ μΆλ‘ λ μμΈ‘λ κ°μ κΈ°λ°μΌλ‘ μ΄μμΉλ₯Ό νμΈνλ ARIMA μκ³μ΄ μμΈ‘ λͺ¨λΈ κΈ°λ° μ΄μ νμ§κ° μμ΅λλ€.
β Ensemble based Anomaly Detection
μμλΈ κΈ°λ° μ΄μ νμ§λ μ¬λ¬κ°μ§ μμ¬κ²°μ νΈλ¦¬(Decision Tree)
λ₯Ό ν΅ν΄ μ΄μμΉλ₯Ό νλ³νλ λ°©μμΌλ‘ λνμ μΌλ‘ IF(Isolation Forest)κ° μμΌλ©° λ°μ΄ν° λ°λμ μν νΈλ¦¬λ₯Ό ν΅ν΄μ λΉμμ μΈ λ°μ΄ν°λ λ£¨νΈ λ
Έλμ κ·Όμ νλ©΄μ κ²½λ‘ κΈΈμ΄κ° μμ λ°μ΄ν°κ° λ¨μ κ·Όκ±°λ‘νμ¬ μ΄μμΉλ‘ κ²°μ νκ² λ©λλ€.
β Distance based Anomaly Detection
μ μ¬λλ₯Ό μΈ‘μ νλ 거리(Distance) 곡μ
μΌλ‘ μ΄μμΉ λ°μ΄ν°λ₯Ό νλ³νλ λ°©λ²μλ k-NN(K-Nearest Neighbor), LOF(Local outlier factors), λ§ν λΌλ
ΈλΉμ€ 거리 (Mahalanobis Distance) κΈ°λ°μ μ΄μ νμ§κ° μμ΅λλ€. μ ν΄λ¦¬λ 거리 곡μ μ΄μΈμ λ§ν λΌλ
ΈλΉμ€ 거리λ μ²μ λ€μ΄λ³΄λλ° κ³΅λΆμ° νλ ¬μ΄ μΆκ°λ κ²μ΄λΌκ³ ν©λλ€.
β Clustering based Anomaly Detection
ν΄λ¬μ€ν°λ§ κΈ°λ° μ΄μ νμ§λ μ μμ μΈ λ°μ΄ν°μ κ΅°μ§μ λΆμ
νκ³ μ μμ μΈ ν¨ν΄μΌλ‘ νμ
λ κ΅°μ§μμ μ¬μ μ μλ μκ³μΉ(Threshold)λ₯Ό μΌλ§λ λ²μ΄λλκ°λ‘ μ΄μμΉ λ°μ΄ν°λ₯Ό νλ³ν©λλ€. κ΅°μ§ν μκ³ λ¦¬μ¦μ μ¬λ¬κ°μ§κ° μμ§λ§ λνμ μΌλ‘ K-Means, GMM(Gaussian Mixture Model), DBSCANμ΄ νμ©λλ κ² κ°μ΅λλ€.
β Kernal based Anomaly Detection
OCSVM(One-class Support Vector Machine)μ Deep SVDD(Support Vector Data Description)μ μ μμ μΈ λ°μ΄ν°μ λν λ°μ§λ νμ΅μ΄ νμ
ν 컀λ κΈ°λ° μ΄μ νμ§ κΈ°λ²μ
λλ€. OCSVM(1-SVM)μ κ°μ₯ λ§μ΄ μ¬μ©λλ 컀λ κΈ°λ° μ΄μ νμ§λΌκ³ νλ©° Deep SVDDλ DNN(Deep Neural Network)μΌλ‘ νμ₯ν λͺ¨λΈμ΄λΌκ³ ν©λλ€.
β Reconstruction error based Anomaly Detection
AE(AutoEncoder)μ PCA(Principal Component Analysis) κ·Έλ¦¬κ³ GAN(Generative Adversarial Network)μ μμΆλ λ°μ΄ν°λ₯Ό μλ³Έ λ°μ΄ν°λ‘ μ¬κ΅¬μ±ν λ λ°μνλ μ€μ°¨
λ₯Ό ν΅ν΄ μ΄μμΉλ₯Ό νλ³νλ μ΄μ νμ§ κΈ°λ²μ
λλ€.
β Transformer based Anomaly Detection
Anomaly Transformerλ μκ³μ΄ λ°μ΄ν°μ Transformerλ₯Ό μ λͺ©ν λͺ¨λΈλ‘ Self Attentionμ μν μ°κ΄μ± νμ΅
μΌλ‘ λ€λ³λ μκ³μ΄ λ°μ΄ν°μ λν΄ κ°μ λ μ΄μ νμ§κ° κ°λ₯νλ€κ³ νλ μ¬λ¬κ°μ§ IoT λλ°μ΄μ€μ μκ³μ΄ λ°μ΄ν°μ λν μ΄μ νμ§μ μ μ©ν κ²μΌλ‘ 보μ
λλ€.
μ΄μ νμ§λ₯Ό μ§μ ν΄λ³΄μμΌ
μ΄μ νμ§μ λν μ 보λ₯Ό μ΄ν΄λ³΄λ€λ³΄λ λλΆλΆμ κΈμ΄ μ μ΄ν΄λμ§ μλ νκ΅μ΄μ²λΌ 보μ΄κ² λμ΄λ²λ¦¬λ κ² κ°μ΅λλ€. νμ΄μ¬μ λ°°μ보λ μκ°μ κ°μ§λ©΄μ μ¬μ΄ν· λ°(scikit-learn) λΌμ΄λΈλ¬λ¦¬λ‘ μκ³μ΄ λ°μ΄ν°μ λν μ΄μ κ°μ§λ₯Ό μ§μ ν΄λ³΄μμΌ μ΄ν΄κ° λ κ²μΌλ‘ μκ°λ©λλ€.