Page 5

διαφορετικά  σενάρια  ταξινόμησης  (όλες  οι  επιθέσεις,  φυσιολογική/επικίνδυνη  κίνηση,  4
κατηγορίες  επιθέσεων),  το  NSL-KDD  αναλύεται  και  στη  συνέχεια  προετοιμάζεται  για  να
εισαχθεί  στα  μοντέλα  μηχανικής  μάθησης.  Τέλος,  στην  ενότητα  5  τα  μοντέλα
βελτιστοποιούνται, αξιολογούνται και τα αποτελέσματα συγκρίνονται με αυτά της σχετικής
έρευνας, ενώ στην ενότητα 6 συζητούνται τα προβλήματα και οι περιορισμοί τόσο αυτού του
πειράματος, όσο και της ανίχνευσης ανωμαλιών συνολικά, όπως και μελλοντική δουλειά πάνω
στο αντικείμενο.

Τα αποτελέσματα της έρευνας που έγινε παρουσιάζονται στην Εικόνα 1, όπου μπορούν άμεσα
να  συγκριθούν  οι  επιδόσεις  του  κάθε  μοντέλου.  Παρατηρούμε  ότι  έχουμε  ακρίβεια  70 −
79%,  με  εξαίρεση  τον  αλγόριθμο  Gaussian  Naive  Bayes,  ο  οποίος  λειτουργεί  με  την
προϋπόθεση ότι δεν έχουν καθόλου εξάρτηση η  μία μεταβλητή του  dataset από την άλλη,
πράγμα που στην περίπτωσή μας δεν ισχύει καθόλου.

Εικόνα 1: συνοπτικό διάγραμμα της επίδοσης όλων των μοντέλων ταξινόμησης, σε όλα τα σενάρια

κατηγοριοποίησης της κίνησης δικτύου, με χρήση του KDDTrain+ για την εκπαίδευση των μοντέλων

και του KDDTest+ για τον έλεγχο/επαλήθευση

Η ακρίβεια αυτή των μοντέλων είναι συγκρίσιμη με την ακρίβεια που πετυχαίνουν μοντέλα
συγγενούς έρευνας που γίνονται τα τελευταία χρόνια (βλ. ενότητα: 5.2. Evaluation and results
compared to relevant research) παρόλο που στις περισσότερες περιπτώσεις εκείνων των
προγραμμάτων χρησιμοποιούνται πολύ πιο σύνθετα, μεγάλα και βαθιά μοντέλα.

Πιο  συγκεκριμένα,  στην  πιο  πρόσφατη  παρόμοιας  δομής  έρευνα  που  αναλύθηκε
([26][27][28][29]),  χρησιμοποιούνται  μοντέλα  που  περιέχουν  καινοτόμες  τεχνικές  βαθιάς
μάθησης,  μεταξύ  άλλων  convolutional  και  contractive  autoencoders  (μέθοδοι  αυτο-
επιβλεπόμενης  και  μη  επιβλεπόμενης  μάθησης  αντίστοιχα),  Deep  Convolutional  Neural
Networks  (CNNs),    Recurrent  Neural  Networks  (RNNs),  Long-Short  Term  Memory  (LSTM),