5
διαφορετικά σενάρια ταξινόμησης (όλες οι επιθέσεις, φυσιολογική/επικίνδυνη κίνηση, 4
κατηγορίες επιθέσεων), το NSL-KDD αναλύεται και στη συνέχεια προετοιμάζεται για να
εισαχθεί στα μοντέλα μηχανικής μάθησης. Τέλος, στην ενότητα 5 τα μοντέλα
βελτιστοποιούνται, αξιολογούνται και τα αποτελέσματα συγκρίνονται με αυτά της σχετικής
έρευνας, ενώ στην ενότητα 6 συζητούνται τα προβλήματα και οι περιορισμοί τόσο αυτού του
πειράματος, όσο και της ανίχνευσης ανωμαλιών συνολικά, όπως και μελλοντική δουλειά πάνω
στο αντικείμενο.
Τα αποτελέσματα της έρευνας που έγινε παρουσιάζονται στην Εικόνα 1, όπου μπορούν άμεσα
να συγκριθούν οι επιδόσεις του κάθε μοντέλου. Παρατηρούμε ότι έχουμε ακρίβεια 70 −
79%, με εξαίρεση τον αλγόριθμο Gaussian Naive Bayes, ο οποίος λειτουργεί με την
προϋπόθεση ότι δεν έχουν καθόλου εξάρτηση η μία μεταβλητή του dataset από την άλλη,
πράγμα που στην περίπτωσή μας δεν ισχύει καθόλου.
Εικόνα 1: συνοπτικό διάγραμμα της επίδοσης όλων των μοντέλων ταξινόμησης, σε όλα τα σενάρια
κατηγοριοποίησης της κίνησης δικτύου, με χρήση του KDDTrain+ για την εκπαίδευση των μοντέλων
και του KDDTest+ για τον έλεγχο/επαλήθευση
Η ακρίβεια αυτή των μοντέλων είναι συγκρίσιμη με την ακρίβεια που πετυχαίνουν μοντέλα
συγγενούς έρευνας που γίνονται τα τελευταία χρόνια (βλ. ενότητα: 5.2. Evaluation and results
compared to relevant research) παρόλο που στις περισσότερες περιπτώσεις εκείνων των
προγραμμάτων χρησιμοποιούνται πολύ πιο σύνθετα, μεγάλα και βαθιά μοντέλα.
Πιο συγκεκριμένα, στην πιο πρόσφατη παρόμοιας δομής έρευνα που αναλύθηκε
([26][27][28][29]), χρησιμοποιούνται μοντέλα που περιέχουν καινοτόμες τεχνικές βαθιάς
μάθησης, μεταξύ άλλων convolutional και contractive autoencoders (μέθοδοι αυτο-
επιβλεπόμενης και μη επιβλεπόμενης μάθησης αντίστοιχα), Deep Convolutional Neural
Networks (CNNs), Recurrent Neural Networks (RNNs), Long-Short Term Memory (LSTM),