L’evoluzione delle minacce informatiche ha evidenziato i limiti dei metodi tradizionali basati su firme per l’analisi del traffico e il rilevamento delle intrusioni, spingendo verso l’adozione di approcci basati su Machine Learning.
In questo contesto si inserisce il nuovo studio AI4Cyber, dedicato all’analisi di due varianti del dataset CICIDS2017, ampiamente riconosciuto come benchmark nella letteratura scientifica. La prima si basa su file CSV derivati da una versione revisionata del dataset originale e la seconda, invece, richiede la generazione dei flussi di rete a partire dai file PCAP grezzi utilizzando NetFlowMeter, il nostro tool sviluppato per superare le criticità di CICFlowMeter.
La ricerca si articola in due fasi: una fase esplorativa, condotta con alberi decisionali, che ha evidenziato feature particolarmente discriminanti, e una seconda fase dedicata al rilevamento semi-supervisionato di anomalie, tramite un autoencoder addestrato su traffico normale.
Dall’analisi sono emerse alcune criticità legate ai falsi positivi, che possono ridurre l’efficacia dei sistemi di rilevamento. Per questo motivo, per mitigare questo rischio proponiamo l’impiego di modelli più evoluti, tecniche di ensemble learning e un’integrazione con meccanismi di filtraggio basati su regole. Ribadiamo inoltre l’importanza di un approccio rigoroso nella validazione dei dataset e degli strumenti di terze parti.
Se desideri approfondire ecco il link al nostro studio completo.
Inoltre, puoi registrarti alla mailing list specifica Cyber Studios by Tinexta Defence, per ricevere aggiornamenti sulle prossime ricerche:


