Ciència de dades per a la ciberseguretat

Autor: Julià Minguillón

Els textos i imatges publicats en aquesta obra estan subjectes (llevat que s'indiqui el contrari) a una llicència de Reconeixement-Compartir igual (BY-SA) v.3.0 Espanya de Creative Commons. Podeu modificar l'obra, reproduirla, distribuir-la o comunicar-la públicament sempre que en citeu l'autor i la font (FUOC. Fundació per a la Universitat Oberta de Catalunya), i sempre que l'obra derivada quedi subjecta a la mateixa llicència que el material original. La llicència completa es pot consultar a http://creativecommons.org/licenses/by-sa/3.0/es/legalcode.ca

1. Cicle de vida

2. Tipologia

3. Àmbit d'aplicació

Descripció

Aquest article, escrit per Sarker, I.H., Kayes, A.S.M., Badsha, S. et al., i publicat en obert a la revista Journal of Big Data, descriu la intersecció de dos mons, la ciberseguretat i la ciència de dades, aplicant les tècniques d’aquesta darrera per millorar la primera. Els autors descriuen com es poden fer servir els diferents algorismes d’aprenentatge automàtic per millorar els resultats actuals en els problemes típics de la ciberseguretat, com ara la detecció d’intrusions en xarxes o l’ús fraudulent de targetes de crèdit i altres operacions bancàries, entre d’altres.

Els autors descriuen diversos conjunts de dades que s’han fet servir prèviament en l’àmbit, i la seva aplicació en problemes reals amb la ciberseguretat. També descriuen els conceptes clau d’aquest nou àmbit emergent de la intersecció, com ara l’anomenat data breach, malauradament molt freqüent atesa la baixa seguretat de molts sistemes i aplicacions, o ciberanomalies, que poden ser monitoritzades per detectar possibles intrusions. Després, els autors descriuen treballs que es consideren rellevants en l’àmbit, en funció de la naturalesa dels algorismes emprats, ja sigui aprenentatge supervisat o no supervisat, més recentment deep learning o altres tècniques no tan conegudes.

La principal aportació dels autors és un model per a la captura, anàlisi i explotació de dades relacionades amb la seguretat seguint el cicle de vida tradicional de les dades. Però amb les particularitats específiques de l’àmbit de la ciberseguretat, fent un repàs extensiu dels diferents treballs anteriors, identificant els problemes que hi ha i proposant línies de recerca que, segons els autors, es desenvoluparan properament a mesura que hi hagi una intersecció més gran entre els dos àmbits: la ciberseguretat i la ciència de dades.

Enllaç al recurs

https://journalofbigdata.springeropen.com/articles/10.1186/s40537-020-00318-5

Exemple d’ús

Un dels atacs més típics que pateix tota institució en línia és un atac de denegació de servei (DoS, de l’anglès Denial-of-service, o també DDoS, en què la primera D és de Distributed, per atacs massius). Normalment, un servei web va rebent i atenent peticions amb un ritme normalment conegut, amb pics i valls en funció de l’hora i el dia de la setmana, per exemple. Un atac de denegació de servei es basa a saturar el servidor web que atén aquestes peticions llençant milers o fins i tot milions de peticions, que no poden ser ateses i fan que el servidor col·lapsi, i així no pot donar el servei previst; d’aquí, el nom de l’atac. Les tipologies d’atacs DoS o DDoS són moltes, en funció dels mecanismes que facin servir els atacants.

Per adreçar el problema, uns investigadors han creat una nova taxonomia d’atacs DoS/DDoS i han preparat un conjunt de dades que pot ser utilitzat per entrenar sistemes capaços de detectar atacs d’aquest estil a partir de les dades recollides amb eines que monitoritzen el tràfic a la xarxa. Aquestes separen peticions normals de les que segurament formen part d’un atac i que han de ser descartades, i així es redueix la capacitat de l’atac. Els resultats mostren que els arbres de decisió són una bona eina per entendre la naturalesa dels ciberatacs i per detectar-los, tot i que aquest treball és només un punt de partida per establir una metodologia per fer anàlisis d’aquesta mena.

A l’assignatura Privadesa i seguretat de les dades, del grau de Ciència de Dades Aplicada, de la UOC, es tracten alguns dels temes descrits a l’article.

Enllaços relacionats

Atac de denegació de servei: https://ca.wikipedia.org/wiki/Atac_de_denegació_de_servei

Datasets relacionats amb ciberseguretat: ​​https://www.unb.ca/cic/datasets/index.html