5/10/2010

Jugando con la FOCA 2: Metadatos en los ayuntamientos gallegos

Hace unos días asistí al webcast sobre la nueva versión de la FOCA de la gente de Informática 64, aprovecho para darles las gracias desde aquí por la charla que me sirvió para resolver algunas dudas que me surgieron cuando la probé. No voy a explicar los problemas asociados a los metadatos en los documentos, dejo este enlace donde lo explica Chema Alonso para el caso de los formatos de Microsoft Office. Un resumen rápido: todo documento tiene asociada una información relativa a sí mismo y hay herramientas que permiten extraerlos, pero también las hay para limpiarlos, el OOMetaExtractor es GPL :) y los elimina de los tipos de archivo del OpenOffice.

Al terminar el webcast me puse a hacer unas pruebas y por curiosidad se me ocurrió probar con la dirección de la web de mi ayuntamiento y como podía suponer nadie limpia los metadatos de los documentos publicados. A continuación comprobé que en otros ayuntamientos pasaba lo mismo, así como en la web de A Xunta de Galicia. Para tener una idea general de como están las cosas hice un recuento usando los sitios de 8 de los ayuntamientos más importantes y el de A Xunta. Descargué los ficheros en proyectos por separado y después de arrastrar las carpetas que los contenían a la FOCA obtuve los metadatos (Metadata/Extract all documents metadata) y este es el resultado:



Vemos que en Galicia no nos preocupamos por los metadatos, es una pena que no esté disponible la versión 2.0.3 de la FOCA que incorpora el buscador Exalead y encuentra muchos más documentos del tipo WordPerfect, como nos mostró Chema en el webcast . Esta lista muestra el numero de elementos no repetidos para cada categoría, no tendría sentido usar todos estos datos juntos en un test de intrusión ya que son de dominios sin relación ninguna pero si nos permite observar el volumen de datos sensibles que se puede extraer con un par de clicks de tan solo 8 páginas web. Lo que sí nos puede interesar algo más es el software usado para la crear de los documentos:



No pego la lista completa porque alargaría demasiado la entrada, así que dejo algunos:
PDFCreator Version 0.8.0
GNU Ghostscript 7.06
OpenOffice 2.3
Adobe InDesign CS3 (5.0.3)
Adobe PDF Library 8.0
PScript5.dll Version 5.2.2
Acrobat Distillier 7.0
Microsoft Office 95
OpenOffice 3.0
PFU ScanSnap Manager 4.2.14
Microsoft Office 2000
ADOBEPS4.DRV Version 4.50
AppleWorks 6
QuarkXPress
Microsoft Office 2007
CorelDRAW
Corel PDF Engine 14.0.0.567
Microsoft Office 2008 for Mac
Adobe Illustrator 10.0
Adobe InDesign CS3 (5.0.4)
PSCRIPT.DRV Version 4.0
Acrobat Distillier 3.0
Acrobat PDF Writer 3.0 para Windows
Windows NT 4.0
Adobe LiveCycle Designer 8.0
DynaPDF 2.0
PDF Complete version 3.0.31.1
Macromedia FlashPaper 2.02.2302.0
PDFlib 5.0.3
FreeHand MX: pictwpstops filter 1.0
Adobe Photoshop CS3
pdfFactory Pro www.pdffactory.com
pdfFactory Pro 2.35 (Windows XP Professional Spanish)
Adobe Designer 7.0
pdftk 1.41 - www.pdftk.com

Esto no quiere decir que en los ayuntamientos/Xunta esté todo este software instalado, podría ser que el Photoshop sea de un estudio de diseño que es el que hizo el .pdf y que después se cuelgue directamente en la web. Lo que me llama la atención es la cantidad de software propietario distinto que se usa para crear un documento de ofimática cuando se puede hacer todo esto con el OpenOffice, y mejor no hacer comentarios sobre las versiones "Pro"... Esto puede tener dos lecturas, que en la administración usen copias piratas, lo cual estaría muy muy mal por su parte... ;) o que estén tirando nuestro dinero gastando en software que no es necesario, lo que no sería muy entendible teniendo en cuenta la campaña de apoyo al software libre, distribución de Linux inclusive, de A Xunta.

Para acabar la entrada voy a decirle a la FOCA que analice los metadatos extraídos (Metadata/Analize metadata), pero en este caso solo voy a utilizar los del caso de A Xunta ya que, como dije antes, no tiene sentido analizar conjuntamente los de dominios independientes. Quiero remarcar que solo utilizo las funcionalidades de la foca relacionadas con los metadatos, aunque incorpora otras muchas para ayudarnos a pintar una red durante un test de intrusión, este es el resultado:


Ya tendríamos 77 clientes y 3 servidores posibles con su sistema operativo para comenzar una auditoría solo utilizando la información relativa a los metadatos. Y como vemos, mucho software libre por aquí tampoco hay ... :(


Jesús Pérez