libextractor | Extraer metadata de cualquier tipo de archivo [Linux]

libextractor GNU es una biblioteca utilizada para extraer los metadatos de cualquier tipo de archivo. Está diseñado para realizar una extracción real, y para ser trivialmente prorrogables por enlaces con extractores externos para tipos de archivo adicionales.

Actualmente, libextractor soporta los siguientes formatos: HTML, PDF, PS, OLE2 (DOC, XLS, PPT), OpenOffice
(sxw), StarOffice (sdw), DVI, MAN, FLAC, MP3 (ID3v1 and ID3v2), NSF(E) (NES music), SID (C64 music), OGG, WAV, EXIV2, JPEG, GIF, PNG, TIFF, DEB, RPM, TAR(.GZ), ZIP
, ELF, S3M (Scream Tracker 3), XM (eXtended Module), IT (Impulse Tracker), FLV, REAL, RIFF (AVI), MPEG, QT and ASF. Tambien algunos MIME pueden ser detectados.

Instalación:

wget http://ftpmirror.gnu.org/libextractor/libextractor-0.6.0.tar.gz
tar xvfz libextractor-0.4.1.tar.gz
cd libextractor-0.4.1
./configure --prefix=/usr/local
make
make install

Después de instalar libextractor, la herramienta de extracion se puede utilizar para obtener metadatos de los documentos.

Source + Screenshot (terminal)

2 thoughts on “libextractor | Extraer metadata de cualquier tipo de archivo [Linux]

  1. noise 15/04/2010 / 11:29

    tar xvfz libextractor-0.6.0.tar.gz
    cd libextractor-0.6.0

    Like

Leave a comment