libextractor | Extraer metadata de cualquier tipo de archivo [Linux]

libextractor GNU es una biblioteca utilizada para extraer los metadatos de cualquier tipo de archivo. Está diseñado para realizar una extracción real, y para ser trivialmente prorrogables por enlaces con extractores externos para tipos de archivo adicionales.

Actualmente, libextractor soporta los siguientes formatos: HTML, PDF, PS, OLE2 (DOC, XLS, PPT), OpenOffice
(sxw), StarOffice (sdw), DVI, MAN, FLAC, MP3 (ID3v1 and ID3v2), NSF(E) (NES music), SID (C64 music), OGG, WAV, EXIV2, JPEG, GIF, PNG, TIFF, DEB, RPM, TAR(.GZ), ZIP
, ELF, S3M (Scream Tracker 3), XM (eXtended Module), IT (Impulse Tracker), FLV, REAL, RIFF (AVI), MPEG, QT and ASF. Tambien algunos MIME pueden ser detectados.

Instalación:

wget http://ftpmirror.gnu.org/libextractor/libextractor-0.6.0.tar.gz
tar xvfz libextractor-0.4.1.tar.gz
cd libextractor-0.4.1
./configure --prefix=/usr/local
make
make install

Después de instalar libextractor, la herramienta de extracion se puede utilizar para obtener metadatos de los documentos.

Source + Screenshot (terminal)

2 thoughts on “libextractor | Extraer metadata de cualquier tipo de archivo [Linux]

  1. noise 15/04/2010 / 11:29

    tar xvfz libextractor-0.6.0.tar.gz
    cd libextractor-0.6.0

    Like

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s