Let op: Deze pagina komt uit ons archief.
Ga voor actuele informatie en nieuws naar onze vernieuwde website.
 
Voorjaars-
conferentie
2009
 

Filesystemen
en Opslag

 
7 mei 2009

Strigi - managing search in your filesystem

By Jos van den Oever.

Abstract

De belangrijkste stap bij het zoeken naar informatie is het herkennen van informatie. Strigi is een unieke desktop zoekmachine die gericht is op het efficiënt extraheren van gedetailleerde informatie uit data.

Het programma is gebouwd op twee elegante bibliotheken die eenvoudig gebruikt kunnen worden. De eerste, libstreams, stelt files en delen van files beschikbaar op een uniforme manier. Zelfstandige files die onderdeel uitmaken van zipbestanden, email attachements of ingebed zijn in PDF of Word documenten zijn via één interface te lezen. Dit maakt het mogelijk voor de tweede bibliotheek, libstreamanalyzer, om veel informatie te extraheren uit verschillende bestandsformaten. Een bestand dat in een zipfile verstopt is die aan een email hangt, wordt eenvoudig gevonden. De streaming architectuur van Strigi zorgt ervoor dat dit met minimale geheugen- en processoroverhead gebeurt.

Het KDE project maakt uitgebreid gebruik van Strigi en de bibliotheken van Strigi. libstreamanalyzer wordt gebruikt om metadata te tonen in applicaties. Nepomuk-KDE, de KDE implementatie van het semantische desktop project Nepomuk, en Akonadi, de PIM oplossing van KDE,gebruiken Strigi om bestanden te indexeren en te zoeken. Door de minimale technologische en eigendomsrechtelijke afhankelijkheden --Strigi is een klein LGPL C++ project-- is er veel potentie om Strigi breder in te zetten, bijvoorbeeld voor het integreren van metadata-indexen in (netwerk) filesystemen.

Biography

Jos van den Oever is gepassioneerd programmeur en chemicus. Hij studeerde moleculaire wetenschappen en deed theoretisch onderzoek naar vouwing van polymeren en eiwitten. Van 2003 tot 2007 werkte hij als bioinformaticus aan het Munich Information Center for Protein Sequences aan het ontwerpen en implementeren van systemen voor de integratie van verschillende soorten genetische informatie. Vanaf 2007 schrijft hij analytische software voor röntgendiffractie bij PANalytical. Strigi is zijn belangrijkste bijdrage aan de vrije software wereld.

Voorjaar 2009

2023-05-27
 
Vereniging NLUUG
info@nluug.nl
           postbus 8189
6710 AD Ede