An extensible framework for the automatic extraction and transformation of
metadata into logical annotations. Metadata imbedded within a media file
is extracted by a type-specific parsing module which is loaded and
executed based on the mimetype of the media file being described. A
content processor extracts information, typically in the form of
time-based samples, from the media content. An auxiliary processing step
is performed to collect additional metadata describing the media file from
sources external to the file. All of the metadata thus collected is
combined into a set of logical annotations, which may be supplemented by
summary data generated from the metadata already collected. The
annotations are then formatted into a standardized form, preferably XML,
which is then mapped into a database schema. The database object also
stores the source XML data as well as the original media file in addition
to the annotation metadata. The system provides unified metadata
repositories, which can then be used for indexing and searching.
Een verlengbaar kader voor de automatische extractie en de transformatie van meta-gegevens in logische annotaties. De meta-gegevens ingebed binnen een media dossier wordt gehaald door een type-specifieke het ontleden module die wordt geladen en gebaseerd op mimetype die van het media dossier uitgevoerd wordt beschreven. Een tevreden bewerker haalt informatie, typisch in de vorm van op tijd-gebaseerde steekproeven, uit de media inhoud. Een hulpverwerkingsstap wordt uitgevoerd om extra meta-gegevens te verzamelen beschrijvend het media dossier uit bronnen extern aan het dossier. De elk van zo verzamelde meta-gegevens wordt gecombineerd in een reeks logische annotaties, die door summiere gegevens kunnen worden aangevuld die van de reeds verzamelde meta-gegevens worden geproduceerd. De annotaties zijn dan geformatteerd in een gestandaardiseerde vorm, bij voorkeur XML, die dan in een gegevensbestandschema in kaart wordt gebracht. Het gegevensbestandvoorwerp slaat ook de bronXml- gegevens evenals het oorspronkelijke media dossier naast de annotatiemeta-gegevens op. Het systeem verstrekt verenigde meta-gegevensbewaarplaatsen, die dan voor het indexeren en het zoeken kunnen worden gebruikt.