A network based platform uses face recognition, speech recognition,
background change detection and key scene events to index multimedia
communications. Before the multimedia communication begins, active
participants register their speech and face models with a server. The
process consists of creating a speech sample, capturing a sample image of
the participant and storing the data in a database. The server provides an
indexing function for the multimedia communication. During the multimedia
communication, metadata including time stamping is retained along with the
multimedia content. The time stamping information is used for
synchronizing the multimedia elements. The multimedia communication is
then processed through the server to identify the multimedia communication
participants based on speaker and face recognition models. This allows the
server to create an index table that becomes an index of the multimedia
communication. In addition, through scene change detection and background
recognition, certain backgrounds and key scene information can be used for
indexing. Therefore, through this indexing apparatus and method, a
specific participant can be recognized as speaking and the content that
the participant discussed can also be used for indexing.
Сеть основала опознавание стороны польз платформы, опознавание речи, обнаружение изменения предпосылки и случаи места ключа к связям multimedia индекса. Прежде чем связь multimedia начинает, активныйа участник регистрируют их речь и модели стороны с сервером. Процесс состоит создавать образец речи, захватывать изображение образца участника и хранить данные в базе данных. Сервер обеспечивает функцию индицирования для связи multimedia. Во время связи multimedia, metadata включая штемпелевать времени сохранено вместе с содержанием multimedia. Время штемпелюя информацию использовано для синхронизировать элементы multimedia. Связь multimedia после этого обработана через сервера для того чтобы определить участников связи multimedia основанные на моделях опознавания диктора и стороны. Это позволяет серверу создать таблицу индекса будет индексом связи multimedia. In addition, через обнаружение изменения места и опознавание предпосылки, некоторые предпосылки и ключевые данные по места можно использовать для индицирования. Поэтому, через эти прибор индицирования и метод, специфически участник можно как говорить и содержание что обсуженный участника можно также использовать для индицирования.