A system and method for developing a pharmacovigilance database from source
data and reference data. The unedited source data contains verbatim terms.
The method includes parsing source data into a relational safety database;
performing cleanup on the relational safety database; and mapping verbatim
terms from the cleaned safety database to at least one token from at least
one reference source. Cleanup includes removing redundant entries,
correcting misspellings, removing irrelevant non-alpha characters and
noise words, and relocating dislocated terms. Mapping verbatim terms to
tokens includes nominating tokens from the source data, choosing tokens
from the reference sources, and linking chosen tokens to corresponding
verbatim terms. In one embodiment, the history of clean-up and mapping is
saved as the pedigree of the verbatim-to-token mapping.
Система и метод для начинать базу данных pharmacovigilance от данных по источника и справочные данные. Unedited данные по источника содержат дословные термины. Метод вклюает данные по источника parsing в реляционную базу данных безопасности; выполнять ыборку на реляционной базе данных безопасности; и составляющ карту дословные термины от очищенной базы данных безопасности до по крайней мере один token от по крайней мере одного источника справки. Ыборка вклюает извлекать резервные входы, исправлять misspellings, извлекать нерелевантные характеры нон-al6fay и слова шума, и передислоцировать вывихнутые термины. Составлять карту дословные термины к tokens вклюает nominating tokens от данных по источника, выбирающ tokens от источников справки, и соединять выбранный tokens к соответствуя дословным терминам. В одном воплощении, история clean-up и составлять карту сохранена как pedigree составлять карту вербатим-к-verbatim-to-token.