A method, system and computer program product for scaling, or dimensionally
reducing, multi-dimensional data sets, that scales well for large data
sets. The invention scales multi-dimensional data sets by determining one
or more non-linear functions between a sample of points from the
multi-dimensional data set and a corresponding set of dimensionally
reduced points, and thereafter using the non-linear function to
non-linearly map additional points. The additional points may be members
of the original multi-dimensional data set or may be new, previously
unseen points. In an embodiment, the invention begins with a sample of
points from an n-dimensional data set and a corresponding set of
m-dimensional points. Alternatively, the invention selects a sample of
points from an n-dimensional data set and non-linearly maps the sample of
points to obtain the corresponding set of m-dimensional points.
Продукт метода, системы и компьутерной программы для шкалирования, или габаритно уменьшать, многомерные комплекты данных, те маштабы наилучшим образом для больших комплектов данных. Комплекты данным по маштабов вымысла многомерные путем обусловливать one or more нелинейные функции между образцом пунктов от многомерного комплекта данных и соответствуя комплекта габаритно уменьшенных пунктов, и в дальнейшем использовать нелинейную функцию non-linearly для того чтобы составить карту дополнительные пункты. Дополнительными пунктами могут быть члены первоначально многомерного комплекта данных или могут быть новые, ранее unseen пункты. В воплощении, вымысел начинает с образцом пунктов от комплекта данным по н габаритного и соответствуя комплекта м-gabaritnyx пунктов. Друг, вымысел выбирает образец пунктов от комплекта данным по н габаритного и non-linearly составляет карту образец пунктов для того чтобы получить соответствуя комплект м-gabaritnyx пунктов.