A technique for detecting similarities in large sets of binary code files,
e.g., bytecode files, without requiring access or knowledge of the actual
source code itself. In accordance with the technique, bytecode files are
disassembled and preprocessed using positional encoding to prepare the
disassembled bytecode files for use in conjunction with similarity
detection tools.
Uma técnica para detectar similaridades em jogos grandes do código binário arquiva, por exemplo, limas do bytecode, sem reque o acesso ou o conhecimento do código de fonte real próprio. De acordo com a técnica, as limas do bytecode são desmontadas e encoding posicional usando-se preprocessed para preparar as limas desmontadas do bytecode para o uso conjuntamente com ferramentas da deteção da similaridade.