A method of identifying units of translation in a block of source content,
so as to segment the block of content into the units of translation,
includes selecting one or more delineating characteristics of the source
content in addition to lexical characteristics. The method further
includes determining instances of the delineating characteristics in the
block of source content, and identifying pairs of the instances within the
text. The method also includes, for each pair of instances of the
delineating characteristics, associating a first instance of the pair with
a first boundary of a unit of translation, and associating a second
instance of the pair with a second boundary of the unit of translation.
One embodiment further includes identifying target units of translation in
a block of target content, and assigning associations among the source
units of translation and the target units of translation.
Um método de identificar unidades da tradução em um bloco do índice da fonte, para segmentar o bloco do índice nas unidades da tradução, inclui selecionar aquele ou mais que delineiam características do índice da fonte além às características lexicais. O método mais adicional inclui determinar exemplos das características delineando no bloco do índice da fonte, e identificar pares dos exemplos dentro do texto. O método inclui também, para cada par dos exemplos das características delineando, associando um primeiro exemplo do par com um primeiro limite de uma unidade da tradução, e associando um segundo exemplo do par com um segundo limite da unidade da tradução. Uma incorporação mais adicional inclui identificar unidades do alvo da tradução em um bloco do índice do alvo, e a atribuição de associações entre as unidades da fonte da tradução e as unidades do alvo da tradução.