The pre-defined dictionary contains over 13000 common words, phrases and other substrings derived from a large corpus of text and HTML documents. Этот словарь содержит около 13 тысяч строк, фраз и других последовательностей, часто встречавшихся в большом корпусе текстовых и HTML-документов.
If the original string had several substrings that occurred often, then the transformed string will have several places where a single character is repeated multiple times in a row. Если в исходной строке есть подстроки, которые встречаются часто, тогда трансформированная строка будет иметь некоторые места, где одиночный символ повторяется несколько раз подряд.