Последний рывок
Возвращаемся к намеренной практике. Я хочу провести еще один эксперимент. Человеческие языки, в том числе английский, подчиняются степенной зависимости, получившей название закона Ципфа: чаще всего используется небольшое количество слов. Анализ «Брауновского корпуса» («The Brown Corpus» (1964)) — сборника 500 документов на современном английском языке объемом в 1 миллион слов, показывает, что 50 % использования приходится всего на 135 слов [21]. Артикль «the» занимает долю в 7,5 %, а предлог «of» — 3,5 %.
Эту идею можно развить: во всех словах есть сочетания из двух или трех букв, которые встречаются постоянно, например TH, AN, ING и NCE. Такая группа называется n-грамма (иногда n-граф); в данном случае n — это переменная, обозначающая количество символов в группе.
Мне удалось найти список самых распространенных n-грамм в книге под названием «Криптологическая математика» («Cryptological Mathematics») Роберта Эдварда Леванда (2000). N-граммы широко применяются в криптографии. Если в зашифрованном сообщении удастся обнаружить некие закономерности, они могут стать ключом к содержанию. Сравнивая n-граммы шифрограммы с наиболее распространенными n-граммами языка, на котором она написана, криптографы получают возможность разгадать самые сложные шифры.
Попробуем соединить теорию с практикой. Вот составленный Левандом список наиболее часто распространенных англоязычных 2-грамм (диграмм) в порядке убывания частоты использования:
…
th, he, in, en, nt, re, er, an, ti, es, on, at, se, nd, or, ar, al, te, co, de, to, ra, et, ed, it, sa, em, ro
А это самые распространенные 3-граммы (триграммы), тоже в порядке убывания частоты использования:
…
the, and, tha, ent, ing, ion, tio, for, nde, has, nce, edt, tis, oft, sth, men
Эти списки очень полезны. Чем лучше я буду справляться с этими сочетаниями букв, тем выше будет общая скорость печати.
Наш мозг прекрасно приспособлен для решения такого рода задач. В науке о мышлении для описания процесса приобретения навыков, следующих в определенном порядке, используется такой термин, как процедурная память. Печатая самые распространенные n-граммы, я буду напрямую тренировать процедурную память, участвующую в процессе набора текста.
Для этого я загрузил бесплатную программу под названием Amphetype [22], предназначенную именно для такой практики. Программа позволяет самому задавать обучающие последовательности, а также критерии успеха, такие как скорость печати или процент ошибок.
Начиная сеанс работы в Amphetype, вы можете указать программе, каким образом генерировать обучающую последовательность. Я настроил программу так, что каждая n-грамма повторялась три раза, в каждой последовательности присутствовали три n-граммы, а каждая последовательность повторялась три раза.
В результате первая обучающая последовательность выглядела следующим образом:
…
th he in th he in th he in en nt re en nt re en nt re er an ti er an ti er an ti
Моя цель — напечатать всю последовательность со скоростью не меньше 250 ударов в минуту и точностью не ниже 95 %. Если результат не будет удовлетворять этим критериям, всю последовательность придется повторить.
Такого рода упражнения не назовешь очень увлекательными, но они чрезвычайно эффективны. Я повторял каждую последовательность снова и снова, пока не добивался желаемого результата, а затем переходил к следующей.
Каждый день, приступая к занятиям, я начинал с самого начала. Прогресс был заметен невооруженным глазом: если вчера какую-то последовательность приходилось повторять пять раз, то сегодня всего один или два раза. Прошло совсем немного времени, и я уже без проблем справлялся со всем набором обучающих последовательностей.
Освоив диграммы, я перешел к триграммам. Затем я нашел список самых распространенных английских слов, составленный доктором Питером Норвигом.
Питер Норвиг в настоящее время занимает должность директора по исследованиям корпорации Google. Несколько лет назад он опубликовал список самых распространенных английских слов, полученный в результате анализа «корпуса миллиарда слов», содержащего все уникальные слова, когда-либо проиндексированные поисковой машиной Google [23].