Последний рывок

Последний рывок

Возвращаемся к намеренной практике. Я хочу провести еще один эксперимент. Человеческие языки, в том числе английский, подчиняются степенной зависимости, получившей название закона Ципфа: чаще всего используется небольшое количество слов. Анализ «Брауновского корпуса» («The Brown Corpus» (1964)) — сборника 500 документов на современном английском языке объемом в 1 миллион слов, показывает, что 50 % использования приходится всего на 135 слов [21]. Артикль «the» занимает долю в 7,5 %, а предлог «of» — 3,5 %.

Эту идею можно развить: во всех словах есть сочетания из двух или трех букв, которые встречаются постоянно, например TH, AN, ING и NCE. Такая группа называется n-грамма (иногда n-граф); в данном случае n — это переменная, обозначающая количество символов в группе.

Мне удалось найти список самых распространенных n-грамм в книге под названием «Криптологическая математика» («Cryptological Mathematics») Роберта Эдварда Леванда (2000). N-граммы широко применяются в криптографии. Если в зашифрованном сообщении удастся обнаружить некие закономерности, они могут стать ключом к содержанию. Сравнивая n-граммы шифрограммы с наиболее распространенными n-граммами языка, на котором она написана, криптографы получают возможность разгадать самые сложные шифры.

Попробуем соединить теорию с практикой. Вот составленный Левандом список наиболее часто распространенных англоязычных 2-грамм (диграмм) в порядке убывания частоты использования:

th, he, in, en, nt, re, er, an, ti, es, on, at, se, nd, or, ar, al, te, co, de, to, ra, et, ed, it, sa, em, ro

А это самые распространенные 3-граммы (триграммы), тоже в порядке убывания частоты использования:

the, and, tha, ent, ing, ion, tio, for, nde, has, nce, edt, tis, oft, sth, men

Эти списки очень полезны. Чем лучше я буду справляться с этими сочетаниями букв, тем выше будет общая скорость печати.

Наш мозг прекрасно приспособлен для решения такого рода задач. В науке о мышлении для описания процесса приобретения навыков, следующих в определенном порядке, используется такой термин, как процедурная память. Печатая самые распространенные n-граммы, я буду напрямую тренировать процедурную память, участвующую в процессе набора текста.

Для этого я загрузил бесплатную программу под названием Amphetype [22], предназначенную именно для такой практики. Программа позволяет самому задавать обучающие последовательности, а также критерии успеха, такие как скорость печати или процент ошибок.

Начиная сеанс работы в Amphetype, вы можете указать программе, каким образом генерировать обучающую последовательность. Я настроил программу так, что каждая n-грамма повторялась три раза, в каждой последовательности присутствовали три n-граммы, а каждая последовательность повторялась три раза.

В результате первая обучающая последовательность выглядела следующим образом:

th he in th he in th he in en nt re en nt re en nt re er an ti er an ti er an ti

Моя цель — напечатать всю последовательность со скоростью не меньше 250 ударов в минуту и точностью не ниже 95 %. Если результат не будет удовлетворять этим критериям, всю последовательность придется повторить.

Такого рода упражнения не назовешь очень увлекательными, но они чрезвычайно эффективны. Я повторял каждую последовательность снова и снова, пока не добивался желаемого результата, а затем переходил к следующей.

Каждый день, приступая к занятиям, я начинал с самого начала. Прогресс был заметен невооруженным глазом: если вчера какую-то последовательность приходилось повторять пять раз, то сегодня всего один или два раза. Прошло совсем немного времени, и я уже без проблем справлялся со всем набором обучающих последовательностей.

Освоив диграммы, я перешел к триграммам. Затем я нашел список самых распространенных английских слов, составленный доктором Питером Норвигом.

Питер Норвиг в настоящее время занимает должность директора по исследованиям корпорации Google. Несколько лет назад он опубликовал список самых распространенных английских слов, полученный в результате анализа «корпуса миллиарда слов», содержащего все уникальные слова, когда-либо проиндексированные поисковой машиной Google [23].

Понравилась статья? Поделиться с друзьями:
Все о современной фотографии и фототехнике
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: