Иосиф Ольшаницкий



 

22

22.03.06.

ОТГАДАТЬ БУКВУ

 

Текст печатаем шифром «напёрстки». При этом способе печати большой палец обязательно участвует в подаче команд: на просвет, на знаки препинания и на некоторые прочие указания компьютеру,

а остальные 4 пальца печатают знаки, заменяющие одну из соответствующей группы букв алфавита.

 

·        Мезинец печатает апостроф, что означает одну из 5-ти букв алфавита: Ъ, Ь, Й, Ы, И.

·        Безымянный палец печатает точку, что означает одну из 4-х гласных букв: У, О, А, Э.

·        Средний палец печатает, например, звёздочку, что означает одну из всех 10 глухих согласных: К, П, Т, Х, Ц, Ч, Ш, Щ, Ф, С.

·        Указательный палец печатает, напр., запятую, что означает одну из всех 10 звонких согласных: Б, В, Г, Д, Ж, З, Л, М, Н, Р.

 

При необходимости сразу печатается конкретноя буква, для чего необходимо придержать на ударяемом, металическом предмете   палец в наперстке соответствующего знака до момента касания этого предмета ещё одним или двумя напёрстками с целью конкретизации буквы.  

Понятно, что 4 буквы: Ю, Ё, Я, Ю указываются апострофом с последующей точкой.

 

Точки и запятые знаков препинания автоматически подчёркиваются для их отличия от таких же точек и запятых в их значении букв.

 

Этот способ печатания в таком шифре значительно проще, легче и быстрее, чем, как это приходится при обычном печатании, искать на доске клавиатуры каждую кнопку сответствующим пальцем обеих рук. Однако, чтобы распечатать текст, набранный таким способом, его требуется расшифровать. В эру персональных компьютеров это не представляет собой техничесой проблемы.

Попробуем представить себе хотя бы некоторые из неисчислимого множества приёмов такого дешифрования. То, что может потребовать даже очень долгих и мало понятных объяснений, компьютер проделает мгновенно.

 

     Из 33-х букв алфавита проще всего распознать в тексте сначала 9 букв: Ъ, Ь, Й, Ы, И, Ю, Ё, Я, Е,  шифрованных с применением апострофы, потом ещё 4 буквы: У, О, А, Э,  шифрованные точкой. По ходу распознавания этих 13 букв алфавита всё проще будут распознаваться согласные, - остальные 20 из 33-х букв алфавита.

 

Из 5-ти значений апострофа

проще всего с буквой Й. Она всегда стоит после гласной и сразу проступит в явном виде из всех слов шифрованного текста.

 

Апостроф в начале слова

может означать только букву И, если за апострофом не стоит в слове точка, обозначающая одну из 4-х гласных: У, О, А, Э. Последовательность этих двух знаков, как правило, означает одну из четырёх букв: Ю, Я, Ё, Е. Наиболее вероятно в начале слова значение Е, наименее вероятно значение Ю. Значение Ё выделится из общего значения Е лищь в последнюю очередь. Это и не очень важно, поскольку мы привыкли отгадывать одно из прочтений буквы Е. Очень редко встречаются слова, где перед буквой У или О стоит буква И или Й. Такой случай, в конце концов, будет распознан по множеству более тонких примет в тексте.

 

Пара апострофов

сразу выдаёт буквенное значение каждого из них. В конце слова могут быть лишь 4 варианта: ЬИ, ИИ, ИЙ, ЫЙ. По окончанием соседних слов компьютер отметёт невозможные словосочетания и определит грамматическую форму слова с упомянутым окончанием. Прояснится, – имеется ли в виду число множественное или единственное, падеж именительный или косвенный, какой именно, род мужской, женский или средний, какой частью речи и каким членом предложения это слово является. Сверять знаки шифровки донного слова со знаками шифровки других шифрованных слов по орфографическому словарю компьтер будет, отметая слова с иным числом букв, относящиеся к иным частям речи и назодящиеся в иных грамматических формах. Выбор сужается очень быстро. Из статысяч слов Орфографического словаря вряд ли более 20 тысяч слов насчитывает только одна часть речи, - существительные. В других частях  речи слов поменьше. Из этих 20 тысяч вряд ли наберётся пара тысяч слов с одинаковым числом букв. Из этой пары тысяч слов подавляющая часть будет относится к своим группам однокоренных слов, а различных корней  насчитается едва ли десятая часть от слов с одинаковым числом букв, если эти слова имеют кроме корня ещё хотя бы приставку, окончание, суффикс, а то и по две части таких слов. Сотня остающихся слов, подлежащая сверке с разгадываемым словом текста разделится на четыре часи части при сверке уже по любому одному знаку шифра в этом слове на любом месте этого слова. Каждый другой знак в любом месте шифрованного слова разделит число слов подлежащих сверке ещё в четыре раза.   Сопоставляя ещё не по знакам шифровки, а только отметая слова в иной грамматической форме, компьютер оставит для сверки по буквам очень малое число даже из самой большой группы слов с одинаковым числом букв. Даже слепой перебор слов по орфаграфическому словарю при сверке по совпадающим знакам шифровки с разгадываемым словом текста для компьютера не является большой операцией. И это число сопоставлений сокращается очень резко за счет отметания неподходящих слов по множеству самых заметных признаков. Такими особыми примерами становятся комбинации букв, сразу привлекающих внимание не только компьютера, но и просто внимание человека. Такая заметная примета, как  два апострофа подряд, две точки подряд или три знака обозначения согласных, расположенные подряд, замеченные в каком-то слове такой-то длины и на таком-то месте по отношению к буквам гласным этого слова, сразу привлекают к себе повышенное внимание.

Не сопоставляя по всему алфавиту каждую букву слова, достаточно сверить по особой примете данное слово с весьма коротким списком слов, имеющих броскую примету: два-три подряд одинаковых знака нашего шифра.

Неподчёркнутых три точки подряд невозможны. Нет таких слов. Но и две подряд – это тоже странный случай. Редко когда в русском слове вплотную соседствуют две простые гласные (У, О, А, Э). Буква Э бывает лишь в производных от сл. ЭТА (пОЭтому) и в (междометиях, сразу же заметных по знакам препинания около них). Соседство таких гласных встречается в немногих словах (проучить, наушник).  Соседство букв: У, О или А вероятнее всего указывает на стык корня с приставкой (хотя бы бывшей, как в сл. НАУКА). Вряд ли первая из этой пары гласной окажется буква У. Число букв в приставке  и во всём слове укажет на неширокий выбор из возможных вариантов: НА, ПРО, ПО, ДО. Список слов с такой особенностью очень ограничен.

Два опострофа подряд подсказывают соседние буквы. Если в конце шифрованного слова стоит точка, а передней ней два апострофа подряд, то выбор вариантов невелик. Последней буквой слова являетется Е, Я или Ю. Грамматическая связь слов и словоформа укажут на требуемое окончание. Предпоследней буквой может быть только Ь, И или Ы. Последний вариант возможен лишь в случае мн. числа, только с буквое Е в конце слова: -ЫЕ. Буквы Ь или И прояснятся по требуемой словоформе. Она прояснится при отметании невозможных взаимосвязей  из существующих окончаний слов в имеющехся комбинациях наших знаков.

В середине слова два апострофа с последующей точкой указывают на разделительный знак или букву И перед гласной Ю, Я, Е. Последний вариант наиболее вероятен, первый вариант наименее вероятен. Знакомая компьютеру комбинация знаков шифровки перед первым из апострофов паскроется в качестве конкретной приставки перед твёрдым знаком. Это резко сузит число проверяемых слов, подходящих под комбинацию знаков шифрованного слова. Каждая или почти каждая приставка имеет только ей присущую комбинацию наших знаков шифровки.

То же самое относится к окончаниям слов, возможно почти ко всем суффиксам и ко многим из корней. Встретив знакомую комбинацию знаков шифровки, компьютер проверяет, не является ли это приставкой, корнем , суффиксом, окончанием. Он проверит, соединяются ли такие знакомые ему части слов в знакомые ему слова и соединяются ли такие слова в грамматически увязанные предложения? Встречались ли по тексту эти слова ранее? Недопустимые грамматически (или по содержанию текста) комбинации лишь существующих в словаре слов, комбинации лишь существующих частей слов и невозможные в русском языке комбинации букв компьютер будет отметать, оставляя всё меньше вариантов для остающихся проверок.

В русском языке имеется много всяких приставок, окончаний и суффиксов. Слово может иметь и две и три одноомённые части слова. Поэтому слов, производных от одного корня иногда бывает очень много. И наоборот, большое число русских слов сводится к весьма малому числу русских корней. Какое-то число корней может иметь одинаковую шифровку, но такие слова могут относиться к разным частям речи или к разным совоформам. Число шифровок для всех имеющихся в памяти компьютера корней, приставок, окончаний и суффиксов довольно мало. Если компьютер умеет замечать в тексте грамматические ошибки, то он, конечно же, сможет увидеть, где разделяется слово на свои части слова, чтобы расшифровывать каждую из них даже независимо от остальных частей. Длинные слова представляют собой более простые задачки, чем слова короткие. Ведь каждая буква накладывает резкое ограничение на возможность комбинации знаков шифровки с разночтением лишь существующих слов и фраз. Слепое многообразие комбинаций букв в качестве слов растёт на три порядка с каждой очередной буквой в слове. Но существующих слов ничтожно мало в сравнении с математически возможным числом комбинаций из 33-х букв алфавита. При 4-х наших знаках сжатого алфавита такое нерасшифрованное слово, как СТРАЖ, состоящее всего из 5-ти букв, потребовало бы проверки сопоставлением всех 40 тысяч вариантов всего слепого многообразия комбинаций из   многообразия в 33  буквы алфавита [ 10 х 10 х 10 х 4 х 10 = 40000 ]. Однако в орфографическом словаре всего около ста тысяч слов.

Сколько из них имеют только 5 букв? Сколько из таких коротких слов имеет только одну гласную букву, причём только одну из трёх: У, О, А, - причем, стоящую только на четвёртом месте? Сколько из слов имеющих по пять букв, имеют своей особенностью три согласные буквы подряд? А из оставшихся вариантов сколько из них имеют эти три согласных подряд, стоящими на трёх первых местах в слове? Сколько из оставшихся имеют последней буквой слова какую-то звонкую, а не глухую согласную? Половина. А сколько слов из этой половины имеют первой буквой слова глухую согласную? А тех, что второй буквой слова только глухую согласную согласную? Очередную половину! А сколько из оставшихся имеет на треть ем месте слова только звонкую согласную? Тоже половина от всего, что после всех делений целого в конце концов осталось. Таким образом, остаётся от ста и ли от сорока тысяч слов ничтожная часть, - вероятно, несколько слов. Из них подойдёт одно единственное, потому что по содержанию тексто все остальные слова отпадут как неуместные по смыслу. При склонениях этого слова будут меняться его окончания, что подскажет род, число, падеж, тип склонения и смысловую связь с глаголами, прилагательными и прочими словами по содержанию текста. Это позволит отмести нелепые варианты и оставить вариант, единственно возможный.

При первом упоминании шифрованного слова, редко употребляемого, все или хотя бы некоторые его буквы надо будет указать конкретно. Тогда компьютер сможет подбирать подходящее слово, прежде всего, из уже упомянутых в тексте.

Чем больше разгаданного в тексте, тем быстрее разгадывается всё остальное.

Мы начали с появления во всех местах текста сначала буквы Й, а потом буквы И в начале слов. Союз И является целым словом и подскажет перечисление однородных членов предложения. Это, вероятно, позволит быстрее разобраться с окончаниями слов и, следовательно, с выявлнием их грамматических форм и взаимосвязей.

Слова из двух слов, начинающихся на И, начирают проявляться раньше прочих. Вторая буква является согласной. Если это глухая, то возможен единственный вариант – слово ИХ. Это местоимение ОНИ в косвенном падеже. Родительный или винительный падеж , - это станет ясным по комбинациям знаков шифровки в окончаниях взаимосвязанных слов.

Если второй буквой на конце слова указан знак акой-то звонкой согласной, то появляются варианты, которые требуется проверить: ИВ, ИЗ, ИМ. Существительное ИВЫ в родительном падеже отпадёт, если оно в данном тексте неуместно. По окончаниям взаимосвязанных слов прояснится, где имеется в виду предлог ИЗ, а где местоимение ИМ. Там, где на третьем месте стоит дефиз, срозу будет видно, где предлог ИЗ-ЗА, и где предлог ИЗ-ПОД. Они помогут выяснить подежные окончания и словоформы взаимосвязанных с ними слов. Узнанные словоформы позволят отмести неуместные варианты слов, ранее подлежавшие проверке. По всему тексту компьютер находит слова из трёх слов, показанных тремя знаками, из которх первый и третий является апострофом, а между ними стоит знак согласной буквы. Если это глухая согласная, то, кроме междометия ИШЬ, понятного по знакам препирания, имеется ещё только единственный вариант – слово ИЩИ. Эта словоформа от глагола искать подсказывает грамматическую и сюжетную связь с другими словами предложения и текста.

Если указана звонкая согласная, то имеются несколько предположений: ИВЫ, ИДИ, ИЛИ, ИМИ. По окончаниям взаимосвязанных слов предложения проясняется, какая часть речи имеется в виду в каждом конкретном случае. Дальнейших уточнений к этим вариантам уже не требуется.

 

В слове из трёх букв на первом месте стоит апостроф, на втором – согласная, на третьем – точка. Вариантов прочтения появляется чуть больше, но все они  точно так же сразу распределяются по своим местам из условий соответствия и несоответствия окончаниям взаимосвязанных слов.

 

Слов состоящих из одной буквы имеется одиннадцать в русском языке. Они легко расшифровываются.

Слов, состоящих из трёх букв, наберётся несколько десятков. Они тоже легко прверяются уже хотя бы только простым перебором вариантов.

Слов, состоящих из четырёх букв, в о всём Орфографическом словаре наберётся несколько сотен. Компьютер мгновенно отметёт неподходящие варианты хотя бы по несоответствию комбинациям букв.

Слов из пяти букв во всём словаре наберётся вряд ли более тысячи. Компьютер отметёт те, что не являются частью речи, подходящей к конкретному случаю. Останется сразу лишь их малая часть. Пример трудного для расшифровки слова, состоящего из пяти букв, мы рассмотрели выше. Проблем сложных пока не встретили. Многие из самых коротких слов являются служебными и часто упоминаемыми: предлоги, частицы, союзы, междометия, местоимения, наречия. Такие слова редко встретчтся с одинаковыми комбинацями знаков в шифровках этих слов. Компьютер распределит эти слова по их грамматическим словоформам. В конце концов, при - бесконечном числе всё более совершенных приёмов распознавания взаимосвязей между словами – разночтений слов не будет. Программы поиска орфографических и синтаксических ошибок, как и программы компьютерного перевода с языка на язык, справляются с аналогичными  и несопоставимо более сложными проблемами. Я предполагаю, что программа дешифрования текста, атпечатанного знаками сжатого алфавита, справится со своей задачей даже при обозначениии одинаково всех 20-согласных. Но и это не предел. Не ставя себе преждевременных целей, задержимся на сжатии алфавита, состоящего из 33-х букв, пока лишь до 4-х различных обозначений, - по нескольку букв на каждое из них.

 

Чем длиннее слово, тем легче оно расшифровывается. В словаре длинных слов много, а коротких мало. В тексте же наоборот.  При этом, чем длиннее слово, тем оно реже упоминается в тексте, а чем слово короче, тем оно в тексте встречается чаще. Упомянутое ранее слово не требуется расшифровывать полностью. Достаточно лишь как-либо пометить его, что оно уже было  упомянуто. Такой меткой для компьютера будет в слове хотя бы одна буква, отпечатанная однажды в ее конкретном указании - двумя или тремя ударами сответствующих напёрстков по любому металлическому предмету.


 
    Поставьте оценку: 
Комментарии: 
Ваше имя: 
Ваш e-mail: 

     Проголосовало: 7     Средняя оценка: 1.7