НОП | Форум
Fast Uncompromising Discussions. FUDforum will get your users talking.

Начало »  » fido7.ru.fido.internet » [FWD] Крибтогрофы! Пасдравляю с первым опреля!
[FWD] Крибтогрофы! Пасдравляю с первым опреля! [сообщение #499714] , 02 2007 18:44
Dmitry Gaivoronsky в настоящее время не в онлайне  Dmitry Gaivoronsky
Сообщений: 0
Зарегистрирован: 2007
Ohayou gozaimasu, All.

І - - - --
FWD by Dmitry Gaivoronsky (2:5054/8.97)
Area RU.CRYPT
From Alexander Andrusenko, 2:5020/400 (01 апр 2007 04:36)
To All
Subj Крибтогрофы! Пасдравляю с первым опреля!
- - - ---
From: "Alexander Andrusenko"

Вниманию читателей предлагается статья, в которой рассматриваются
возможности использования так называемого "языка падонков" в стеганографии.
Hадеюсь, данная статья поможет читателям по-новому взглянуть на хорошо (или
плохо) известные вещи.

Краткое оглавление статьи.
1) История возникновения "языка падонков".
2) Hемножко теории.
3) Описание алгоритма стеганографирования.
4) Примеры стеганографированных текстов.
5) Выводы.
6) Рекомедуемая литература.

Глава 1. История возникновения "языка падонков".
Я не являюсь отличным знатоком истории, поэтому приведу только некоторые
известные мне факты.

Hачну с того, что практически во всех языках произношение слов отличается от
их написания. В связи с этим практически всегда находились люди, которые
предлагали упростить язык, приведя написание слов в соответствии с их
произношением. В качестве одного из таких источников можно привести
написанный еще в 1747 году трактат "Разговор между чужестранным человеком и
российским об ортографии старинной и новой и всем что принадлежит к сей
материи", автором которого был Тредиаковский В.К. "Так писать подлежит, как
звон требует: ибо должность писмен в том, чтобы хранить голосы и как заклад
отдавать их читателям" - писал малоизвестный ныне, но широко известный в
свое время русский поэт [1].

Далее остановлюсь на том, что всегда находились и противники изменения
языка. В качестве примера приведу юмористическую статью [2] неизвестного
автора, часто приписываемую Марку Твену, заканчивающуюся словами "ZE DREAM
VIL FINALI KUM TRU!"

Hу и наконец остановлюсь на относительно новой идее, родоначальником которой
считается Дмитрий Соколовский [3] - намеренно коверкать написание слов так,
чтобы их произношение при этом оставалось без изменений. Именно на основании
этой идеи я и предлагаю построить стеганографический алгоритм.

Глава 2. Hемного теории.
В этой главе я буду ссылаться на один-единственный источник - книгу
"Занимательная орфография" [4] (я не буду вдавться глубоко в детали, и не
буду рассматривать, например, применение звука, обозначаемого в фонетической
транскрипции как [ъ]).

Согласно этому источнику, существуют следующие правила фонетики.
1) Гласные не всегда произносятся так, как пишутся:
1а) безударная "о" произносится как [а];
1б) безударная "е" после согласных произносится как [и];
1в) гласные "е", "ё", "ю", "я" в начале слова или после других гласных
произносятся как пары звуков [йэ], [йо], [йу], [йа] соответственно.

2) Согласные не всегда произносятся так, как пишутся:
2а) звонкие согласные "б", "в", "г", "д", "ж", "з" в конце слова или перед
глухими согласными произносятся как парные им глухие согласные [п], [ф],
[к], [т], [ш], [с] соответственно;
2б) глухие согласные "п", "ф", "к", "т", "ш", "с" перед звонкими согласными
произносятся как парные им звонкие согласные [б], [в], [г], [д], [ж], [з]
cоответственно.

Переформулирую эти правила так, чтобы их было легче алгоритмизировать.
Сначала задам возможные ситуации, при которых могут сработать эти правила:
с1) безударная гласная
с2) после согласной
с3) после гласной
с4) в начале слова
с5) в конце слова
с6) перед глухой согласной
с7) перед звонкой согласной
Hа всякий случай напомню, какие согласные сичтаются звонкими, а какие -
глухими. Звонкие - "бвгджз". Глухие - "кпстфхцчшщ". Согласные "йлмнр"
называются сонорными и не относятся ни к звонким, ни к глухим.

Теперь задам пары букв (или буквосочетаний), которые произноятся _одинаково_
(с уточнением ситуаций, когда это применимо):
p1) "о"-"а" (c1)
p2) "е"-"и" (c1 и c2)
p3) "е"-"йэ" (c3 или c4)
p4) "ё"-"йо" (c3 или c4)
p5) "ю"-"йу" (c3 или c4)
p6) "я"-"йа" (c3 или c4)
p7) "б"-"п" (c5 или c6 или c7)
p8) "в"-"ф" (c5 или c6 или c7)
p9) "г"-"к" (c5 или c6 или c7)
p10) "д"-"т" (c5 или c6 или c7)
p11) "ж"-"ш" (c5 или c6 или c7)
p12) "з"-"с" (c5 или c6 или c7)

Теперь я введу понятие четырех разных "почти русских" языков.
1) Чистый_русский_язык (ЧРЯ). Это язык, в котором все слова пишутся так, как
они указаны в орфографических словарях русского языка.
2) Чистый_падонковский_язык (ЧПЯ). Это язык, в котором в словах ЧРЯ
производятся все возможные согласно условиям c1-c7 замены пар p1-p12.
3) Смешанный_язык (СЯ). Это язык, в котором в словах ЧРЯ могут
производиться, а могут и не производиться возможные согласно условиям c1-c7
замены пар p1-p12.
4) Искаженный_смешанный_язык (ИСЯ). Это язык, в котором в словах ЧРЯ могут
производиться, а могут и не производиться замены пар p1-p12, в том числе и
там, где они не удовлетворяют условиям c1-c7.

Глава 3. Описание алгоритма стеганографирования.
Проще всего для стеганографирования использовать СЯ.
Если ни одно из условий c1-c7 не выполнимо, то буква не передает
стеганографическую информацию.
Если одно из условий c1-c7 выполнимо, но замена из p1-p12 не произведена
(т.е. буква написана как в ЧРЯ), то буква передает стеганографическую
информацию - бит 0.
Если одно из условий c1-c7 выполнимо, и замена из p1-p12 произведена (т.е.
буква написана как в ЧПЯ), то буква передает стеганографическую информацию -
бит 1.

Сложнее использовать для стеганографирования ИСЯ.
Использовать его можно, например, так:
Если условие из c1-c7 не выполнимо, и замена из p1-p12 не произведена (т.е.
буква написана как в ЧРЯ), то буква не передает стеганографическую
информацию.
Если условие из c1-c7 не выполнимо, но замена из p1-p12 все равно
произведена (т.е. написание буквы не соответсвует ни ЧРЯ, ни ЧПЯ), то буква
передает стеганографическую информацию - бит 1.

Глава 4.
Теперь рассмотрю примеры представления слов во всех четырех языках.
Hачну с классического слова "привет".
ЧРЯ: "привет" (00b)
ЧПЯ: "превед" (11b)
СЯ: "привет" (00b), "привед" (01b), "превет" (10b), "превед" (11b)
ИСЯ: "(п|б)р(е|и)(в|ф)(е|и)(т|д)" - 32 разных комбинации, среди которых есть
и такие трудночитаемые, как "брефид".

Продолжу классическими приветствиями "Превед, кросавчег!" и "Превед,
кросавчеги!". Чтобы понять, к каким языкам они отностся, нужно представить
каждое из них в виде ЧРЯ и ЧПЯ.
ЧРЯ: "Привет, красавчик!" и "Привет, красавчики!"
ЧПЯ: "Превед, кросафчег!" и "Превед, кросафчеке!"
Из этого можно сделать вывод, что первая фраза относится к СЯ (и ей
соответствует значение 111011b), а вторая к ИСЯ, так как в ЧРЯ/СЯ
предпоследняя буква ("к") не должна заменяться на "г", потому что не
выполняется ни одно из условий c5, c6, c7 (и фразе соответствует значение
1110110b).

Остановлюсь на заголовке данной статьи, которая представлена в виде СЯ:
СЯ : Крибтогрофы! Пасдравляю с первым опреля!
ЧРЯ: Криптографы! Поздравляю с первым апреля!
ЧПЯ: Кребтогрофы! Пасдровляю з первым опреля!
01 1 11 0 0 1
01111001b соответствует ascii-символу y (сокращение от "yes").
Если нужно той же фразой представить ascii-символ n (сокращение от "no"), то
01101110b будет представлен как
01 1 01 1 1 0
СЯ: Крибтогрофы! Посдровляю з первым апреля!

Hу и наконец предлагаю рассмотреть действительно сложный текст,
встречающийся в "дикой" природе [5]. Он явно относится к ИСЯ. Расставлю биты
0/1 там, где буквы относятся к ЧРЯ/ЧПЯ соответсвенно. Там, где будут
встречаться элементы ИСЯ, я буду ставить "бит" 2 просто для выделения этих
моментов, помня при этом, что на самом деле там должен быть бит 1. Там, где
будут встречаться элементы, которые не входят даже в ИСЯ, буду ставить "бит"
3, помня при этом, что на самом деле там не должно быть никакого бита.

Дастайом халоднайу вотку и отпиваим примерно четверть
10 01 1 31 1 10 0 2 0 0 0 0 4
Аккуратно отризаим ат бальшога кабачга два куска
00 0 0 1 2 10 1 1 0 0 2 0 0
Выпеваим вотки. Фставляим иво в дрель спицальнае свирло
1 2 1 10 0 2 23 0 0 1 3 10 0 1
для кабачкоф и сверлим отверстийа
0 0 1 0 0 00 0 01
Выпеваим вотки. Лобзегом аккуратна выпиливаим сиридинки
1 2 1 0 120 00 1 0 02 1 1 0
Выпеваим вотки. Струшки ат кабачга складываим ф тарелку
1 2 1 0 1 0 10 0 0 2 0 02 1 0
и пасыпаим зирой и шафранам, они нам ищо пригадятся
1 2 5 0 1 0 2 3 0 1 0
Выпиваем вотки. Чистем две маркофки и астарожна
0 0 1 0 1 0 1 1 0 10 1 1
высверливаим в них по три отверстийа
0 0 02 0 0 00 0 01
Выпиваим вотки. Вставиф маркофку ф кабачог, а в
0 2 1 00 01 1 1 1 0 0 1 0
маркофку зилёный лук, наризаим кубегами свенину и
1 1 1 0 0 1 2 120 0 0 1
гавядину
1 0
Выпиваим вотки. Мяса забеваим ф кабачог на одну
0 2 1 1 0 1 2 1 0 0 1 0
палавину свенину, на другую гавядину (каму свенину
1 1 0 1 0 1 0 1 0 1
нельзя кушайут с адной стараны). Бирём два агуртца и,
0 01 0 0 1 0 1 1 1 0 1 3
придварительна прасвирлив атверстийа, вставляим их как
10 0 0 1 10 1 0 10 0 01 00 0 2 0
паказана на фотаграфийи
1 0 1 0 1 3
Выпиваим ищо вотки, завём пелоток и они памагайут
0 2 2 3 1 1 1 00 0 1 1 1 0
раскрыть тему ебли агурцом и маркофкай
00 4 0 0 1 1 1 1
Самастаятельна, выпив ищо вотки, раскрывайим тему ебли
0 10 1 0 1 00 2 3 1 01 3 0 0
кабачгов
1 1 2 0
Выкладываим фсё на противень и, дабавив для запаха
02 1 0 0 1 00 0 0
свинуйу ногу, украшаим блюдо кольцыми лука и зелинью.
0 0 1 0 2 0 3 0 0 1 0
Выпеваем вотки.
1 0 1
Разрезанный папалам памидор крепим изалентай как
0 0 1 1 1 0 0 1 1 0
паказано на фото
1 0 0 0
Бирём два нибальших шурупа и одним прикручиваим сладкей
1 0 1 1 0 0 0 0 02 0 1
периц, выпеваим вотки и фторой кладём в тот кабачог,
1 1 2 1 1 0 0 0 0 0 0 1
каторым будем
1 0
угащать саседа (он любит шутки):
1 4 1 0 00 0 0
Дабавиф для красаты слив, ставим фсё на плиту, зажегаим
1 01 1 0 0 0 1 0 0 1 2
агонь и дапеваим вотку
1 1 1 2 1
Дапиф вотку я увидел на сваём стале каких-та зелёных
1 1 1 0 0 10 0 1 0 1 0
уёпкаф
01 11
Ани, наверна, и спиздели фсю жратву
1 0 1 0 0 1 0 1 00
Кушаим ис тарелки. Смотри фото 5.
02 1 0 0 0 0
Время пригатавленийа нипомню. Опщий бюджед пасщитать не
0 1 1 01 13 1 0 0 1 1030 4
удалось, т. к. фсё спиздели. Приятнова апититу!
0 4 1 0 0 1 0 0 031 031 3

Теперь комментарии к особо сложным местам (я их пометил отдельными
"битами").

"бит" 4. По фонетическим правилам, слова "четверть" и "четвердь" читаются
одинаково, однако такая замена не подходит ни под одно из условий c1-c7. Это
явная недоработка моего алгоритма, однако алгоритм выполняется в том виде, в
каком он существует, поэтому считаю, что здесь замены быть не может, и
убираю этот бит из результата.

"бит" 5. Слово "зирой" мне неизвестно, поэтому я не могу сказать, правильно
ли оно написано, и где у него ударение, а значит я не могу правильно
расставить биты к этому слову. В таком случае слово просто пропускается, как
если бы оно не позволяло выполнить ни одну из замен p1-p12.

В тексте неоднократно встречается место, которое в ЧПЯ и ИСЯ может
трактоваться по-разному: это, например, буква "е" в словах "выпиваем" или
"ещо". В ЧПЯ эта буква согласно p3 должна быть заменена на "йэ". В ИСЯ эта
буква согласно p2 и при игнорировании c2 может быть заменена на "и". В
данном случае все зависит просто от порядка применения замен. В моем
алгоритме p2 выполнится раньше, чем p3, поэтому я рассматриваю такие замены
как элементы ИСЯ и обозначаю "битом" 2.

Результат:
10011111 00100000 00011101 10010011
11001100 11001001 00000011 11011000
10011101 11010100 01001101 10101010
00101011 01011000 10000001 01100011
11001011 10011110 00110011 10111001
01101010 10100100 10111011 00011010
10001000 10101010 11111000 11100000
11110101 01001101 00111001 10010000
00101000 10101001 11001101 00010110
00001011 11110000 00110110 00001011
00010011 11111111 00100101 00111101
00101000 11000001 10111001 10001001
000101
Я не стану сейчас преобразовывать получившийся бинарный код в ascii
(наверняка стеганография в данном примере использовалась не сама по себе, а
в сочетании с криптографией). Я только сравню количество 0 и 1 в результате:
204 нуля (52,3%) и 186 единиц (47,7%). Это весьма неплохое распределение для
передачи произвольной информации.

Глава 5. Выводы. У меня было большое желание порассуждать в этой главе об
использовании стеганографии для шпионажа и вытекающей отсюда уголовной
ответственности за искажение написания слов. Однако после недолгих
размышлений я решил не лезть в те области, в которых я разбираюсь еще хуже,
чем в криптографии. Поэтому выводы о юридических аспектах я предоставляю
делать читателям. От себя замечу два простых способа опеределить случаи
использования такого метода стеганографии.
Первый - сравнение количества нулей и единиц в результате. Этот метод явно
ненадежен, так как его легко обойти, добавив некоторое количество одинаковых
незначащих битов перед стеганографированием.
Второй - поиск одинаковых слов с разным написанием. Так, в последнем из
примеров главы 4 одно и то же слово "выпиваем" встречается в трех разных
написаниях, что с большой вероятностью свидетельствует об использовании
стеганографии.

Глава 6. Рекомендуемая литература.
1. Краткий очерк истории русского правописания.
http://www.geocities.com/kstati/texts/orthist.html
2. Five year phase-in plan for "EuroEnglish".
http://www.lib.ru/ENGLISH/rekonstr.txt
3. Жаргон падонков.
http://ru.wikipedia.org/wiki/%D0%96%D0%B0%D1%80%D0%B3%D0%BE%D0%BD_%D0%BF%D0%B0%
D0%B4%D0%BE%D0%BD%D0%BA%D0%BE%D0%B2
4. Панов М.В. Занимательная орфография: Книга для внеклассного чтения
учащихся 7-8-х классов. М.: Просвещение, 1984.
5. Хитражопай кабачог. http://udaff.com/netlenka/proza/48616.html


-+- ifmail v.2.15dev5.3
+ Origin: Volia ISP News Site (2:5020/400)
- - - --


Sayonara... Dmitry.
 
Сообщение не прочитано
Переход к форуму:
  


Текущее время: 19 00:43:59 MSK 2024

Общее время, затраченное на создание страницы: 0.01547 секунд