Тришин Виталий Николаевич,
Председатель Совета директоров компании «ОКП», г. Москва (http://www.trishin.ru),
кандидат физико-математических наук

(сокращённый вариант данной статьи опубликован в журнале "Вестник УМО. Экономика. Статистика и Информатика", №6, 2013, стр. 7-13, на сайте - с изменениями от 30.10.2017)

В статье описывается электронный словарь-справочник синонимов и квазисинонимов русского языка компьютерной системы ASIS® (в новой версии 7.1 от 30.10.2017 имеется более 619 тыс. слов и словосочетаний, фразеологизмов, 2261 тыс. синонимических, квазисинонимических и парадигматических связей). Программа может быть использована не только как словарь синонимов и близких по смыслу слов, но и в качестве орфографического и толкового словарей русского языка с целью проверки правильности написания и определения значений незнакомых слов, синонимайзера текста, а также как обратный словарь. Словарь также может служить инструментом для филологических наблюдений и исследований языка благодаря развитой системе запросов по разным признакам слова (по значению, составу, синонимии и т.д.). Словарная база программы включает слова и словосочетания из словарей и справочников по всем отраслям знаний — от астрономии до японской живописи. Демонстрационная (неполная) онлайн-версия 7.0 на 526 тыс. слов и словосочетаний, 1951 тыс. синонимических связей на начало 2014 года с исправлением неточностей в словарной базе на дату 09.06.2016 размещена на сайте www.trishin.net. Заметим, что в этой версии (в отличие от 7.1) введение буквы «ё» ещё не было полностью завершено.

Этот словарь практически показывает, что по количеству слов русский язык относится к наиболее развитым языкам мира, а по масштабу и плотности пространства синонимов (а также рифм, интонаций) ему, по мнению автора, нет равных. Использование синонимии и элементов искусственного интеллекта позволяет существенно улучшить поиск и обработку информации в компьютерных системах. Данный словарь-справочник является попыткой продолжения словаря В.И. Даля на современной живой бесцензурной языковой основе (кроме обсценной лексики), с включением слов и словосочетаний из специализированных словарей.

Ключевые слова: мощь русского языка, сила, мощность, количество слов в русском языке, синоним, синонимический, онлайн словарь, ASIS®.

Vitaly N. Trishin

THE MIGHT OF RUSSIAN LANGUAGE ACCORDING TO SYNONYMIC DICTIONARY BY COMPUTER EVALUATION SYSTEM ASIS®

The article describes electronic dictionary of syno­nyms in Russian language by ASIS® system (more than 619 000 words and collocations, 2 261 syno­nymic connections).

The program can be used not just as a dictionary of synonyms and close meaning words, but also as spelling dictionary and definition dictionary of Russian language in order to check the orthography and define the meaning of unknown words. The dictionary is also designed to be an instrument of philological surveys and studies of the language trough the extensive query system on different characteristic of words (definition, composition, synonymy, etc.). Program’s lexical base includes words from dictionaries and guides in all subject areas – from astronomy to Japanese paint­ing. Over compilation of dictionary developer used published dictionaries: spelling, synonymic, definition dictionaries, dictionary of collocations, dictionary of foreign words and etc. of 19–21 cc. Newspapers, magazines and web-resources were active used as well for appending the dictionary.

This dictionary practically shows, that by the amount of words Russian language belongs with the most developed languages in the world, and by the scale and density of synonymic space, in the author’s opinion, it has no equal. Using the synonymy and artificial intelligence elements make it possible to improve fundamentally on search and information processing in computer systems.

Keywords: mightiness of Russian language, might, amount of words in Russian language, synonym, synonymic, online dictionary, ASIS®.

1. О русском языке, а также о назначении и особенностях словаря.

«В начале был Логос»
(Евангелие от Иоанна)

«Язык есть дом бытия. В жилище языка обитает человек. Мыслители и поэты — хранители этого жилища»
(М. Хайдеггер «Время и бытие»)

Некоторыми диалектологами принято считать (см., например, работы советского языковеда Г. О. Винокура - http://danefae.org/lib/vinokur/, и его современных единомышленников), что русский, украинский и белорусский – это разные языки и народы (так было принято считать советским языковедением), и что в русском языке имеются 3 диалекта (наречия), а именно: северный диалект (ладого-тихвинский, вологодский и костромской говоры) и южный диалект (курско-орловский и рязанский говоры), между которыми находится территория с населением использующим, как правило, среднерусский диалект (среднерусские говоры) – Псковская, Тверская, Московская, Владимирская, Ивановская, Нижегородская области.

Многие выдающиеся произведения русской литературы содержат признаки местных диалектов: например, поэма «Песнь о Великой Матери» Н. А. Клюева насыщена колоритом северного диалекта, этот же диалект был характерен и для В. И. Белова; особенности южного диалекта ярко представлены в произведениях В. И. Даля, М. А. Шолохова. По-видимому, на исходном  древнерусском языке говорили в Киевской Руси, который затем распространился на восток в связи с переносом столицы России из Киева (был столицей Руси в 882 – 1243 гг.) сначала во Владимир, а затем из Владимира в Москву (1389) (многие историки считают первой столицей России до Киева Великий Новгород (862 – 882), а также Ладогу). Западные же области Малороссии (Правобережье) попали, по большей части, на 4 с половиной века (разные территории по-разному) под власть Великого княжества Литовского (условно 1340 – 1569), Польши (условно 1569 – 1793), а также часть территории и в разные годы Турции и Австро-Венгрии. В 1793 в результате второго раздела Польши Правобережная Украина вошла в состав Российской Империи вместе с большей частью Польши, и сегодняшний украинский язык – это, так считают многие лингвисты-историки, ополяченный старорусский язык (паны говорили со своими крестьянами по-польски), см., например, книгу А.М. Волконского [1].

Две цитаты из этой книги:

«в начале века по заданию австрийских властей "ученый-изобретатель" М. Грушевский работал над созданием "научного" украинского языка. Методы были простые и надежные: нужно было избавиться от русских слов и заменить их польскими».

«Создававшийся преимущественно в Галиции, с использованием множества заимствований из польского, немецкого, других языков, украинский язык, который не следует путать с малорусским наречием, был понятен в основном галичанам, привыкшим жить бок о бок с поляками и немцами».

Cлова из малорусского и белорусского наречий помещал в свой словарь и Владимир Даль наряду со словами из губернских диалектов великорусского наречия.

Эти три наречия (великорусский, малорусский и белорусский) и составляли, как было признано до революции 1917 года [2-5], и составляют сейчас, как считают доктора филологический наук Т. Л. Миронова (см. Приложение 2), В. Ю. Троицкий [6] и другие филологи, русский язык, а уже великорусский, делится на северный, южный и среднерусский (см. выше), что радикально противоречит советской концепции и работам «украинца» М. С. Грушевского. В советское время авторы дореволюционных работ о единстве русского народа были объявлены «великодержавными шовинистами», многие подверглись репрессиям, а их работы не переиздавались.

«До монгольского нашествия литературный язык, с незначительными диалектными различиями, был совершенно одинаков. Так же и быт был един от Киева до Ладоги» (В. В. Кожинов). «В IX столетии Кириллу и Мефодию, когда они создавали славянскую азбуку, при их путешествиях не нужен был переводчик, потому … все славяне говорили на одном языке» (Балязин В. Н. Неофициальная история России, 2007). И именно на Русском Севере сохранились былины Киевской Руси! После революции 1917 года малорусский и белорусский языки, считавшиеся (наряду с великорусским) в Российской Империи диалектами русского языка, приобрели статус официальных, государственных. И названия «Украина» и «украинцы», иногда встречавшиеся в литературных произведениях до революции 1917 года, закрепились также за Малороссией и малороссами фактически только лишь при большевиках.

Справка.

До революции на карте Российской империи в действительности не было ни Украины, ни Малороссии, как не было Башкортостана, республики Саха, Удмуртии (население - 28 % удмуртов, 62 % русских, 7 % татар в 2010 году), Ямало-Ненецкого автономного округа (население - 6 % ненцев, 62 % русских, 10 % украинцев в 2010 году) и др. национально-государственных образований. В состав Европейской России 1917 года входил 51 регион: 50 губерний (включая 9 на территории сегодняшней Украины) и Область Войска Донского. На территории нынешней Украины к 1917 году вместо сегодняшних 24 областей существовали следующие губернии: Волынская, Подольская, Киевская, Екатеринославская, Полтавская, Таврическая, Харьковская, Херсонская, Черниговская. Населенные, в основном, русскими Новороссия (юг сегодняшней Украины) и Донбасс были переданы в состав образованной в 1922 году УССР, западная Украина (Галиция) входила до 1914 года в состав Австро-Венгрии, а в 1919 – 1939 относилась к Польше.

По мнению автора, истинной целью действий по «выдавливанию» русского языка и культуры сегодняшней «украинской элитой» да и «элитами» других стран бывшего СССР (а также их западными «партнёрами») является ограничение доступа граждан к подлинной русской культуре, в частности, к великой русской поэзии Лермонтова, Тютчева, Фета, Анненского, Рубцова, Передреева, Соколова, Левитанского и многих других (более 100 поэтов мирового уровня, чего и близко нет ни в одной стране мира!) и к русской песне. (По словам Кожинова «Русская песня – главная основа отечественной культуры». [http://www.kroupnov.ru/news/2011/02/02/10783/ , «Антология русского лиризма. XX век», http://studia-vasin.ru/]; «Без песен мы не люди, не русские люди» (А. Н. Васин, журнал «Родина», №3, 2005 год, http://www.studia-vasin.ru/publikatsii/70-publikatsii/578-sergej-yakovlev-bez-pesen-my-ne-lyudi-ne-r... ). А также для дальнейшего разделения единого в культурном, цивилизационном плане русского народа и варваризации населения, сломе мировоззренческой матрицы Русской цивилизации с помощью Интернета, телевидения, радио, воспитания ненависти граждан к собственной стране и пр., и, тем самым, защиты своих экономических интересов, личного бизнеса и интересов других стран (о конфликтах на стыках цивилизаций, о борьбе цивилизаций см. книгу Сэмюэла Хантингтона «Столкновение цивилизаций»[13], см. также [14]). При этом и в России, и на Украине, и в других странах бывшего СССР пошлейшей масс-культуре на русском языке (А.Н. Васин-Макаров: «Шоу-бизнес – передовой диверсионный отряд глобализма»), шансону-блатняку, непотребству, манипуляциям выдачей, в основном, с превалированием русофобской информации псевдороссийских Интернет-поисковиков (зарегистрированных за рубежом со скрываемыми конечными акционерами) по мировоззренческим запросам пользователей никакие препоны не ставятся.

Что же касается «элит» стран бывшего СССР (Украина, Прибалтика, Грузия и др.), то им, разумеется, безразлична наша русская литература и тем более поэзия, они её и не знают, им и своя, как бы «национальная» культура, в сущности, чужда; для них все проще и грубее: русский язык – носитель признаков менталитета, истории, общей культуры, в данном случае враждебной их прагматическим интересам, интересам их «старших товарищей», и они на элементарном инстинктивном уровне отгораживаются от всякого влияния чуждой для них русской культуры, тем более что для многих представителей «элиты» это язык оккупантов (так они говорят), хотя сами между собой разговаривают (и это в порядке вещей, по крайней мере, для украинцев) именно на русском языке (и даже с использованием русского мата).

И российской глобализированной мафиозно-сектантской «элите», в большей части, настоящая русская культура, литература и тем более поэзия в реальности также чужда. Впрочем, в различных областях науки, культуры действуют свои «подэлиты», отстаивающие свои клановые статусные и экономические интересы.

Кстати, и в других языках (странах) имеются региональные особенности, например житель Нью-Йорка не всё может понять из английской речи жителя Техаса. Даже в одном городе могут быть несколько диалектов. (Так в Лондоне известны диалекты английского языка Cockney, Estuary English и др.). В Великобритании насчитывается более 25 диалектов, а всего в английском языке имеется более 90 диалектов. [http://www.homeenglish.ru/grdial.htm.]. Однако эти страны никто не разделяет, как бывший СССР.

Примечание. В данный словарь вошли и слова из местных диалектов, в том числе и многие из малорусских и белорусских слов, упоминаемые как русские в дореволюционных словарях русского языка (наряду с вологодскими, архангельскими и др.), но регион их употребления в словаре не указан. Интересующиеся данным вопросом могут обратиться к словарю В.И. Даля и другим.

Электронный синонимический словарь-справочник первоначально разрабатывался с 1992 года как часть компьютерной системы помощи оценщику и аудитору ASIS® (Appraiser Support Info System) для быстрого поиска с высокой точностью аналогов для оцениваемых машин и оборудования в базах данных системы, а также для правильной их кодификации по классификатору ОКОФ, см. статью В. Н. Тришина "Задача классификации основных средств согласно классификатору ОКОФ выбора амортизационной группы и оставшегося срока полезного использования", http://www.trishin.ru/left/publishes/classification-task/. Система ASIS® описана в ряде статей, см., например, приложение к статье [7]. А о ранних версиях словаря см. [8-11].

В процессе развития словарь приобрел самостоятельное значение и в настоящее время распространяется отдельно от системы ASIS® с сайта компании «ОКП». В месяц его скачивают с сайта более 700 человек практически со всех стран мира. В помещенной на вышеупомянутом сайте версии 7.0 на начало 2014 г. (язык программирования Visual Fox Pro) словаря-справочника содержится 526 тыс. слов и выражений (506 тыс., если убрать дублирование слов с буквами «е» и «ё», см. ниже), из которых 406 тыс. снабжены синонимами, квазисинонимами, фразеологическими синонимами. Всего синонимов (поясняющих слов, синонимических связей) около 1951 тысячи (это сумма по всем словам относящихся к ним синонимических связей). Отметим также, что сокращения (а их в русском языке более 130 тысяч, см. сайт http://www.sokr.ru/) в данный словарь, как правило, не входят, кроме наиболее известных и слоговых сокращений типа комсомол, минфин, спецназ; не входят в словарь и топонимы для некрупных объектов (села, фамилии, речки и т.п.) и т.п.

В более современной программной оболочке словаря версии 8.3 (от 15.04.2013), написанной на языке С#, имеется более мощная система запросов, в ней 489 тыс. слов.

Так как словарь проектировался для компьютерного распознавания различных текстов, то в него вошли не только нормативные (цензурированные) словари РАН (орфографические, синонимические, толковые, литературного языка и др.), но и слова и словосочетания из словарей и справочников по всем отраслям знаний - от астрономии до японской живописи, с введёнными дополнительно синонимическими, квазисинонимиическими и парадигматическими связями. Введение даже всех нормативных словарей РАН в компьютерную систему распознавания текстов без дополнительного введения слов и словосочетаний из других «ненормативных» словарей не сможет помочь распознать даже обычный, обыденный текст, не говоря уже о специализированных текстах различных наук, направлений деятельностей.

При составлении словаря использованы также и другие изданные словари: «Словарь русского языка XVIII в.», «Толко́вый слова́рь живо́го великору́сского языка́» В.И. Даля (полностью в версии словаря-справочника 7.1), (т.е. примерно за последние триста лет), церковно-славянских слов, а также иностранных слов, неузуальных слов, арго (кроме заведомо ненормативной лексики) и т.п. Кроме того, для пополнения словаря активно использовались газеты, журналы, Интернет, словари поисковиков Yandex и Google путём анализа выдачи их автоподсказчиков слов (с проверкой по другим источникам), так как даже в самых крупных печатных словарях отсутствуют десятки тысяч широко распространенных в быту и прессе современных слов, например, паранормальщина, элитарщина, аномальщина, слововыражение, покалечение, примаскированный, доследственный, спецлаборатория, промпроизводство, медсправка, педколледж, зоопарикмахер, внеофисный, предшкольный, межкорпоративный, штрафплощадка, видеопоиск, рассинхронизировать, трудносоединимый, Единая Россия, ЕдРо, татароязычный, россияноговорящий и т.д. В данном словаре имеется 319 слов, начинающихся с «нано», а в новом Большом академическом словаре таких слов имеется всего 13. Основной пласт слов академических словарей занимают, как правило, слова и отрывки с соответствующими словами из произведений писателей 19 – 20 веков А. И. Герцена, Н. П. Огарева, А. Ф. Писемского, В. Г. Белинского, Н. Г. Чернышевского, А. М. Горького и многих других, назначенных советскими литературоведами классиками русской литературы. Слов из современного обиходного языка в них, как правило, немного. В словаре-справочнике представлены также устаревшие и редкие слова из академических словарей.

Этот словарь является попыткой создания объединённого словаря русского языка, о необходимости создания которого писал русский литературовед и лингвист-русист, академик АН СССР В. В. Виноградов: «Между тем потребность в историческом словаре русского литературного языка была осознана очень давно - почти при самом зарождении русской лексикографической науки. Мысль об историческом словаре русского литературного языка не вполне была чужда патриарху русского "корнесловия" акад. А. С. Шишкову. "Все находимые в священных писаниях, в летописях, в законах, в преданиях, в народных сказках и песнях самые старинные, хотя бы неупотребительные, но чистые славянские слова должно внесть в Словарь"- учил он.» (Виноградов В. В. Избранные труды. Лексикология и лексикография. - М., 1977.). Что касается роста числа слов в крупнейших словарях, то «знаменательны такие соотношения цифр: в "Словаре Академии Российской" (1806-1822) содержалось 51388 слов; в "Словаре церковнославянского и русского языка" (1847) уже было помещено 114749 слов; "Толковый словарь" В. И. Даля выходил за пределы 200 000 слов» (В. В. Виноградов).

Предлагаемый электронный словарь многофункционален. Он может быть использован как орфографический словарь русского языка для проверки правильности написания слов, особенно при составлении документов с использованием сложных и редко встречающихся специальных терминов.

Следует сказать, что многих слов из данного словаря нет и в самых больших орфографических словарях, а есть такие слова, написание которых в словарях, справочниках, энциклопедиях отличается. Например, в Русском орфографическом словаре РАН под редакцией В. В. Лопатина и О. Е. Ивановой имеются слова «кросс-курс», «кортико-висцеральный» и «кристально честный», а в орфографическом словаре Б. З. Букчиной, Л. П. Какалуцкой – они же пишутся как «кросскурс», «кортиковисцеральный» и «кристально-честный». Отметим также, что в Русском орфографическом словаре с началом «кортико» имеется 5 слов, а в данном словаре-справочнике их 46. В этом же словаре однотипные слова «мини-диск-плеер» и «мультидискплеер» оформлены по-разному. Еще пример – слово «крупнодроблёный». В словарях В. В. Лопатина и С. И. Ожегова его нет, в словаре С. Н. Корчемкиной, С. К. Кашкиной оно оформлено как «крупнодроблёный», а в словаре Б. З. Букчиной, Л. П. Какалуцкой как «крупно дробленный». В Русском орфографическом словаре имеются слова «пухоперовой», «пушно-заготовительный», «пушно-меховой», «сильнодействующий», а в Большом академическом словаре русского языка (главный редактор А. С. Герд) эти же слова пишутся как «пухо-перовой»,  «пушнозаготовительный», «пушномеховой», «сильно действующий» (т. 22, стр. 533). 

Ещё пример разночтения словарей.

В словаре Д. Н. Ушакова имеется слово «изобревший» (страдательное причастие прошедшего времени слова «изобретать»), и там говорится, что слово «изобретший» - неправильно.

В Русском орфографическом словаре имеется слово «изобретший», но нет слова «изобревший».

В Викисловаре у слова «изобретать» (см. https://ru.wiktionary.org/wiki/%D0%B8%D0%B7%D0%BE%D0%B1%D1%80%D0%B5%D1%82%D0%B0%D1%82%D1%8C) страдательное причастие прошедшего времени отсутствует, т.е. считается, что оба слова неправильны.

В данный словарь-справочник помещены оба слова, т.к. компьютерные системы с использованием словаря-справочника должны «понимать» оба слова.

Единицы измерений «авто-час», «нормо-час», «кормо-час», «станко-час», «пече-час», «полёто-час» и др. в разных орфографических словарях, справочниках, энциклопедиях пишутся то слитно, то через дефис. В данном словаре они все пишутся через дефис. Зато слово «политчас», не являющееся единицей измерений, пишется слитно. Слова с окончанием «кислый» (а их в версии 7.1 словаря-справочника 281) пишутся в словарях и справочниках по химии то слитно, то через дефис. В данном словаре такие слова все пишутся слитно (кроме «нехимических» терпко-кислый, солёно-кислый и др.). И даже в орфографических словарях разных лет выпуска под ред. В. В. Лопатина есть слова по-разному оформленные, например, слова «плоско-вогнутый» и «плоско-выпуклый» («плосковогнутый» и «плосковыпуклый»), «фликер» («фликкер») и «фликерный» («фликкерный»), «мил человек» («мил-человек»), «тенор альтино» («тенор-альтино) (Орфографический словарь РАН 2013 года выпуска и, соответственно, 2004 года) и др.  Имеются расхождения в словарях в написании существительных с окончанием –ие (таких слов в словаре 20084), например, бдение, безлуние, безмолвие и с окончанием –ье (таких слов в словаре 2406), например, ауканье, безлюдье, безлесье. Разночтения другого рода: ударение в наречии «на махах» в орфографическом словаре РАН – на второй гласной, в словаре Т. Ф. Ефремовой - на первом; в первом словаре есть слова «нет того чтобы», «ни гугу», а во втором «нет того, чтобы», «ни гу-гу» и т.д.

Приходилось в этих и подобных случаях принимать «волевое» решение на основания даты выпуска словаря и т.п.

Замечание. Версия 7.1 словаря-справочника от 22.02.2016 полностью сверена с 4-ым изданием Русского орфографического словаря РАН (2013 г.), который был принят в качестве эталона, а также другими словарями (медицинским, химическим, физическим, биологическим и др.). В самом же словаре РАН найдено около 30 опечаток. Например, в словарях по химии нет слова «эстрадиол-пропионат», зато есть слово «эстрадиол-дипропионат». А в словаре РАН – наоборот. Нет в русском языке слова «дооксиновый» (стр. 177), есть «деоксиновый», а на стр. 183 этого словаря обитает несуществующее насекомое «дриин»; на стр. 341 имеется несуществующее слово «менантенк», зато отсутствует в словаре слово «метантенк». На стр. 100 словаря РАН имеется словосочетание «Временный поверенный в делах», которое упомянуто также и на стр. 520 с написанием слова «поверенный» из словосочетания с большой буквы и т.п.

Синонимический словарь-справочник может служить в качестве подсказчика слов по их началу в интернет-поисковике существенно более мощного, чем автоподсказчики слов Yandex и Google. Возможно создание также автоподсказки по дополнительным параметрам, например, выдавать слова с заданным не только началом, но и окончанием.

Как словарь синонимов и поясняющих слов он может использоваться при поиске близких по смыслу слов и выполнять функции толкового словаря (с краткими толкованиями из толковых словарей в качестве синонимов) при определении значений незнакомых слов, а также синонимайзера текста. Он может быть реализован для планшетов и других гаджетов, а также в виде Интернет онлайн-версии со всеми поисковыми возможностями, реализованными в компьютерной версии 7.0 (на языке Visual Fox Pro) и 8.* [на языке C#, см. ниже]. Данный словарь вместе с алгоритмом поиска может быть встроен нами и в другие компьютерные и Интернет системы и служить инструментом для филологических наблюдений и исследований языка благодаря развитой системе запросов по разным признакам слова (по значению, составу, шаблону, синонимии и т.д.), что не позволяют делать существующие онлайн и электронные словари.

Сочинители стихов имеют возможность пользоваться словарём как машиной для подбора рифм (шутка).

Специалисты по всевозможным отраслям знаний могут им пользоваться как справочником для поиска нужной информации. В словарях и справочниках в виде книг слова упорядочены по алфавиту, и, если вы не помните точно, как оформлено нужное слово, то вам приходится просматривать сплошь весь словарь или справочник. В электронном словаре можно искать нужное слово по обобщенному понятию, например запрос (в версии 7.1 от 30.10.2017) по слову «рыба» выдаст в алфавитном порядке список из 879 названий различных рыб, по слову «растение» – 4911, «песня» – 174, «певец» - 129, «бард» - 50, "музыкант" – 179, "поэт" - 90, "графоман" - 42, "девушка" – 145 (интересно, а сколько всего имеется в английском языке синонимов слова Girl? Поисковый запрос в Яндексе выдаёт 8 английских синонимов), «гриб» – 384, «столица» – 274 названия существующих и бывших столиц, «минерал» – 6800, «взрывчатка» – 234, «фермент» – 580, "частица" - 32, "элементарная частица" – 102, «богиня» – 361, милиционер – 77, «быстро» – 332, «умный» – 128, «глупый» – 266, «хороший» – 304, «плохой» – 328, «избивший» (избить) – 282, «трезвый» – 38, «выпивший» (выпить) – 381, «пьяный» – 395 (кстати, известный американский государственный деятель, дипломат, учёный Бенджамин Франклин собрал около 200 синонимов слова «пьяный» (англ. Drunk), а в книге рекордов Гиннесса говорится о том, что издательство «Делакур пресс» (Нью-Йорк) опубликовало словарь, куда вошло 1224 из 2241 синонимов состояния опьянения, собранных Полом Диксоном из Гаррет-Парка (штат Мэриленд)), и т.д.

Большое количество синонимических связей в словаре-справочнике позволяет раскрыть всесторонний смысл слов. Например, в качестве синонимов слова «паранормальщина» в словаре-справочнике версии 7.1 приведены такие слова: полтергейст, пси-явление, альтернативщина, аномальщина, фричество, бесовщина, зомбовещание, массовые галлюцинации, мистика, мошенничество, сектантство, шарлатанство... А у слова «пси-явление» имеется 37 синонимов.

Отметим, что фразеологизмов, крылатых выражений, советизмов, мемов, пословиц и т.п. в словаре-справочнике около 18 тысяч.

В качестве примера «мощности», многозначности русского языка укажем на такие данные из этого словаря версии 7.1:

в русском языке, согласно словарю, имеют связи более 491407 слов и словосочетаний,
более 10 синонимов имеют 47440 слов и словосочетаний,
более 20 синонимов имеют 19422 слов и словосочетаний,
более 30 синонимов имеют 9761 слов и словосочетаний,
более 40 синонимов имеют 5443 слов и словосочетаний,
более 60 синонимов имеют 2073 слов и словосочетаний,
более 100 синонимов имеют 531 слов и словосочетаний,
более 200 синонимов имеют 124 слов и словосочетаний,
более 400 синонимов имеют 41 слов,
более 600 синонимов имеют 27 слов,
более 1000 синонимов имеют 16 слов.

Такое большое количество синонимов в данном словаре обусловлено несколькими причинами:

1. В различных словарях синонимов словарные статьи к одному и тому же слову значительно отличаются, и, по сути, они дополняют друг друга. А поскольку в электронный словарь включены слова с синонимами практически из всех известных словарей, то в данном словаре пользователь получает их объединенный вариант.

2. Механизм перекрестных ссылок, реализованный в словаре, резко увеличивает число синонимов к словам. Поясним на примере. В словарях арго одним из синонимов к слову «оттянувшийся» обычно указывают слово «отдохнувший», но отдельной словарной статьи со словом «отдохнувший» в словарях арго нет. Более того, ни в одном синонимическом словаре среди синонимов к слову «отдохнувший» мы не нашли слова «оттянувшийся». Другие примеры: «схлестнувшийся» – повздоривший, «сдавший» – «выдавший», «сдвинутый» – «ненормальный», «содравший» – «укравший», «убойный» – «замечательный» и т.д. У слов "ассистент", "помощник", "десница" в качестве синонима (толкования) в словарях приводится словосочетание "правая рука". Однако ни в одном словаре словосочетания "правая рука" нет. Электронный словарь устанавливает все возможные соответствия: синонимами в словаре могут быть не только слова и словосочетания современного общеупотребительного языка, но и устаревшие слова, просторечные, жаргонные, областные, слова профессиональной речи и т.п.

3. В письменных словарях у многих зафиксированных в словарях существительных нет соответствующих прилагательных и наоборот. В данном словаре этот недостаток в большинстве таких случаев устранён.

Предлагаемый словарь имеет несколько особенностей.

1.Отсутствие разделения омонимов, что приводит к тому, что в одной группе синонимов к слову, скажем, «стан» оказываются слова «лагерь», «блюминг» и «талия». Для развитого носителя языка это не представляет сложности, но для иностранца, желающего углубиться в недра русского языка, отсутствие разделения омонимов будет, конечно, представлять сложности. Это несколько ограничивает возможности применения текущей версии словаря в системах компьютерной (автоматической) обработки русских текстов. Для того же «стана» правильно было бы иметь несколько словарных статей, например:

Стан 1 => блюминг, трубопрокатник, листопрокатник, ...
Стан 2 => становище, стойбище, станица, бивуак, лагерь, ...
Стан 3 => торс, талия, поясница, ...
В будущих версиях словаря, возможно, такое разделение будет предусмотрено, и словарь будет состоять из синонимических групп, связанных с некоторыми «понятиями», для которых останется или дать определения из толковых словарей, или выбрать среди синонимов группы так называемую «точку входа», то есть слово, наиболее точно (строго) обозначающее понятие, объединяющее данные синонимы.

2.Отсутствие разделения синонимических и родо-видовых связей. Родо-видовые (цело-частные) отношения – это, вообще говоря, предмет тезаурусов. Синонимическое отношение - это отношение эквивалентности, которое разбивает все слова на классы эквивалентности. А родо-видовое отношение - отношение частичного порядка. В идеале должна быть вкладка для синонимов, для родительских терминов и для дочерних. Такое разделение также планируется произвести в программе словаря после завершения работы над его пополнением.

3.Отнесение слова в словаре к какой-либо лексико-грамматической категории (группы частей речи) чисто условно, что объясняется прикладным характером словаря. Слова в версии 7.1 условно распределены на четыре группы:

    1. Существительные, числительные, местоимения - 278190.

    2. Прилагательные, причастия, глаголы, деепричастия - 301978.

    3. Наречия, сравнительные степени, сращения - 37729.

    4. Частицы, предлоги, междометия и др. - 1298.

Если слово может выступать в роли разных частей речи (омоформы), то оно отнесено к той, в форме которой наиболее часто встречается. Фразеологические и синтаксические синонимы, не определяемые вообще морфологически (как словосочетания), приписаны к части речи того слова, к которому эти фразеологические и синтаксические синонимы привязаны. В словаре версии 8.3 имеется 5 групп частей речи (в отдельные группы выделены прилагательные и фразеологизмы, в которые ошибочно попали некоторое количество обычных слов, а 3-я и 4-ая группы из версии 6.* объединены), которые на экран для слов не выводятся, а даны только в запросе и справке по запросу. Часть речи используется для ускорения поиска нужных слов и лингвистических исследований. Замечу, что часть речи не приводится и во многих книжных словарях.

4.В словах специально-технического лексикона буква ё заменена на букву е, в обрабатываемых системой ASIS® материалах буква ё заменена также на букву е, поэтому в таких словах эта замена в ранних версиях словаря-справочника сделана. В последних версиях словаря-справочника слова с буквой ё имеются, а единственным синонимом к ним служат такие же слова с заменой буквы ё на букву е. Всего слов и выражений с буквой ё в словаре имеется 26424, в основном из словаря Т.Ф. Ефремовой, академических словарей (последним отдавалось предпочтение в случае разночтений), других источников; в частности, использовались запросы из данной же словарной базы по фрагментам слов с имеющейся буквой ё с последующим анализом найденных слов. Это значительно прибавило число слов с буквой ё из специальных словарей, например технических, где буква ё, к сожалению, обычно игнорируется.

5. Нет знаков ударений в словах.

6. Отсутствуют пометы: устарелое, просторечное, областное и т.п.

7. Частично уточнена орфография касательно «бесов», поврежденная в 1918 году, а именно, наряду со словами бесчестный, бестолковый, бессовестный и т.п. введены в словарь и слова безчестный, безтолковый, безсовестный и т.п. [книга «Жизнь происходит», изд-во «Студия», Москва, 2009]. Хорошо хоть этим бесам не удался планируемый ими перевод русского языка с кириллицы на латиницу!

8. Глаголы представлены не в одной нейтральной форме, а в нескольких наиболее часто используемых причастных и деепричастных формах (условно помечены в качестве прилагательных), как они представлены и в Русском орфографическом словаре РАН под редакцией В.В. Лопатина и О.Е. Ивановой.

Однако устарелые, просторечные, жаргонные глаголы – только, как правило, в одной. 

Перечисленные особенности возникли из специфики и целевого назначения первоначального словаря, заключающихся в распознавании близких по смыслу именных словосочетаний в прикладной компьютерной системе ASIS®. На использование словаря в практической работе с текстами и документами отмеченные особенности не влияют. 

Понятие «синоним» используется в расширенном смысле. Нас интересует в первую очередь, являются ли взаимозаменяемыми конкретные слова в именных словосочетаниях (с сохранением хотя бы частично их смысла) или нет. Иначе говоря, улучшит ли установление синонимической связи между двумя конкретными словами качество распознавания смысла именных словосочетаний или нет при компьютерной обработке словосочетаний. А является ли данное слово точным синонимом другого слова или только смежно ему по смыслу (то, о чем часто спорят филологи) нас интересует во вторую очередь. 

Замечание. Если устранить дублирование слов с буквой «ё», глаголов в различных формах, а также толковательные словосочетания, то уникальных слов в словаре версии 7.1 останется не менее 455 тысяч, а вовсе не 200 тысяч, как ошибочно указано на популярном филологическом портале Philology.ru, (см. http://www.philology.ru/links.htm).

Отмечу, что в самом полном словаре английского языка Уэбстера имеется 425-450 тыс. слов и словосочетаний, число же уникальных слов и синонимических связей в английском языке мне неизвестно.

2. Устройство словаря.

Экран компьютера разделен на две части (панели), размеры которых можно регулировать с помощью мыши.

На экране слева помещены слова в порядке алфавита вместе с указанием части речи и числа синонимов. Справа в порядке алфавита перечислены синонимы к тому слову на левой панели, на котором стоит курсор. К словам-синонимам на правой панели также указаны части речи и число синонимов.

Любой синоним (поясняющее слово) к конкретному слову имеет, в свою очередь, также синонимы (поясняющие слова). Для их просмотра достаточно в поле «наименование» правой панели сделать двойной клик левой клавишей мыши на выбранном синониме. При этом выбранное слово переходит из правой панели в левую.

Для удаления синонимов (толкований) нужно выделить слово в списке синонимов (толкований), а затем нажать кнопку со знаком минус из меню.

3. Поиск слов.

Простейший поиск слов выполняется по совпадению начального фрагмента слова с поисковым выражением. Для получения статистической информации и анализа структуры словарного фонда русского языка в систему добавлена возможность получения выборок по запросам.

В данном электронном словаре можно осуществлять практически любые запросы к словарной базе. В нём можно искать искомое слово по маске слова (включающей известные буквы и условные символы, обозначающие произвольную букву, произвольное число произвольных букв и т.п. – версии 8.3), а также по его синониму или обобщённому понятию.

Для каждого слова  отображаются синонимы всех его смысловых значений и слова, связанные с ним родо-видовым отношением как с определяющим, так и с обобщающим понятием.

Для лиц, нуждающихся только в простых запросах, предлагается «Построитель запросов» (версия 8.3) – аналог системы запросов версии 7.0. В качестве параметров «Построителя запросов» используются:

- начало слова,
- фрагмент слова,
- окончание слова,
- часть речи,
- количество синонимических связей слова,
- количество символов в слове.

При сложных запросах можно осуществлять поиск по комбинации параметров.

Существующие онлайн и электронные словари делать такие запросы не позволяют.

Отобранный список выдается на экран, упорядоченным по алфавиту, по числу синонимов и т.д. 

Например. Запрос по фрагменту «вита» (слово «вита» в переводе с латинского означает «жизнь») в версии 7.1 словаря-справочника даст 360 слова, а запрос с флексией «метрия» (от греческого слова «метрео» – «измеряю») выдаст список из названий 573 дисциплин, в которых что-то меряют, а запрос с флексией «логия» (от греческого слова «логос» — слово, учение) выдаст список из названий 1411 научных и квазинаучных дисциплин. Замечу, что в «Советском энциклопедическом словаре» (4-е изд., 1990) содержится только около 200 статей о науках, направлениях и квазинауках, включающих в название элемент «-логия», которые перечислены и в Википедии, см. http://ru.wikipedia.org/wiki/-%EB%EE%E3%E8%FF.

4. Алгоритм поиска близких по смыслу наименований объектов в системе ASIS®.

   Наименования объектов представляют собой именные словосочетания, содержащие главное слово и несколько уточняющих слов. Например, "станок настольно-сверлильный 2М-112", "вертикально-фрезерный станок", "холодильная установка 24 МКТ 280". Предполагается, что в наименовании всегда есть одно главное слово, которое находится в именительном падеже в единственном или множественном числе. Алгоритм поиска близких по смыслу наименований начинается с выделения главного слова и всех его синонимов. Затем выделяются уточняющие слова и составляются списки их синонимов. Поиск близких по смыслу наименований производится в базе наименований и начинается с выделения всех наименований, имеющих главное слово, совпадающее с главным словом входного наименования или его синонимом. Для каждого из отобранных наименований рассчитывается значение критерия близости. Критерий является суммой экспериментально подобранных весовых коэффициентов для главного и уточняющих слов. Например, главное слово имеет вес 1, синоним главного слова 0.9, уточняющее слово 0.8, синоним уточняющего слова 0.7, а, допустим, наименование марки изделия - 2.5. Все наименования-кандидаты упорядочиваются в порядке убывания значения критерия и в таком виде предлагаются пользователю для окончательного выбора.
   В системе ASIS® поиск близких по смыслу наименований производится в базах аналогов машин и оборудования, а также классификатора ОКОФ.

   Для ускорения поиска предварительно выполняется разбор всех наименований в каждой базе аналогов. Результаты этого разбора хранятся в специальных файлах и содержат не сами слова, а их коды в виде ссылок на записи словаря слов системы ASIS®. Аналогичный файл результатов разбора составляется и для наименований классов классификатора ОКОФ.

5. В заключение о мощности русского языка.

Автор надеется достичь примерно 750 тыс. слов и словосочетаний в словаре-справочнике примерно к 2022 году (напомню, что сокращения в словарь, как правило, не входят) и 2500 тыс. связей.

Именно выявление этих цифр для русского языка, наряду с установлением всех синонимических и квазисинонимических связей в словаре, было одной из главных задач при разработке данного словаря-справочника. 

Отмечу, что в самом полном печатном словаре английского языка Уэбстера имеется 425-450 тыс. слов и словосочетаний, число же синонимических связей в английском языке мне неизвестно. В электронной версии Оксфордского словаря английского языка (над которой в настоящее время работают около 80 специалистов), см. http://www.oed.com/, http://dic.academic.ru/dic.nsf/ruwiki/212818, имеется около 600 тыс. слов и словосочетаний. Словарь включает все слова, бытующие или бытовавшие в английском литературном и разговорном языке начиная с 1150 года. Онлайн-версию Оксфордского словаря намечают выпустить в 2017 году.

Имеется две онлайн-версии словаря английского языка Уэбстера, в которых быстро выдаётся то, что мы понимаем под синонимами, синонимическими связями (Related Words):

1) http://www.merriam-webster.com/ (примерно на 600 тыс. слов и словосочетаний);

2) Разработка Принстонского университета http://www.webster-dictionary.org/definition/irrelevant (примерно на 240 тыс. слов и словосочетаний) c фонетическими транскрипциями слов, их звучанием, переводом на другие европейские языки.

Поиск слов в обеих онлайн-словарях осуществляется только по началу слова.

Я же не планирую водить в данный словарь-справочник слова из «Словаря русского языка XI–XVII веков» (с 1975 по настоящее время выпущено 30 томов. Работа над изданием продолжается).

Приводящиеся же в популяризаторских книгах данные о суммарном количестве слов (само определение которых довольно расплывчаты либо вообще не даны) в различных языках, как правило, голословны и документально не подтверждаются их авторами (см., например, книгу «Рекорды Гиннесса»).

Ещё примеры: в статье д.псх.н. Орехова А. Н. и Орехова С. А. «Культурно обусловленные значения и личностные смыслы в Компьютерной Психике», http://it.mgppu.ru/confnc2014/program_NKP_2014.pdf , утверждается, что в русском языке более 2 млн. слов; а американский лингвист М. Н. Эпштейн наоборот утверждает, что «словарный фонд русского языка <…> составляет всего около 40 тысяч. Для языка многомиллионного народа, занимающего седьмую часть земной суши, живущего большой исторической жизнью и воздействующего на судьбы человечества, это удручающе мало», см. http://magazines.russ.ru/znamia/2006/1/ep13-pr.html.

А в интервью «Любовь на «ять», или как воскресить Великий и Могучий» (2002 г.), см. http://gkatsov.com/interview_Epshteyn.htm, М. Н. Эпштейн утверждает, что «у Даля приводится более 150 слов с корнем «люб», в современном же словаре их можно найти только сорок. А ведь для каждой национальной культуры тема любви имеет основополагающее значение и по языку можно судить, насколько Россия «безлюбовная страна». Так, Цветаева писала, что по-русски «любовник» – это грубо и откровенно, «возлюбленный» – слишком высокопарно, «друг» – неопределенно: безлюбовная, делает вывод Цветаева, страна».

Замечу, что Цветаева также писала «Вся моя жизнь – роман с собственной душой…» (из письма к Юркевичу П.И., 1916), - т.е. я ничего и никого, кроме себя, не люблю…

Однако запрос в словаре-справочнике версии 7.1 по фрагменту «люб» дает 1573 слов и словосочетаний, из которых 920 слов и 653 словосочетаний, а вовсе не 40, как утверждает профессор.

Вот такая «безлюбовная страна», и вот такая американская русистика!

Метод хулителей России прост: сначала целенаправленно возводят в статус национального мыслителя часто нездоровых людей, а затем используют высказывания этих «гениев» для своих целей, замалчивая при этом настоящих творцов. В различных областях культуры, социальных науках и недонауках руководители соответствующих групп информационного влияния пытаются назначить своих «наше (их) всё». 

Например, 25 июля в день смерти В. А. Высоцкого по всем основным телеканалам идут о нём передачи, и ни слова о великом В. М.  Шукшине, который родился в этот день. При этом книга воспоминаний П. Л. Леонидова «Высоцкий и другие» (Нью-Йорк, 1983), в которой приводятся их доверительные разговоры о России, в России практически не известна, нет её и в Интернете, в котором якобы цензуры нет. Однако, как пишет А. Н. Васин-Макаров, «во второй половине XX века или механизм заржавел, или деятели помельчали, но попытки  подсадить Бродского или Высоцкого в кресло Самого-Самого кончилось конфузом» [12].

Другим методом хулителей является приписывание настоящим русским гениям своих подделок. Например, стихотворение «Прощай немытая Россия, страна рабов, страна господ…» не принадлежит сверхгению М. Ю. Лермонтову, как это было убедительно доказано в литературоведческих работах В. С. Бушина (1989 г.), Г. Е. Клеченова (1994), А. А. Кутыревой (2004-2006),члена-корреспондента РАН Н. Н. Скатова (2004), М. Д. Эльзона (2004), В. В. Хатюшина (2010), П. Краснова (2011), С. А. Сокурова (2011), В. Г. Бондаренко (2012) и др. Однако специализирующиеся на русофобстве социальные инженеры («инженеры человеческих душ») продолжают, как ни в чём не бывало, вбивать в массовое сознание эту ложь.

И жертв с перекошенными мозгами межцивилизационной информационной войны [13] немало.

Если в Яндексе задать запрос с началом этого известного русофобского стихотворения «Прощай немытая Россия», то именно русофобские статьи с упоминанием его якобы автора Лермонтова будут выданы на первых страницах, а данная статья, где приведён вышеуказанный список ученых-литературоведов, убедительно опровергнувших подделку, вообще оказывается исключённой из списка выдачи по данному запросу. Более того, если к названию самой статьи «Тришин Мощь русского языка…» в запросе добавить «немытую Россию», то сама данная статья перестаёт выдаваться по запросу. То есть налицо ручная коррекция «иванов непомнящих родства» (специалистов по дезинформации) из этой компании с немалыми окладами результатов выдачи по культурным, политико-мировоззренческим запросам.

Приведу другие данные о русском языке:
«Школьники, знающие русский язык, имеют больше шансов достичь успехов в образовании, чем те, кто не владеет языком Пушкина и Достоевского. К такому выводу, как сообщает сегодня газета Middle-East Times, пришли исследователи из университета израильского города Хайфа. Овладение навыками чтения и письма на русском языке в дошкольный период дает ученикам школ значительное преимущество в овладении знаниями, утверждает профессор Мила Шварц», см. статью «Израильские учёные открыли силу русского языка», газета «Известия» от 18 мая 2007 года, http://izvestia.ru/news/399807.

И люди, хорошо владеющие русским языком (особенно исконные носители), обладают богатейшей фантазией (т.е. способны творчески мыслить), в частности это связано, конечно, с многовариантностью, многозначностью, синонимией и пр.

А мощь, богатство языка определяется, на мой взгляд, объёмом его словаря, а также его морфологической и синтаксической гибкостью.

Заметим, что в замечательной книге Льва Успенского «Слово о словах» (1971 г., 5-е издание) отмечается, что, «Сотрудники словарного отдела (Института языкознания в Ленинграде) полагают, что ими зарегистрировано около 400 – 500 тысяч разных русских слов. Вероятно, в коллекции есть пропуски (она и сейчас непрерывно пополняется), но, в общем, цифра эта близка к исчерпывающей».

Кроме того, поэт Е. А. Евтушенко, сравнивая русский и английский языки, высказал мнение, что «в английском нет столько рифм, сколько у нас и приходится рифмованный стих в связи с израсходованностью рифм на английский переводить без рифмы», см. http://www.echo.msk.ru/programs/beseda/43457/.

По мнению писателя Саши Соколова: «Английский не так пластичен, не обладает свободой русского — Тургенев был совершенно прав. Русский инверсивен, фраза строится без всяких там… Всё можно переиначить, начать с любого слова. А в английском нельзя слишком вольничать. Ещё русский народ каким-то образом — может, в силу лености своей? — избавился от частиц и артиклей. Лишнего в языке нет. Насколько загадочней получается язык, когда убирается артикль! Ты говоришь не об одном предмете, а о целом их ряде. Я говорил и с австрийскими, и с немецкими филологами о русском языке. Они такие аккуратисты, их раздражает и коробит в русском неопределённость, размытость описаний, диалогов. А мне это очень легло на душу. У народа, который никогда не стремился к внешней свободе, есть внутренняя, даже какая-то анархия. По тому, как устроен язык, можно судить о народе, о степени его изобретательности», см. http://www.chaskor.ru/article/sasha_sokolov_sily_eshche_est_grebu_ya_horosho_11971 .

Таким образом, с помощью языка человек познаёт мир, и от языка зависит, как именно человек познаёт, видит мир и как он мыслит. Именно язык народа во многом определяет менталитет народа, его национальные ценности и особенности наряду с религией, территорией обитания и т.д.

В следующей версии электронного словаря версии 8.4 для облегчения изучения работы программы пользователями-иностранцами (осваивающих русский язык) планируется дополнительно переписать интерфейс программы и встроенное руководство пользователя на 7-9 иностранных языках (английском, французском, немецком, испанском и др.), с тем чтобы в зависимости от установленного при загрузке компьютера языка, этот же язык выбирался для интерфейса и встроенного руководства словаря-справочника. Скриншот готового словаря на 4-е языка приведён в Приложении.

Ссылки на синонимы в словаре начиная с версии 6.1 закодированы в качестве защиты от недобросовестных пользователей, а таких в Интернете немало, разместивших его на своих сайтах в своих программных оболочках без указания автора. Например, если поискать в Google ошибочное словосочетание «без возграждения» (вместо «без вознаграждения») - будет 576 ссылок (на дату 31.08.2015). Эта ошибка была допущена в размещенной на нашем сайте до 2010 года незашифрованной версии словаря. Не случайно ни количество слов, ни количество синонимов в этих словарях не указано. Длины записи в этих словарях ограничены 50 символами, а толкования обрезаны в тех же местах, как и в старой открытой версии данного словаря-справочника. А все опечатки в старой версии словаря-справочника перешли в эти словари. Не случайно ни количество слов, ни количество синонимов в этих вторичных словарях не указаны (см., например, ссылки на пять анонимных синонимических словаря в анонимной же статье "СИНОНИМЫ" в Википедии).

Цель большинства этих «лексикографов» - увеличить число посетителей своих сайтов с размещённым «слямзенным» словарём, с помощью которых они зарабатывают деньги на рекламе различных товаров и услуг.

В заключение укажем данные по другим словарям русского языка, упоминаемым в Википедии как якобы крупнейшие по составу словника:

  • Толковый словарь живого великорусского языка (Даль) — ок. 200 000 слов.
  • Сводный словарь современной русской лексики — ок. 170 000 слов.
  • Русский орфографический словарь (Лопатин) — ок. 200 000 слов.
  • Словообразовательный словарь русского языка (Тихонов) — ок. 145 000 слов.
  • Словарь современного русского литературного языка (большой академический словарь) — ок. 120 000 слов.
  • Большой толковый словарь русского языка (Кузнецов) — ок. 130 000 слов.
  • Современный толковый словарь русского языка, в 3-х томах (Ефремова) — ок. 160 000 слов.

Автор словаря награжден за его создание несколькими общественными наградами.

6. Выводы.

  1. Наличие такого словаря практически доказывает, что русский язык является одним из самых мощных языков мира.

  2. На сегодняшний день данный словарь, реализованный в виде компьютерной базы данных, является самым большим словарём русского языка как по количеству слов, так и по количеству синонимических связей.

  3. Он пополнялся вручную около 20 лет его автором на основе как изданных словарей, справочников и энциклопедий, так и других источников (газет, журналов, Интернет и др.).

  4. Этот компьютерный словарь позволяет производить практически любые запросы к словарному составу и осуществлять различные лингвистические эксперименты. 

Литература

1. Волконский А. М. Историческая правда и украинофильская пропаганда, 1920 (переиздание 2005), http://refeteka.ru/r-165016.html.

2. Линниченко И. А. «Труды подготовительной по национальным делам комиссии. Малорусский отдел». – Одесса: тип. Изд. «Русская культура», 1919. – Вып. 1: Сборник статей по малорусскому вопросу. – 119 стр.

3. Флоринский Т. Д. «Лекция по славянскому языкознанию», ч. 1, Киев, 1895, ч. 2, СПБ, 1896.

4. Ляпунов Б .М. «Единство русского языка в его наречиях». – Одесса, 1919.

5. Будилович А. С. «О единстве русского народа». – СПб., 1907.

6. Троицкий В. Ю. «Наследие русского слова и судьба народа» (полный текст доклада на конференции в Луганске (2010 г.), http://www.hrono.ru/proekty/parus/troic0611.php.

7. Тришин В. Н. О причинах и последствиях занижения стоимости основных средств российских предприятий по международным и российским стандартам бухгалтерского учета. Система ASIS® как инструмент решения этой проблемы // "Московский оценщик", 2007, N5(48), C. 18-29, http://trishin.ru/left/asis/.

8. Голубицкий С. М. «Побочный продукт», компьютерный еженедельник «Компьютерра», №26-27, 2004, http://offline.computerra.ru/2004/550/34752/.

9. Голубицкий С. М. «Морфинг», компьютерный еженедельник «Компьютерра», №29-30, 2004.

10. Костырко С. П. «WWW-обозрение», журнал «Новый мир», №9, 2005.

11. Тришин В. Н. «Электронный словарь-справочник синонимов русского языка системы ASIS» в книге «Владимир Даль в счастливом доме на Пресне», М.: изд-во «Academia», 2010, стр. 158-165.

12. Васин-Макаров А. Н. «Читаю Лермонтова», издание пятое, дополненное и уточнённое. - М.: Студия, 2015. – 248 с., http://www.studia-vasin.ru/izdatelstvo-studiya/117-izdatelstvo-studiya-knigi/1084-aleksandr-vasin-ma...

13. Хантингтон С. «Столкновение цивилизаций», М.: ООО «Издательство АСТ», 2003. – 603 стр.

14. Доклад Сергея Глазьева: «О неотложных мерах по отражению угроз существованию России» в Межведомственной комиссии Совета безопасности РФ 15.09.2015, http://www.business-gazeta.ru/article/140998/

References

1. Volkonskij A. M. Historical truth and ukrainophil propaganda, 1920 (re-edition 2005), http://refeteka.ru/r-165016.html.

2. Leennichenko I. A. Tractates of preparatory commission for national issues. Little Russian Department. – Odes­sa: tip. Izd. «Russkaya kultura», 1919. – Vyp. 1: Sbornik statej po malorusskomu voprosu. – 119 str.

3. Florinskij T. D. Lecture on Slavonic linguistics, part 1, Kiev, 1895, part 2 SPB, 1896.

4. Lyapunov B. M. Unity of the Russian language is in its adverbs. – Odessa, 1919.

5. Budilovich A. S. About the unity of Russian nation. – SPb., 1907.

6. Troitsky V. Y. Heritage of the Russian Word and Destiny of the Nation (full text of the report made at Lugansk Conference (2010), http://www.hrono.info/proekty/parus/troic0611.php

7. Trishin V. N. About reasons and consequences of the undervaluation fixed assets of the Russian enterprises according to the international and Russian accounting standards. System ASIS as the instrument for resolving this problem. // "Moscow appraiser", 2007, N5(48), C. 18-29, http://trishin.ru/left/asis/.

8. Golubickij S. M. Lateral discharge. // Kompyuternyj ezhenedelnik «Kompyuterra», № 26–27, 2004, http://offline.computerra.ru/2004/550/34752.

9. Golubickij S. M. Morphing. // Kompyuternyj ezhenedelnik «Kompyuterra», № 29–30, 2004.

10. Kostyrko S. P. WWW-review. // «Novyj mir», №9, 2005.

11. Trishin V. N. Electronic dictionary of synonyms in Russian language by ASIS system.// Vladimir Dal v schastlivom dome na Presne, M.: izd-vo «Academia», 2010, str. 158–165.

12. Vasin-Makarov A. N. “Reading Lermontov”, the 5th edition, additional and specified. M.: STUDIO, 2015. – 248 pages, http://www.studia-vasin.ru/izdatelstvo-studiya/117-izdatelstvo-studiya-knigi/1084-aleksandr-vasin-ma...

13. Huntington Samuel P. The Clash of Civilizations and the Remaking of World Order (1996).

14. The report of Sergey Glazyev: "Оn urgent measures to meet threats to the existence of Russia" in the Interdepartmental Commission of the RF Security Council 15.09.2015, http://www.business-gazeta.ru/article/140998/.

Приложение 1.

А) Скриншот словаря-справочника версии 6.8 на Fox Pro

Б) Скриншот словаря-справочника версии 8.3 (8.4) на С# с интерфейсом и помощью на 4-х языках

Приложение 2.

Доктор филологических наук Татьяна Леонидовна Миронова:

«Как легче всего ослабить, обескровить народ? Ответ прост и проверен веками. Чтобы ослабить народ – его надо раздробить, раскроить на куски и убедить образовавшиеся части, что они есть отдельные, самостийные, сами по себе, даже враждебные части. В истории известны разделения сербов – на сербов, хорватов, боснийцев, чергогорцев; дробление немцев на австрийцев и немцев… Эти разделения сопровождались государственным дроблением и ослаблением мощи великих европейских народов. Горький опыт разделения нации имеем и мы, русские. В середине XIX века мы беспечно приняли <…> идею дробления русских на три самостоятельных «народа» русских, украинцев и белорусов. Новоиспеченным народам – украинцам и белорусам – стали спешно создавать отдельную от русского народа историю. В самостийных украинских учебниках 20-х годов XX века украинцы повели свое происхождение от «древних укров». Украинцам и белорусам изготовили собственные литературные языки – украинский и белорусский, которые подражали польским литературным моделям, хотя в ту пору малорусское и белорусское наречия русского языка, именно так они именуются в словаре В. И. Даля, отличались от русского литературного языка, как диалекты Смоленщины или Вологодчины <…>.

Зачем же было дробить единый русский народ, рушить его целостность? На территории Австрии в XIX веке жило много православных славян, именовавших себя русскими или русинами. Будучи подданными австрийского императора, они сознавали свою причастность к русскому народу, что очень беспокоило австрийскую власть. <…> Австриякам на своих землях да и полякам, чьи территории входили в то время в состав Российской империи и тоже были густо населены русскими, нужно было избавиться от русской «пятой колоны» в собственных пределах. И работа закипела. Идея переделывания русских в «щирых украинцев» была щедро профинансирована австрийским правительством. Во Львове, входившем тогда в состав Австрии, историк М. С. Грушевский сочинил «Историю Украины-Руси» <…>

Согласно исследованиям академика О. Н. Трубачева, название Великороссия никакого самовозвеличивания перед другими странами, другими народами не выражает. Как слово Великобритания образует пару с материковой Бретанью – древнейшая колонизация острова шла оттуда, так имя Великая Русь образует пару с именем Русь, прежде в глубокой древности, обозначавшим область Киева, откуда шло освоение русскими земель к северу и востоку. Это типичный случай называния колонизованных земель термином Великий, так в истории известны не только Великобритания, но и Великая Греция, Великопольша и Великая Моравия, все эти территории когда-то были освоены из материковых очагов – Бретани, Греции, Польши и Моравии. Вот почему рядом с Русью Великой появилась Русь Малая – Малороссия, название малая, подобно нынешнему малая Родина, всегда имело смысл Руси изначальной, материнского очага, вокруг которого образовалась Великая Русь.

<…> указывает на древнее единение русского народа и название Белая Русь – Белоруссия. Это имя, как показали исследования академика О. Н. Трубачева, является частью древней системы цветообозначения сторон света. В этой системе северная часть страны обычно именовалась черной (и в истории сохранилось наименование северо-западной части Руси Черная Русь) красным цветом (по древнерусски червонным) обозначалась южная часть страны (в летописях известна Червонная Русь), а белой именовалась западная часть Руси. В системе древнего цветообозначения сторон света, согласно реконструкции, было и название для восточной стороны – Синяя или Голубая Русь. Но ее следов в письменной истории не обнаружено. А вот сохранившееся до сего дня имя Белая Русь показывает, что это всего лишь западная часть великой Русской земли, часть целого, а не нечто обособленное и независимое. <…>

Русские, украинцы и белорусы – суть один народ, ибо рождены из одного русского корня, единокровные братья и братья по Вере. Наречия украинское (малорусское), белорусское и великорусское произошли из единого древнерусского языка и отличаются друг от друга меньше, чем немецкие диалекты между собой. Потому и русским, и украинцам, и белорусам, помня наше родство, надо уметь пренебрегать ухищрениям врагов русского единства и русской силы, пытающихся нас разделять и ссорить. Формула нашего национального разделения, универсально высказанная в завещании польского русофоба Мерошевского <…>: “Бросим огня и бомбы за Днепр и Дон, в самое сердце Руси, возбудим ссоры в самом русском народе, пусть он разрывает себя собственными ногтями. По мере того, как он ослабляется, мы крепнем и растем”.».

Приложение 3. Возможные варианты коммерческой реализации словаря-справочника.

1) Переписывание имеющихся электронных версий словаря-справочника в более современные зашифрованные (как для слов, так и для синонимических связей) версии под Windows с улучшенным дизайном, быстрой и легкой установкой словаря, документацией и т.п. для их коммерческого распространения как в интернет-магазинах, так и на дисках.

2) Создание полного аналога словаря для платформы Mac OS.

3) Создание интернетовской версии словаря со всеми поисковыми возможностями версии на Fox Pro. Этот вариант словаря можно будет предложить для использования в интернет-поисковике для рекламы самого поисковика, а также для улучшения качества поиска информации и в качестве подсказчика слов. 

Также эта онлайн-программа может заинтересовать любую другую компанию с большим числом клиентов в качестве рекламы на их сайте (Евросеть, Связной и т.п.).

4) Создание версий словаря под мобильные устройства для iOS и Android (в первую очередь для планшетников) и коммерческое их распространение.

Справка.

Всего в России было продано 7.2 миллиона планшетов общей стоимостью 81.4 миллиарда рублей (к 2014 году), http://www.vladtime.ru/computers/353267-obem-prodazh-planshetov-v-rf-za-2013-god-vyros-na-125.html

Количество смартфонов, проданных в России в 2013 г., достигло 19,7 млн — на 54,2% больше, чем в 2012 г, см. http://www.vestifinance.ru/articles/41276.

5) Указом Президента РФ В. В. Путина от 09.06.2014 создан президентский Совет по русскому языку. Новый орган, в состав которого вошли как ученые, так и руководители СМИ, должен "защищать" язык и продвигать его за рубежом.

Как говорится в документе, совет является консультативным органом при президенте России. Его задачи — совершенствование госполитики "в области развития, защиты и поддержки русского языка", а также координация работы госорганов, научных и культурных организаций. Кроме того, совет должен заниматься "укреплением позиций русского языка в мире, расширением географии и сфер его применения, поддержкой русскоязычных сообществ за рубежом".

Работа по словарю лежит в русле этого постановления.

В следующей версии электронного словаря версии 8.4 на C# для облегчения изучения работы программы пользователями-иностранцами (осваивающих русский язык) планируется дополнительно переписать интерфейс программы и встроенное руководство пользователя на 7-9 иностранных языках (английском, французском, немецком, испанском и др.), с тем, чтобы в зависимости от установленного при загрузке компьютера языка, этот же язык выбирался для интерфейса и встроенного руководства словаря-справочника.

6) Словарь-справочник удобен и необходим при реализации интеллектуального поиска информации в различных корпоративных системах (структура его словарной базы на языке Fox Pro, в которой кроме слов имеются их основы и коды одного из 19 эталонных слов для указания всех склонений или спряжений слова, проектировалась именно для таких задач).

7) Программа словаря-справочника может послужить хорошим массовым рекламным продуктом для фирмы-изготовителя коммерческих версий словаря путём помещения в программу словаря рекламы других своих наукоемких программных продуктов.

8) Словарь в полностью зашифрованном виде можно разместить в Сети на отдельном сервере или с использованием надёжного "облачного" сервиса с защитой от "выкачки" всего его содержимого. Доступ к словарю мог бы осуществляться через API (Application Programming Interface - Интерфейс Прикладного Программирования), с регистрацией пользователей и продажей ключей доступа на основе той или иной ценовой модели: подписка, квота на количество запросов или что-то ещё. Это откроет возможности использования словаря программами-роботами, которые могут создаваться подписчиками сервиса для различных целей. Одним из вариантов использования может быть интеграция с системой "Антиплагиат", используемой Российской Национальной Библиотекой для проверки оригинальности текстов диссертаций, или подобными ей (для профессиональных журналов, СМИ и др.); другой вариант использования - встраивание в национальные поисковые системы различных стран (Китай, Индия, Бразилия, США, Россия и др.), в которых обработка запросов пользователей должна осуществляться не только на национальном языке, но и на других языках; третий вариант использования - системы автоматического перевода с учётом синонимии (интегрированные с поисковыми системами, как Google Translate - либо с иными информационными продуктами и сервисами); четвёртый вариант использования - поддержка различных приложений для мобильных устройств с сетевыми запросами к словарю по мере необходимости. Доступ к словарю через API - это современный и наиболее гибкий способ публикации, со множеством различных вариантов использования в соответствии с потребностями конкретного пользователя; гибкость в выборе ценовой модели в зависимости от категории и потребностей пользователя также является привлекательной.

Есть и другие бизнес-идеи.

Автор готов передать эксклюзивные права на словарь-справочник компьютерной компании, готовой взяться за изготовление коммерческих версий словаря и их продажу.

Отзывы на словарь с сайта автора.

Продолжение статьи...