Благосостояние народа, устойчивость государственной экономики и безопасность государства во многом зависят от управляемости всей инфраструктуры государства.
Системы управления в государстве, обществе являются такими информационными системами, в которых решающую роль имеет человеческий фактор, так как это общественные информационные системы.
Мы живем в такое время, когда существуют не только прямые, но и косвенные системы управления в обществе, которые подчас имеют большую силу, чем прямые. Это, прежде всего, средства массовой информации, среди которых в последние годы стал доминирующим Интернет, а “бумажные” СМИ всё более и более теряют свои позиции в силу архаичности своих технологий.
Сами по себе СМИ являются лишь средством, то есть промежуточным звеном в системе управления, а реальной управляющей силой являются владельцы СМИ – прямые и косвенные.
Реальностью является тенденция стремительного смещения “центра тяжести” управления обществом в сторону глобальных и косвенных сил, что ведет к ликвидации монополии госуправления обществом и падению стабильности обществ и государств, которое особенно ярко проявилось в последних событиях Арабского мира.
Под косвенными, скрытыми силами понимается весь ансамбль агентов влияния в обществе, не проявляющий и не декларирующий себя:
Сегодня именно Интернет является одним из самых мощных средств косвенного управления обществом. Осуществляется это не только прямыми способами пропаганды, но и такими, о которых неспециалистам в области информационных технологий неизвестно. Именно об этом пойдет речь в настоящем докладе, а также о том, что и как предпринять для обеспечения информационной безопасности, устойчивости общества и независимости страны.
Прежде всего, необходимо сказать пару слов о самом Интернете и той эпохе, в которой мы живем. Сегодня общественные отношения переживают резкую коренную ломку, перестройку под воздействием новых информационных технологий. Сейчас происходит не только пассивное получение какой-то информации (и дезинформации) из Интернета, но интенсивное интерактивное взаимодействие пользователей для целей производства, торговли, политики, общения. Число пользователей Интернет стремительно растет, и сегодня составляет почти 40% всего населения.
Вследствие чудовищного, необозримого вручную объема накопленной информации в Интернете подавляющая часть информации сегодня находится пользователями путем использования поисковых систем. Поэтому поисковые системы являются ядром сети Интернет и основой Интернет - технологий.
Сами поисковые системы, как это хорошо известно специалистам, представляют собой совокупность аппаратных и программных средств управляющих потоками данных в глобальной сети.
Они являются своеобразными банкирами, того банков данных, которые накопило всё человечество, и которые находятся на действующих информационных ресурсах Интернет, то есть веб-сайтах, файлохранилищах, сетевых базах данных.
Для осуществления своей базовой функции – облегчения поиска нужной информации, - поисковые системы занимаются информационной разведкой в сети, сортировкой, индексированием и накоплением информации о ресурсах Интернет. Благодаря тому, что все данные автоматически сортируются, и их ключевые параметры записываются в специальных индексных таблицах, с помощью систем управления базами данных (СУБД) поисковой системы возможно за малый промежуток времени, не превосходящий секунды, показать пользователю гиперссылки на искомые источники информации в сети Интернет и их аннотации, упорядоченные по некому критерию релевантности, т о есть соответствия запросу пользователя.
При этом СУБД поисковой системы не производит поиск по сети Интернет, но только поиск по своим индексным файлам, сформированным заранее и имеющим размеры на много порядков меньшие, нежели сами первичные источники данных. Это возможно благодаря подготовительной работе специальных разведывательных программ, называемых в зависимости от их интеллектуального уровня агентами (agents), пауками (спайдерами – spiders), ползунами (краулерами – crawlers), роботами (robots), ботами (от слова робот) и т.д.
Данные программы расположены на специальных хостах поисковых систем и занимаются сканированием интернет-ресурсов. Они производят первичный отбор и сортировку информации в своих служебных базах. Затем, после специальной фильтрации, накопленная ими информация поступает общую индексную базу поисковой системы и становится доступной пользователям.
Регулярно обходя все ресурсы, роботы пополняют и обновляют индексную базу поисковой системы, что позволяет иметь в ней актуальную и почти полную информацию об информационных ресурсах Интернет.
Существует два основных типа роботов: “официальные”, открытые роботы, которые не скрывают своей разведывательной работы и действуют согласно правилам, установленным в сети (выполняют рекомендации хозяев ресурсов, отраженных, например, в специальном управляющем файле robots.txt, определяющем какие части ресурса можно помещать в поисковую базу, а какие нет). Другой класс роботов работает скрытно, не подчиняясь никаким правилам поведения, и осуществляет сбор информации для различных спецслужб.
Кроме роботов, информационной разведкой занимаются и интерфейсные программы поискового сервера, которые собирают данные о пользовательских запросах, самих пользователях и их компьютерах.
Ведущей поисковой системой мира является американская система Google, основа которой была создана российским эмигрантом Сергеем Брином.
Эта система является фактическим монополистом в сфере поисковых систем, так как имеет наибольшую базу данных (превышающую суммарный объем БД всех остальных поисковиков) и популярность более 80% всего объема обращения к поисковым системам, среди которых половина (42-46% запросов по миру) приходится на американский гипер-сервер Google.com (см. рис. 1), а остальные – на локализованные гипер-серверы этой системы.
Для ясности укажем, что гипер-сервер системы Google состоит из более, чем 300 тысяч мэйнфреймов - серверных компьютеров высокой производительности, соединенных между собой сверхскоростными каналами связи. Эта система представляет собой распределенную, мультикопьютерную, скоростную и сверхживучую систему управления банком данных Google нового поколения, называемую BigTable, специально разработанную в недрах этой корпорации для глобального охвата Интернет. Система работает на более чем 100 языках мира, обрабатывает не только текстовую, но и графическую, мультимедийную информацию.
Доля локализованного на Россию гипер-сервера Google.ru показана на рис.2.
Локализация этого сервера означает не расположение его в России (он расположен в Калифорнии), не локализация по языку (русскоязычный интерфейс имеют все серверы Google), а направленность на территорию России, то есть настроенность на выдачу поисковой информации для российских клиентов и специализированный сбор информации о них для служб Google и заказчиков из США. Количество запросов практически соответствует примерно половине доли населения России в мире, то есть порядка 2%
Есть локализация для Казахстана – Google.kz, см. рис.3.
Из диаграммы видно, что примерно половина казахстанцев, составляющих 0,2% от населения мира, пользуются системой Google.kz. Причем, чаще всего “принудительно”, так как при обращении к другому серверу, типа Google.com или Google.ru и определении принадлежности IP пользователя, как принадлежащего Казахстану, происходит автоматический редирект (переключение) на Google.kz
Поисковая система Яндекс является частной фирмой со смешанным голландско-российским капиталом, что делает ее политику независимой от российских властей, а значит он является силой косвенного оппозиционного управления страной.
Эта поисковая система почти монополист на территории России за счет распространения русифицированных браузеров со встроенным приоритетом поиска через Яндекс.
Доля Яндекса в мировом трафике составляет порядка 2%, то есть, пропорциональна доле русскоязычного населения в мире.
У Яндекса есть подсистема, ориентированная на Казахстан – Yandex.kz. Ее трафик составляет значительную долю казахстанского рынка Интернет опять же за счет продажи браузеров со встроенной настройкой на Яндекс.
Доля Yandex.kz составляет примерно 30 - 40% казахстанского рынка и постоянно растет.
Yahoo. Данная система появилась в Сети одной из первых, и сегодня Yahoo сотрудничает со многими производителями средств информационного поиска, а на различных ее серверах используется различное программное обеспечение. Язык Yahoo достаточно прост: все слова следует вводить через пробел, они соединяются связкой AND либо OR. При выдаче не указывается степень соответствия документа запросу, а только подчеркиваются слова из запроса, которые встретились в документе. При этом не производится нормализация лексики и не проводится анализ на "общие" слова. Хорошие результаты поиска получаются только тогда, когда пользователь знает, что в базе данных Yahoo информация есть наверняка. Ранжирование производится по числу терминов запроса в документе. Yahoo относится к классу простых традиционных систем с ограниченными возможностями поиска.
Доля Yahoo падает с каждым годом в связи с активным продвижением Google.
Baidu
Baidu - лидер среди китайских поисковых систем. По количеству обрабатываемых запросов поисковый сайт “Байду” стоит на 3 месте в мире (3 млрд 428 млн; с долей в глобальном поиске ~8 %). С запуском японской версии уверенно обогнал Microsoft. Baidu также имеет онлайн-энциклопедию — Энциклопедию Байду, которая обогнала Китайскую Википедию.
В индексе Байду содержится свыше 740 млн веб-страниц, 80 млн изображений и 10 млн медиафайлов. 20 апреля 2006 года ведущий китайский поисковик baidu.com заявил о запуске альтернативного проекта — “Байдупедии”. Уже через три недели она обогнала китайскую Википедию по числу статей. В настоящее время Байдупедия содержит более 3 500 000 статей (в английской википедии - 3.7 млн), это почти в десять раз больше, чем в китайской. Правки, вносимые в Байдупедию, становятся видны не сразу, а проходят через модераторов и, предположительно, цензоров. Поисковик Байду ориентирован только на потребности китайского пользователя. Сегодня он имеет только китайский интерфейс и работа поисковой системы с кириллицей может быть оценена как неудовлетворительная. Таким образом, пока, в отличие от агрессивных действий Google и Yandex китайская поисковая система не пытается захватить казахстанский и российский секторы Интернета.
Lycos.
Как и большинство поисковых систем, Lycos дает возможность применять простой запрос и более изощренный метод поиска. В простом запросе в качестве поискового критерия вводится предложение на естественном языке, после чего Lycos производит нормализацию запроса, удаляя из него так называемые stop-слова, и только после этого приступает к его выполнению. Почти сразу выдается информация о количестве документов на каждое слово, а позже и список ссылок на формально релевантные документы. В списке против каждого документа указывается его мера близости запросу, количество слов из запроса, попавших в документ, и оценочная мера близости, которая может быть больше или меньше формально вычисленной. Пока нельзя вводить логические операторы в строке вместе с терминами, но использовать логику через систему меню Lycos позволяет. Такая возможность применяется для построения расширенной формы запроса, предназначенной для искушенных пользователей, уже научившихся работать с этим механизмом. Таким образом, видно, что Lycos относится к системе с языком запросов типа "Like this", но намечается его расширение и на другие способы организации поисковых предписаний.
AltaVista была одной из ведущих поисковых систем мира в конце 1990-х, но сейчас ее доля падает, так как она вытесняется всё той же Google.
Наиболее интересная возможность AltaVista - это расширенный поиск. Здесь стоит сразу оговориться, что, в отличие от многих других систем AltaVista поддерживает одноместный оператор NOT. Кроме этого, имеется еще и оператор NEAR, который реализует возможность контекстного поиска, когда термины должны располагаться рядом в тексте документа. AltaVista разрешает поиск по ключевым фразам, при этом она имеет довольно большой фразеологический словарь. Кроме всего прочего, при поиске в AltaVista можно задать имя поля, где должно встретиться слово: гипертекстовая ссылка, applet, название образа, заголовок и ряд других полей. К сожалению, подробно процедура ранжирования в документации по системе не описана, но видно, что ранжирование применяется как при простом поиске, так и при расширенном запросе. Реально эту систему можно отнести к системе с расширенным булевым поиском.
WAIS. WAIS является одной из наиболее изощренных поисковых систем Internet. В ней не реализованы лишь поиск по нечетким множествам и вероятностный поиск. В отличие от многих поисковых машин, система позволяет строить не только вложенные булевы запросы, считать формальную релевантность по различным мерам близости, взвешивать термины запроса и документа, но и осуществлять коррекцию запроса по релевантности. Система также позволяет использовать усечения терминов, разбиение документов на поля и ведение распределенных индексов. Не случайно именно эта система была выбрана в качестве основной поисковой машины для реализации энциклопедии "Британика" на Internet.
Современные поисковые системы собирают не только текстовую информацию, которая может быть подвергнута ими прямой индексации для осуществления последующего поиска по ключевым словам, но и информацию о различных мультимедийных данных путем анализа контекста, в котором встречаются эти данные.
Кроме того, поисковые системы собирают информацию технического характера, как о сайтах, так и о пользовательских компьютерах, с которых происходит обращение за выдачей поисковой информации, так и вообще, информацию о любом компьютере, подключенном к сети Интернет.
Естественно, что приватная информация с сайтов и с пользовательских компьютеров не выдается в поисковых запросах, а предназначается для технических нужд самой поисковой системы и для обеспечения ею спецслужб.
Правда, бывают “проколы”, когда в поисковой выдаче вдруг появляются файлы закрытых паролем или иными средствами защиты информации каталогов.
Уже не раз поисковые системы были “пойманы за руку”.
Google - компания, о которой в первую очередь вспоминают, когда речь заходит о проблемах с приватностью. Первые вопросы к этике Google возникли еще в начале 2000-х, когда компания объявила о введении "контекстной рекламы". Поисковик Google научился понимать, что именно ищет пользователь, и показывать рядом с результатами поиска рекламные объявления, по смыслу этому поиску соответствующие.
Затем эта система перекочевала в почтовый сервис Gmail. Пользователи увидели контекстную рекламу рядом со своими письмами. Логично было предположить, что Google читает их переписку.
Летом 2010 года американская газета The Wall Street Journal опубликовала статью, в которой подвела итоги десятилетнего проникновения Google в частную жизнь людей. 75% пользователей интернета (около 1 млрд человек) - у Google как на ладони со своими предпочтениями, личной перепиской, историей поиска, контактами, подытожили журналисты издания.
Теперь у компании появился еще один инструмент слежения - смартфоны на платформе Android.
Смартфоны на платформе Android, разработанной Google, следят за своими владельцами с использованием той же технологии. Google заявляет, что данные анонимны. Однако эксперты уверены — это не так. Google хранит в смартфоне данные о местоположении только за последние 48 часов, но в своих базах – более полугода.
Эрик Шмидт, в то время возглавлявший Google, сделал такое смелое и красноречивое заявление по поводу конфиденциальности данных. Отвечая на вопрос журналистов о том, насколько этичен сбор информации о пользователях, осуществляемый Google, Шмидт сказал: "Если вы сделали нечто, о чем хотели бы умолчать, то, может быть, не стоило этого делать вообще".
Google активно практикует сбор личной информации о пользователях интернета. Официальная версия - это необходимо для того, чтобы показывать человеку таргетированную рекламу (связанную с кругом его интересов).
Какие данные собирает Google:
По всем пользователям, у которых есть учетная запись в Google, сервис собирает информацию об их друзьях в разных социальных сетях и сервисах (например, Facebook, Twitter, YouTube, FriendFeed) и о друзьях этих друзей. Потом эту информацию Google может использовать для показа результатов поиска.
Например, если пользователь, зарегистрированный в Google, задает в строке поиска некий запрос, то среди результатов поиска будут записи из журнала кого-то из его друзей, если в этих записях упоминаются слова из запроса. При этом те люди, сообщения которых оказываются среди результатов поиска, могут вовсе не иметь учетной записи в самой Google и не знать о том, что их информация используется таким образом. Узнать, связана ли учетная запись в Google со страницами в других социальных сетях, можно в настройках своего аккаунта в Google
Система Social Circle, созданная Google разработана для того, чтобы собирать частные данные и составлять подробные личные досье на миллионы пользователей, что является прямым и вопиющим нарушением соглашения с Федеральной комиссией США по торговле.
Крупные ИТ-компании нарушают приватность пользователей, используя их данные не по назначению.
Сервис Google Street View интернет-компании Google нарушил закон Канады, говорится в заявлении комиссара страны по охране неприкосновенности частной жизни. Член правительства Канады Дженнифер Штоддарт (Jennifer Stoddart) заявила, что сервис получал информацию личного характера с помощью специальных автомобилей, сканируя данные, передаваемые на территории страны через небезопасное Wi-Fi-соединение. В частности, сервис ("по неосторожности", как заявляет Google) получил доступ к базе данных с электронными адресами, паролями и именами тысяч людей, страдающих определенными заболеваниями.
Ранее постановление о нарушении сервисом закона Австралии вынес министр страны по коммуникациям Стефен Конрой (Stephen Conroy), назвав действия Google "наиболее серьезным нарушением в истории охраны неприкосновенности частной жизни".
Германский министр по защите прав потребителей Ильза Айгнер (Ilse Aigner) накануне открытия в Германии международной выставки электроники CeBit призвала граждан остерегаться крупных IT-корпораций: Google, Apple и Microsoft, а также социальных сетей таких, как например, Facebook.
В интервью изданию Suddeutsche Zeitung министр заявила, что некоторые IT-компании располагают огромными базами данных частных пользователей, и никто точно не знает, каким образом эти данные используются.
"Такие крупные игроки IT-рынка, как Facebook, Apple, Google или Microsoft могут без труда создать исчерпывающий персональный портрет отдельного пользователя. Они знают, чем мы интересуемся, что покупаем, куда ездим отдыхать, с кем мы дружим", - отметила Айгнер.
Некоторые пользователи, по словам министра, могут представлять особый интерес для представителей бизнеса, другие напротив, рискуют быть занесенными в черные списки и испытывать затруднения при устройстве на работу или в других областях.
Разгорелся другой скандал, фигурантами которого стали Apple и Google. И снова связанный с пользовательскими данными.
Вначале Apple обвинили в сохранении информации о месте нахождения пользователя, позже стало известно, что Android передает такую информацию каждый час в Google.
Политическая роль поисковых систем возрастает с каждым годом. Эти системы, (не такие, как потешная мета-система kaz.kz, являющаяся своеобразной “Потемкинской деревней”) позволяют:
Сотрудничество поисковых систем с разведслужбами не вызывает сомнения. Действия роботов говорят сами за себя.
Гистограмма рис.9 показывает доли активности различных роботов, посещающих ресурсы Интернет.
Как уже пояснялось выше, не контролируемые государством иностранные поисковые системы несут собой опасность с четырех основных сторон:
Первая прореха с одной стороны возникает постоянно в связи с неаккуратностью и отсутствием профессионализма пользователей, когда приватная информация помещается ими в файловые системы, прямо или косвенно соединенные в Интернет, а с другой стороны потому, что используется программное обеспечение, не обеспечивающее защиту информации. К примеру, продукты фирм Microsoft, Google, Apple в которых не предусмотрена защита информации от спецслужб США или программное обеспечение, не сертифицированное отечественными специалистами на предмет защищенности.
Вторая прореха также связана с использованием иностранного программного обеспечения, а главное – в связи с самим фактом использования иностранной поисковой системы, когда, добровольно входя в контакт с нею, пользователь волей – неволей дает возможность интерфейсному ПО поисковой системы обследовать свой компьютер и накапливать информацию о пользователе в своих открытых и закрытых базах данных.
Третья прореха определяется самой сутью, интересами бизнеса поисковых систем. Последние не есть альтруистические, благотворительные организации, они живут за счет средств, поступающих от различных организаций, заинтересованных в целевом формировании общественного мнения: рекламных агентств, торговых и производственных фирм, политических сил и спецслужб.
Как уже говорилось, это достигается путем манипулирования информацией:
Четвертая прореха определяется самой криминальной сутью глобальной политики, когда “у государств нет друзей, но есть только интересы”, и “последним аргументом в ней является война”, то есть массовое убийство людей.
Страны, наивно и беспечно пользующиеся чужим программным обеспечением, а также чужими поисковыми услугами становятся поначалу информационными колониями стран – производителей информационных технологий, а затем и их жертвами, если дело доходит до военного конфликта.
Ярким примером этого может служить запланированный выход из строя компьютерного парка Ирака в назначенный час атаки со стороны США. При этом даже нет необходимости прямого подключения компьютеров – жертв к сети Интернет, достаточно, чтобы прошло некоторое время, за которое произойдет обмен внешними носителями информации.
Главной стратегической задачей национальной поисковой системы является обеспечение национального суверенитета.
Если сказать, что мы живем в эпоху, когда национальный суверенитет определяется мощью отечественных информационных технологий, то это не будет полной правдой, так как мощь информационных технологий всегда, всю историю человечества определяла силу государства. Просто раньше это проявлялось в иных, более традиционных формах: религии, национальном духе, мощи финансовой системы, которая есть особого рода информационная управляющая система, мощью науки, промышленных и военных технологий.
Сегодня произошла лишь мобилизация всего этого и концентрация в информационно-коммуникационных технологиях.
Именно поэтому, что в деталях было изложено выше, разумное государство должно приложить достаточные усилия для организации собственной независимой информационной инфраструктуры, устойчивой к неконтролируемому и деструктивному влиянию извне. Это не противоречит идее глобализации нашего мира, так как глобализация не есть американизация или китаизация всего мира, но право на достойную независимую жизнь каждого народа с его неповторимой культурой и его право на безопасную жизнь, безопасное общение и гармоничную кооперацию с другими народами.
Национальная поисковая система должна обеспечивать:
Для выполнения поставленных задач национальная поисковая система должна обладать адекватными техническими, технологическими и научными ресурсами.
Сегодня, на примере системы Google грамотный специалист по информационным технологиям видит, какого масштаба техника и какие технологии необходимы:
К сожалению такого понимания нет ни в правительстве, ни в обществе. Всерьез принимаются такие потешные проекты, как мета-поисковая система kaz.kz, построенная на писишке и дающая качество "ниже плинтуса".
Национальная поисковая система в наше время – это необходимое звено в системе национальной независимости и безопасности, устойчивого общественного и нормального промышленно-технологического развития страны.
Без такой системы, успешно конкурирующей с иностранными поисковыми системами и главенствующей благодаря своим технологическим достоинствам на отечественном информационном рынке невозможно говорить о независимости страны и ее безопасном существовании.
В противном случае она обречена быть информационной колонией иных стран и информационных корпораций, а значит, ее достояние рано или поздно станет достоянием иных.
Отечественные специалисты по информационным технологиям должны приложить свои личные и совместные усилия для доведения до народа и правительства важности этой проблемы, иначе общественное мнение будут формировать закулисные силы, в чьих интересах отсутствие национальной независимости, путем рекрутирования безголовых кликуш и нечистоплотных персон, коих легко выудить и поднять на PR-гребень для поворота общественного мнения в нужную сторону.
Для любого разумного человека понятно, что изложенное выше применимо не только к Казахстану или России, но и любой мирной стране без каких-либо изъятий.
К.А. Хайдаров,
28 ноября 2011 г.