ТЕЛЕКОММУНИКАЦИИ

А.И. Сенокосов

Бороться и искать, найти!

Продолжение. См. № 3, 4/2006

Часть 3. Поиск картинок

В первых двух частях статьи мы выяснили, что для поиска информации в Интернете имеются специализированные поисковые серверы, которые либо поддерживают каталоги ресурсов, сортируя (вручную) их по тематике, либо работают с постоянно обновляемой базой данных по словам и словосочетаниям, к которой, собственно, и обращается пользователь, формулируя свой запрос в строке поиска.

Как мы помним, ведутся такие базы с помощью автоматических программ — “пауков”, анализирующих HTML-код страниц. Страшно даже подумать, что будет при массовом переходе к высокоскоростному Интернету и, как следствие, увеличению чисто Flash-сайтов! Впрочем, чисто текстовый поиск не очень-то эффективен и при поиске других объектов традиционного Интернета. Скажем, картинок.

Такая задача частенько возникает и при создании сайтов, и при оформлении рефератов, и при подготовке школьных газет… Разумеется, при поиске и дальнейшем использовании изображений мы наверняка столкнемся с таким понятием, как авторское право, но в Интернете хватает и совершенно бесплатных ресурсов, так что этот вопрос мы временно оставим в стороне. В любом случае перед тем, как решать вопрос с авторским правом на изображение, его надо сначала найти. Этим мы и займемся.

Для поиска картинок можно вполне попробовать воспользоваться каталогом — зайти в раздел по нужной тематике и бродить по его ссылкам в надежде встретить нужное изображение. Удача может улыбнуться сразу, если на первых же просмотренных страницах отыщется искомое. Но можно потратить целый день и не найти ничего путного.

К чему такой бестолковый серфинг? Ведь существуют специальные поисковые серверы для изображений. Они отбирают изображения по названию файла, по тому тексту, который прописан у них в свойстве alt, и по другим параметрам. При этом реализуется все же старый принцип поиска по HTML-тексту web-страницы.

Например, один из таких поисковиков, работающих с “альтами”, расположен по адресу www.picsearch.com. Это удобный в использовании сервис с простым интерфейсом, практически без рекламы, с возможностью фильтрации результатов запроса по различным параметрам, быстро работающий. Единственный существенный недостаток Picsearch — его англоязычность.

Вот как представляется сама компания:

“Picsearch — это компания, которая предоставляет вам механизм, во много раз ускоряющий поиск изображений в Интернете. Кроме того, она предлагает и специализированное программное обеспечение, позволяющее запустить вашего личного “паука”, выискивающего необходимую вам картинку или фотографию.

Picsearch представляет своим пользователям путеводитель по необъятным визуальным ресурсам Интернета. Компания использует свою собственную технологию “краулинга” сайтов Интернета и создания базы данных по изображениям. Когда пользователь посылает свой запрос, он получает “иконки” — маленькие картинки изображений, отсортированных по релевантности, насколько это возможно. После щелчка по этой иконке пользователь переходит на соответствующий сайт, содержащий изображение.

Технология Picsearch отличается тремя уникальными возможностями: она обеспечивает непревзойденную релевантность поиска, использует технологию, делающую процесс поиска безопасным для детей (видимо, имеется в виду отсечение картинок сомнительного содержания), и оснащена дружественным интерфейсом, помогающим чрезвычайно просто организовать быстрый и аккуратный поиск”.

Процесс поиска в Picsearch действительно очень прост: вводится поисковая фраза, и задается количество рисунков, выводимых на одной странице. Вместе с пропорционально уменьшенными изображениями выводится информация о конкретном графическом файле.

Как уже говорилось, выводится изображение малого размера на странице результата запроса, что позволяет пользователю найти наиболее подходящее изображение, затратив минимальное количество времени. Если пользователь заинтересовался конкретным изображением, он может его увеличить или перейти на страницу, где расположен оригинал изображения. Обычно предоставляется возможность найти и похожие файлы.

Попробуем, например, с помощью этого уникального движка найти иллюстрацию к реферату по истории на тему “Гладиаторы”. Естественно, вначале переводим это слово на английский язык, а затем вводим в поисковую строку. Результат приведен на рис. 1.

Рис.1  Первая страница результатов
    поиска по слову “Gladiator”

Рис.1  Первая страница результатов поиска по слову “Gladiator”

Можно сказать, нам не очень повезло, что именно так называется знаменитый голливудский блокбастер, кадрами из которого буквально кишит и эта, и последующие страницы. Тем не менее уже и на первой странице есть то, что нам надо (скажем, первая в третьем ряду картинка). Правда, поисковик сообщает, что у нее не очень большие размеры (вернее, для печати на бумаге — просто маленькие) — 200 ґ 238 пикселей, 8 Кб, но, проследовав по ссылке, мы обнаруживаем аналогичный набор иконок, за которыми скрываются уже гораздо более качественные изображения. В итоге, потратив не более минуты, мы получили вот такое изображение (см. рис. 2).

Рис. 2. Найденное изображение гладиатора

Рис. 2. Найденное изображение гладиатора

К сожалению, другое подходящее изображение (второе в последнем ряду) — всего лишь картинка с сайта фирмы, торгующей чем-то типа маскарадных костюмов для детей и младших подростков.

Впрочем, аналогично поиску в Яндексе, мы получили десятки тысяч ссылок на сайты, где есть не только кадры из фильма, самолеты, животные и всяческие томаты, но и то, что нам требуется, — картинки гладиаторов. В данном конкретном примере мы вряд ли получили более 2–3% по-настоящему нужных ссылок, но и этого более чем достаточно.

Кстати, о Яндексе. В нем есть отдельный сервис, который называется “Яндекс.Картинки”. Служба автоматически собирает картинки в стандартных графических форматах (*.jpeg, *.gif и *.png), находящихся в Рунете. В результатах поиска показываются не только ссылки на изображения, но и уменьшенные копии оригиналов (что выгодно отличает новый поисковик от прежней системы “Яндекса” по поиску графических изображений).

Что же касается технологии поиска, то текстовым материалом для него служат:

  • подписи к картинкам и ссылки на них;
  • тексты коротких документов, обрамляющих одиночную картинку;
  • имена файлов и скриптов, в том числе с учетом транслитерации и упрощенного подстрочного перевода.

При поиске существует возможность задать желательный размер картинки. Картинки группируются по площади:

  • “Мелочь” — до 1000 квадратных пикселей;
  • “Маленькие” — от 1000 до 10 000 квадратных пикселей;
  • “Средние” — от 10 000 до 100 000 квадратных пикселей;
  • “Большие” — от 100 000 до 1 000 000 квадратных пикселей;
  • · “Огромные” — свыше 1 000 000 квадратных пикселей.

Из базы “Яндекс.Картинки” по возможности исключаются баннеры и копии (одинаковые изображения). В результатах поиска выдается не более одной картинки от одного сайта, остальные доступны по ссылке “еще с сайта”. Также по ссылке доступна расширенная информация о картинке.

Опыт работы с этой службой показал, что ей вполне успешно можно пользоваться, и во многих случаях результат поиска превосходит то, что можно получить на других серверах. Так, именно здесь удалось найти “огромное” изображение пингвина, ставшее весьма актуальным в связи с рекордно продолжительными холодами (см. рис. 3). Правда, в отличие от Picsearch, служба не защищена от фото сомнительного содержания. Скажем, изрядная часть других, не таких огромных картинок, найденных по слову “пингвин”, мягко говоря, никакого отношения к этим грациозным птичкам не имела.

Рис.3. “Огромное” (1024 х 1024) изображение
    пингвинов

Рис.3. “Огромное” (1024 х 1024) изображение пингвинов

Кстати, Яндекс постоянно напоминает об авторских правах на картинку, но найденная нами — это бесплатные рекламные обои.

Не остались в стороне от поиска картинок и другие крупные поисковики.

Google Search Images — производит поиск по всем индексированным сайтам. Возможно, это самая большая база в мире. Распознает нужную картинку не только по названию, но также обращает внимание на содержание всего сайта.

У Google имеется больше возможностей настройки параметров поиска, чем у Яндекса. Несмотря на то что локализация обошлась компании в копеечку и, возможно, способствовала недавнему падению акций, можно только порадоваться, что интерфейс может быть на любом языке. То же можно сказать и о поиске. Отдельно настраивается и поиск картинок. О его возможностях вполне исчерпывающе говорит рис. 4.

Рис. 4. Окно настройки поисковика картинок Google

Рис. 4. Окно настройки поисковика картинок Google

“Огромных” картинок пингвина поисковик нашел гораздо больше, чем Яндекс, но все-таки именно картинка Яндекса удостоилась чести быть распечатанной и повешенной на дверях некоторых кабинетов нашей школы. Впрочем, дело еще и в том, что, как видно на рис. 5, большинство найденных картинок имели весьма далекое отношение к искомым птицам.

Что же касается специфического содержания, то поисковик Google, в отличие от Яндекса, совсем уж скабрезных картинок не выдавал, хотя все же он явно не имеет хваленого механизма защиты семейных ценностей, которым гордится Picsearch.

Рис. 5

Рис. 5

Впрочем, Picsearch отнюдь не одинок в ряду специализированных поисковиков картинок. И описали мы его в первую очередь именно в силу его “семейной безопасности”. Рассмотрим еще несколько аналогичных сайтов.

AlltheWeb (http://www.alltheweb.com) — также ищет графику среди индексированных им сайтов, но результаты поиска не похожи ни на Яндекс, ни на Google. В нашем пингвиньем поиске он выдавал гораздо больший процент морозоустойчивых птичек, но отловить среди них картинки с большим разрешением довольно затруднительно: в настраиваемых опциях поисковика такой возможности нет. Зато есть другая: фильтр, отсеивающий непристойные картинки. По умолчанию он включен и, похоже, работает неплохо. К сожалению, пытливые школьники скорее всего довольно быстро разберутся, что к чему, и без труда его отключат. Впрочем, школьники такого типа найдут соответствующие картинки и без всяких поисковиков.

Ditto visual search engine (www.ditto.com) — довольно неплохой поисковик изображений, но база поиска значительно меньше, чем у вышеупомянутых. Правда, оно и понятно. Компания заявляет, что проводит верификацию базы данных изображений, полученной с помощью краулинга. Возможно, это делается даже вручную. Во всяком случае, результат поиска по слову “penguin” буквально ошеломил: практически все картинки были именно картинками этих гордых красавцев (см. рис. 6). Исключение на первой странице составил лишь одноименный маяк в Австралии. Аналогичная картина наблюдалась и на следующих страницах. Интересно, что часть изображений берется из поисковика Picsearch, о чем и сообщается на первой странице.

Рис. 6

Рис. 6

Если вам надоело вручную обходить поисковые серверы Интернета, ориентированные на поиск графики, то этот увлекательный процесс можно автоматизировать.

Использование различных плагинов к браузерам не автоматизирует процесс поиска картинок в Интернете, но все же здорово его облегчает. Например, замечательная бесплатная программа etcetera (www.pkpsoft.com) — плагин к Internet Explorer — позволяет делать поисковые запросы к различным поисковым системам и каталогам прямо из этого браузера. Она создает дополнительную панель со строкой для быстрого поиска на популярных сайтах (Google, Yahoo и т.д.). Легко в полуавтоматическом режиме можно добавлять любые свои поисковики (от Яндекса и Рамблера до Picsearch) и настраивать уже существующие. Умеет блокировать всплывающие окна. Жаль только, что она перегружена рекламными добавками, что и следовало ожидать от абсолютно бесплатной программы.

Если точно известно имя файла с искомым изображением, для его автоматического поиска и закачки на диск можно с успехом воспользоваться менеджером ReGet Deluxe (deluxe.reget.com). ReGet Deluxe — менеджер закачек для опытных пользователей, содержит широкий спектр возможностей для управления закачками: многофункциональный планировщик, история закачек с возможностью поиска, менеджер сайтов для сохранения настроек для скачивания с конкретного сайта. Благодаря уникальной системе интеграции с браузерами корректно обрабатывает любые ссылки (в том числе формы и скрипты-редиректоры), может менять трафик в зависимости от активности браузера. Поддерживает все популярные браузеры. Более того, эта программа поддерживает поиск файлов по маске. Например, хочется найти картинки с изображениями злобных вирусов — вводим в поле запроса имя файла в виде: virus*.jpg — ReGet будет искать все файлы формата jpg, содержащие в имени “virus”, и складывать их на диск в указанную в настройках программы папку. Осторожно: если в поле запроса просто ввести virus, программа будет скачивать из Интернета все подряд, независимо от формата.

Недостатком такого использования ReGet является то, что невозможно увидеть заранее, что именно программа нашла и собирается сохранять на диск. К тому же для поиска ReGet использует ограниченный набор поисковиков, причем не специализующихся на поиске изображений, — FileMirrors, Rambler, LapLink, FileSeach.ru, SunSite.

Гораздо лучше RegEdit с поиском изображений справляются программы, специально созданные для поиска картинок в Интернете. Одной из них является мета-поисковая система Meta Image Search (soft.mail.ru/program_page.php?grp=4672), которая ищет картинки в Сети очень быстро и, что самое главное, успешно. Результаты поиска выводятся в удобном виде и могут быть сохранены для дальнейшего использования. С этой программой экономится масса времени — не нужно заходить на каждый поисковый сервер, вводить ключевые слова, ожидать загрузки каждой страницы с результатами поиска, а потом еще и сохранять на диск изображения. Не нужно открывать и web-страницы, где находятся оригиналы картинок, — Meta Image Search найдет и загрузит их сама. Остается лишь просмотреть сохраненные на диск картинки и отобрать из них самые лучшие.

PixGrabber производит поиск картинок в Интернете с использованием одновременно нескольких поисковиков и закачивает их в архив. Закачка картинок с сайтов как с заданием фильтров, так и по маскам URL. В отличие от Meta Image Search эта программа позиционируется как бесплатная, хотя бесплатная версия существенно урезана функционально и постоянно надоедает пользователям требованиями дать денег, доводя клиента до нужной кондиции ничуть не хуже небезызвестного Паниковского.

Напоследок, отдавая должное людям, готовым и заплатить за нужное качественное изображение, сообщим, что есть и платные фотогалереи, на которых можно выбрать интересующую вас фотографию, просмотреть ее фрагмент в истинном разрешении, а затем приобрести. В качестве примера можно посетить www.photobox.ru.

Как видите, искать и скачивать картинки из Интернета можно довольно легко. Но, пожалуйста, не забывайте о том, что у каждой картинки есть законный владелец.

Продлжение следует

TopList