О сервисе

Ниже мы разместили ответы на наиболее часто задаваемые вопросы о сервисе и о том, как его использовать для своего бизнеса. Наш сервис помогает компаниям найти новых бизнес-партнеров, для этих целей мы анализируем контактную информацию только юридических лиц (компаний), которые продвигают услуги на своих сайтах в сети Интернет.

Часто задаваемые вопросы

Для чего нужен?

Это сервис, который позволяет вам быстро искать среди 250 млн. сайтов в сети Интернет нужные вам и автоматически собирать с них контактную и иную информацию. Наша основная задача — сделать удобный механизм для поиска клиентов вашему бизнесу по всему миру.

Например, вы можете найти все медицинские клиники, выгрузить их контактные данные в формате Excel и дальше работать с ними в вашей CRM — системе. Также вы можете искать сайты, которые работают на определенных технологиях. Например, можно сделать подборку сайтов всех стоматологических клиник, которые работают на базе WordPress.

Как пользоваться?

Работать с нашим сервисом очень просто. Наберите в поисковой строке запрос, например «Интернет магазин», укажите где искать (в заголовке сайтов, описании и т.п.) и система быстро найдет подходящие сайты под ваш запрос.

Как правило все компании, имеющие сайты, пишут вид своей деятельности в заголовках (на англ. языке title), поэтому итоговая выдача будет очень релевантной. Можно делать сложные, составные, запросы, которые будут уточнять результат.

Какие данные собираете?

Мы автоматически (и постоянно) ищем контактную информацию, включая: электронную почту, телефоны, ИНН, ОГРН и т.п. на всех значимых страницах сайтов. Всю собранную информацию мы проверяем (например, проверяем корпоративные адреса почт, считаем контрольные суммы ИНН и т.п.) и дальше обогащаем из разных источников.

Например, зная ИНН мы можем собрать расширенную информацию о компании, которая владеет сайтом: генерального директора, учредителей, выручку и т.п. Обратите внимание, что в соответствии с действующим законодательством РФ, номер телефона не является персональной информацией без указания на иные идентификационные данные его владельца. Наш сервис собирает контактную информацию только юридических лиц (организаций или ИП), размещенную в свободном доступе в сети Интернет.

Электронная почта также является объектом персональных данных только в совокупности с иными персональными данными, позволяющими установить личность, которой принадлежит данная электронная почта. Мы ищем электронную почту только в контактных разделах сайтов, а потому почта не является объектом персональных данных.

Данные актуальны?

Да, наши роботы работают 24/7, постоянно актуализируя информацию. Разумеется, никто не застрахован от ошибок, но мы постоянно улучшаем алгоритмы, чтобы максимально убрать «мусор» из результатов поиска.

Деятельность законна?

Да. Мы не взламываем сайты, не подбираем пароли и т.п. Наши роботы действуют в полной аналогии с системами Яндекс или Google — собирая и анализируя общедоступную информацию, которая публикуется на сайтах компаний. Если вы считаете, что собранная информация должна быть удалена, пожалуйста, воспользуйтесь формой обратной связи на странице Контакты.

Источники данных

В работе нашего сервиса мы используем только открытые данные с различных источников (сайтов) в сети Интернет.

Что такое открытые данные? Это информация, которую владельцы сайтов (и других ресурсов) сами опубликовали в открытом доступе всем желающим и разрешили поисковым роботам (например, Google) сбор, хранение и обработку этой информации.

Наш сервис в автоматическом режиме собирает информацию из различных открытых источников и структурирует ее для удобной выгрузки в формате Excel. Технически, наш сервис ничем не отличается от популярных поисковых систем, таких как Google или Яндекс, но позволяет выгрузить результаты поиска в формате Excel.

Персональные данные

Мы не ищем и не обрабатываем персональные данные людей. Стоит признать, что наши роботы могут их собрать, если владельцы сайтов сознательно указали свои персональные данные в качестве контактных на соответствующих страницах своего сайта. Мы не взламываем сайты, не подбираем пароли.

Если вы опубликовали свои персональные данные и открыли ваш сайт к индексации, то поисковые системы, такие как Google/Яндекс, тоже добавят ваши персональные данные в индекс. Если вы нашли свои персональные данные и не согласны с их наличием, то пожалуйста, укажите что ваш сайт нужно удалить из нашего поискового индекса.

Не взламываем сайты

Мы не хакеры. Мы не взламываем сайты, не подбираем пароли, не ищем уязвимости, не создаем DDOS-атаки, не мешаем работе сайтов и т.п. Все что мы делаем — структурируем общедоступную (публичную) информацию с возможностью выгрузить ее в формате Microsoft Excel для удобной работы.

Если сайт в Интернете открыт к индексации для поисковых систем, то только в этом случае наши роботы соберут на нем общедоступную информацию.

Как данные попали к вам?

Наш сервис ищет открытые данные по всем доменам в России, СНГ и мире и публикует агрегированную общедоступную информацию. Если ваш сайт разрешен к индексации поисковым роботом и вы опубликовали в открытом доступе контактные данные, то наши роботы автоматически эти данные соберут, структурируют и аккуратно отобразят на нашем сайте для удобства потенциальных клиентов.

Как мне поможет сервис?

Мы обобщаем всю полезную найденную информацию о вашем сайте (компании) на одной странице и упрощаем вашим потенциальным клиентам взаимодействие с вами. Ваш сайт также может выводиться в списке «похожие» когда пользователь просматривает информацию о другом сайте. Это позволяет найти новых клиентов для ваших товаров или услуг.

Как изменить данные о сайте?

Наши парсеры регулярно собирают все открытые данные с вашего сайта автоматически. Поэтому если вы поменяете их на своем сайте, то через некоторое время данные изменятся и у нас.

Как удалить информацию?

Это очень просто сделать. Вам нужно добавить следующие две строки текста в ваш файл robots.txt:

User-agent: tapki.com

Disallow: /

Файл robots.txt вашего (да и вообще любого) сайта можно посмотреть в браузере по ссылке www.site.ru/robots.txt. Он не является обязательным элементом сайта, но его наличие желательно, потому что с его помощью владельцы сайта управляют поисковыми роботами.

Файл robots.txt сообщает поисковым роботам Яндекс/Google и т.п., какие страницы на вашем сайте можно обрабатывать. Используйте его, чтобы ограничить количество запросов, которые получает ваш сайт, и тем самым снизить нагрузку на него.

После добавления указанных выше строк в файл robots.txt наши роботы автоматически их обнаружат при следующем обновлении информации и информация о вашем сайте будет недоступна. Обычно это происходит в течении десяти дней.

Основание публикации?

Создавая сайт и открывая его к индексации поисковым системам (Яндекс, Google, Bing и т.п.) вы делаете свой ресурс общедоступным. Мы не нарушаем закон, не взламываем сайты, не подбираем пароли, не мешаем работе сайта и т.п. Наши роботы очень деликатно собирают открытую информацию, структурируют ее и выводят в удобном пользователю виде. Иными словами, после создания сайта, если вы не указали явно обратное, он разрешен к индексации по умолчанию.

Зачем нужен поиск по HTML?

С помощью поиска по HTML- коду у вас появляется возможность искать сайты, на которых работают определенные сервисы. Например, вы можете найти все сайты, где установлен код интересующего вас онлайн-чата. Или создать подборку сайтов, созданных с помощью определенной CMS- системы. Более того, вы можете комбинировать поисковые запросы и находить все стоматологические клиники, где работает нужная вам система аналитики.

Сервис мешает работе сайтов?

Нет. Наши поисковые роботы не создают никакой «паразитной» нагрузки, т.к. мы анализируем буквально 3-4 страницы на вашем сайте и делаем это не чаще одного раза в месяц! Поверьте, вы просто этого не заметите!

Сколько сайтов в базе?

На данный момент мы анализируем порядка 250 млн. доменных имен во всех популярных доменных зонах. Ежедневно это количество увеличивается ориентировочно на 100 000 доменов.

Неприемлемый контент

Мы не индексируем запрещённые сайты, но если вы обнаружили сайт, который содержит недопустимое содержимое, пожалуйста, напишите нам через форму обратной связи и мы немедленно удалим его из базы.